Google PageRank (PR) – теоретические основы

Первой компанией, которой был получен патент на систему, осуществляющую учёт внешних ссылок, была компания Google. Этот алгоритм был назван PageRank (PR). Далее будет дана некоторая информация о данном алгоритме и о его возможном влиянии на процесс ранжирования результатов поиска.

Расчёт индекса PageRank (PR) проводится для каждой Интернет страницы отдельно. Данный индекс для страницы определяется в зависимости от цитируемости других Интернет страниц, ссылающихся на текущую. Получается своеобразный замкнутый круг.

Основная задача заключается в необходимости определения такого критерия, который бы выражал важность Интернет страницы. Для расчёта индекса PageRank (PR) основным был выбран критерий теоретической посещаемости Интернет страницы.

Давайте разберём модель, отображающую перемещение по сайтам пользователей сети, когда переход осуществляется по ссылкам. Допустим, что пользователь начинает просмотр Интернет сайтов с определённой страницы. Далее по ссылкам, которые располагаются на данной странице, он осуществляет переход на другие Интернет страницы. При этом существует некоторая вероятность того, что посетитель решит покинуть сайт и начать просмотр Интернет сайтов с другой, случайно выбранной, страницы. Для алгоритма PageRank (PR) данная вероятность равна 0.15 для каждого шага. Получается, что вероятность продолжения пользователем путешествия по некой ссылке, выбранной из доступных на данной странице, составляет 0.85. Если продолжить эту цепочку до бесконечности то на популярных Интернет страницах пользователь будет бывать часто, а вот на страницах с низкой популярностью он будет бывать значительно реже.

Получается, что индекс PageRank (PR) для какой-либо Интернет страницы выражает вероятность того, что пользователь будет находиться именно на данной странице. Стоит отметить, что при этом сумма вероятностей нахождения пользователя в конкретный момент времени по всем Интернет страницам будет равна 1, потому что пользователь в обязательном порядке, по условию, должен находиться на какой-то странице.

В связи с тем, что с вероятностями работать не очень удобно, была выработана система относительно простых преобразований, при осуществлении которых индекс PageRank (PR) принимает конкретное числовое значение. Что-то наподобие этого пользователи видят и в Google ToolBar, где для каждой страницы отображается значение PageRank (PR) в диапазоне от 0 до 10.

Из описанной ранее модели выходит, что:

  • Любая страница сети Интернет, даже в том случае, если на неё не ведут никакие ссылки, обладает некоторым ненулевым значением индекса PageRank (PR), правда это значение очень маленькое.
  • Любая страница, на которой есть ссылки, ведущие на другие Интернет страницы, по этим ссылкам передаёт часть своего веса. Кроме того, чем больше ссылок ведёт со страницы на другие сайты, тем меньший вес передаётся по каждой из ссылок на другие Интернет страницы.
  • Кроме того, вес PageRank (PR) передаётся не полностью, ведь не стоит забывать о том, что на каждом шаге существует 15% вероятность того, что пользователь решит начать просмотр с новой Интернет страницы, выбранной случайно.

Ну а теперь давайте попробуем разобраться, как индекс PageRank (PR) может повлиять на процесс ранжирования результатов поиска. Здесь не случайно употребляется слово «может», ведь на сегодняшний день в чистом виде индекс PageRank (PR) в алгоритмах, используемых в Google, не участвует. С оказываемым PageRank (PR) влиянием всё предельно просто, как только поисковой системой будет отобрано некоторое множество документов, соответствующих запросу пользователя, они будут отсортированы в соответствии с их значениями PageRank. Тогда, основываясь на простом и логичном предположении, получаем, что документы с большим количеством и качеством внешних ссылок, будут содержать самую ценную для пользователя информацию.

Получается, что благодаря применению алгоритма PageRank документы, которые и без поиска были популярны и востребованы, как бы вытесняются в начало выводимого поисковиком на экран списка результатов поиска.

Остались ещё вопросы?

Заказ обратного звонка

Спасибо.
Мы уже получили ваше сообщение!
Адрес сайта Телефон E-mail
Перезвоните мне:
Заполняя форму, вы соглашаетесь с политикой конфиденциальности

Заказ техподдержки сайта

Спасибо.
Мы уже получили ваше сообщение!
Адрес сайта Телефон E-mail
Заказать техподдержку