Результативное продвижение сайта в интернете!

г. Москва, м. Сокольники, ул. Маленковская, д. 32, стр. 3

с 10:00 до 19:00, пн.- пт. (сб./вс. - выходной)

Как работает поиск? Что такое хорошее ранжирование?

Давайте разберемся, как же работает поисковая система.

Как работает поиск

Что такое поисковая система? Поисковая система – это очень большой механизм, который оперирует очень большими данными.

Например, в поисковой базе, которой обладаем мы, содержатся миллиарды документов.

Ежедневно к нам поступают миллиарды поисковых запросов. И при всех этих масштабах мы даем ответ своим пользователям в течение долей секунд.

Если сравнить с каким-то поиском, который работает на вашем компьютере в какой-то определенной программе, то вы зачастую там что-то ищите, а она еще долго думает, найдет файл, не найдет. Поиск же отвечает на запросы за доли секунды и при этом он учитывает множество факторов.

Основные понятия

Давайте с вами разберем основные понятия, с чего надо начинать, работая и думая о ранжировании сайтов:

  1. Индекс, поисковая база, апдейт
  2. Факторы (сигналы)
  3. Релевантность
  4. Ранжирование

Первое, с чем мы сталкиваемся – индекс и поисковая база.

Что такое индекс? Это набор файлов, содержащих некоторую информацию обо всех словах заданного набора документов, которые есть у нас в базе.

Что такое поисковая база?

Это то, по чему осуществляется поиск, это индекс всех документов, по которым осуществляется поиск.

Рассмотрим такое понятие, как апдейт.

Основные понятия

Многие, кто уже давно в отрасли, прекрасно понимают, что это такое. Но часто те, кто только начинает работать со своим сайтом, не знают, что это такое. Они читают на форумах «произошел апдейт». Им говорит, например, владельцам бизнеса, исполнитель: «Произошел апдейт или ждем апдейта, тогда у вас все будет хорошо». Так апдейт может относиться к разным частям поиска, и основная из них относится к обновлению поисковой базы.

Это тот момент, когда наш поисковый робот, накачав какое-то количество документов, рассчитав для него все необходимое: все необходимые факторы, характеристики, принимает решение о том, что можно их добавлять в поиск и пользователи в принципе могут по ним искать. Это и называется апдейтом. Обычно он где-то происходит раз в неделю.

Накачав эти миллиарды документов, мы считаем для них факторы.

Очень много внимания уделяется такому понятию, как «факторы», но оно сильно математическое. Здесь лучше всего использовать слово «сигналы», потому что для нас это сигналы о том, какого качества этот сайт, о том, что с этим сайтом делают и как с ним работают, как он вообще живет. Формальное описание здесь есть – это некоторая характеристика страницы, которую мы скачали или характеристика поискового запроса.

Имея факторы и документы, мы рассчитываем для них релевантность.

Это то значение, которое позволяет нам в дальнейшем ранжировать документы и упорядочивать их в том порядке, который вы видите, когда задаете запрос в поисковую систему. Этот процесс и называется ранжированием.

Здесь очень важно, что мы с вами дошли до такого понятия, как ранжирование и очень многие это путают с процессом индексирования. Они говорят: «Вот мой сайт плохо ранжируется». На самом деле проблема заключается не в ранжировании, у него проблема в индексировании. Этого сайта даже в поиске нет еще. Поэтому нужно разобраться с проблемой индексирования, а потом уже думать о том, чтобы улучшить его ранжирование. Это всегда нужно держать в голове – здесь индексирование, а здесь ранжирование. Если здесь все хорошо, можно думать о следующем шаге, потому что без этого это бесполезно.

Ранжирование

Как же устроено ранжирование и что оно использует?

Ранжирование сайта

Помимо факторов, которые используются в ранжировании, используются еще оценки асессоров. Есть такое популярное заблуждение, что в Интернете вы могли читать на форумах или где-то слышать на конференциях, что если мой сайт плохо оценил асессор, то он плохо ранжируется. Это полный миф, такого не существует.

Да, у нас асессоры работают и работают они над контрольными выборками. К ним поступает какой-то пул запросов с результатами поиска, они оценивают каждый сайт в этом пуле запросов. После этого эти оценки асессоров по определенным сайтам между собой сопоставляются, ищутся какие-то сходства, что в этих сайтах.

Если асессор поставил, что сайт хороший, действительно хороший, отвечает запросам и потом по соседним запросам тоже поставил такую же оценку, то потом между собой сайты сравниваются, ищется что-то в них хорошее, что потом распространяется на всю базу, которая у нас есть. Те сайты, которые были первоначально оценены, именно на них это никак не повлияло. Это повлияло в массе абсолютно на всех. Аналогично и с отрицательными оценками, конечно так же, если набирается такой пул.

Из этих данных, и, конечно же, не только из них, есть еще много всяких других, но это основное, из чего делается, формируется формула ранжирования.

Формула ранжирования

Я не стал писать формулу, потому что она никому из здесь сидящих, кто смотрит нас в онлайне, не будет полезна, она будет бесполезна. Она огромная, сложная, непонятная, можно ее капать, можно делать какие-то догадки, за что в ней что отвечает.

Но вы никогда не сможете с помощью этой формулы предугадать, как же она работает и как она повлияет на ранжирование вашего сайта, чтобы он попал в топ, на первое место в результатах поиска. Никогда.

Связано это с тем, что формула, помимо того, что она сложная, она регулярно меняется и этому способствует машинное обучение.

Ранжирование

В 2009 году, в стенах сайта Яндекса был изобретен такой метод машинного обучения, как Матрикснет. Он используется до сих пор и показывает отличные результаты, которые позволяют держать нам качество поиска на должном уровне.

Этот Матрикснет машинного обучения постоянно перебирает эту формулу, обучаясь на том, что я уже упомянул до этого. Если сегодня что-то благоприятно влияет на ваш сайт, то завтра это может уже абсолютно не влиять или влиять в минус.

Поэтому, узнав формулу ранжирования, вы не можете узнать: «Ага, здесь какой-то большой коэффициент, я это подкручу». Завтра бац! – и все произошло абсолютно наоборот. Поэтому нам, представителям поисковых систем, конечно же всегда сложно отвечать на вопрос: «Почему мой конкретный сайт не ранжируется на первом или втором месте?».

Что такое хорошее ранжирование

Что же такое хорошее ранжирование?

Что такое хорошее ранжирование

Давайте рассмотрим пример – запрос «Большой театр», какие-то типичные результаты поиска и посмотрим, из чего они состоят. На первом месте у нас витальный сайт – то, что ищет большинство людей, который задали этот запрос «Большой театр». Это сайт самого Большого театра.

На втором месте мы с вами видим второй документ сайта, полезный документ, который помимо того, что отвечает на запрос пользователя, несет еще и дополнительную информацию.

Это афиша Большого театра.

На третьем месте мы с вами видим сайт Википедии.

Он тоже отвечает на этот запрос, он релевантен. Помимо этого, он несет огромное количество информации о Большом театре, потому что далеко не все пользователи хотят сходить в Большой театр или купить туда билет. Они хотят больше почитать об истории театра или что-то еще. Это подтверждается в запросы, которые мы исследуем о поведении пользователей.

Другие два результата тоже релевантны.

Нельзя сказать, что они несут какую-то дополнительную информацию, но они абсолютно релевантны запросам «Большой театр» и не содержат в себе какого-то спама или чего-то еще.

Полезное:

 

Источник (видео): Как работает поиск – Антон Роменский

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *

Нажимая на кнопку «Отправить комментарий», вы соглашаетесь с Условиями использования