Результативное продвижение сайта в интернете!

г. Москва, м. Сокольники, ул. Маленковская, д. 32, стр. 3

с 10:00 до 19:00, пн.- пт. (сб./вс. - выходной)

Исследование Google RankBrain и замены запросов

Представляем вашему вниманию перевод статьи, посвященной технологии Rankbrain от Google. Оригинал взят с сайта searchengineland.com. Автор – Дэнни Салливан: FAQ: All about the Google RankBrain algorithm

 

Знакомство с Google Rankbrain

Патент Google, полученный в августе, описывает, как Google заменяет термины в запросах, и ниже я привожу несколько примеров того, как он переписывает некоторые запросы. Это часть исследования недавно появившегося и давно анонсированного метода обучения Google под названием RankBrain.

Метод RankBrain описан в статье Bloomberg, опубликованной в октябре 2015. Поиском Google теперь будет заниматься искусственный интеллект. Эта статья называет имена двух из пяти человек, которые начали изучать использование искусственного интеллекта для ранжирования веб-страниц. Данный подход очень популярен в Google. В статье говорится:

Недавно появившийся алгоритм RankBrain является результатом годовых усилий команды, которая состояла из пяти инженеров Google, включая специалиста по поиску Йонги Ву и эксперта по глубокому обучению Томаса Штроманна.

Согласно этой статье RankBrain – это третий, самый важный, сигнал ранжирования страниц Google в результатах поиска Google. Мне показалось, что стоит начать с изучения патентов, которые могут содержать имена людей, вовлеченных в проект. Это хорошая отправная точка. Я нашел один патент с именем Томаса Штроманна (одного из изобретателей), и это напомнило мне об обновлении Google Hummingbird. В статье Bloomberg сообщается:

RankBrain использует искусственный интеллект, чтобы встроить язык письма в математические сущности, так называемые векторы, так чтобы их понимал компьютер.

Если RankBrain видит слово или фразу, которые ему не знакомы, машина может попытаться сделать предположение касательно того, какие слова или фразы могут иметь аналогичный смысл и, соответственно, отфильтровать результат. Это делает поиск по новым запросам намного более эффективным.

Патент Google, предоставленный компании в августе этого года, описывает интересный процесс, похожий на этот алгоритм, но несколько отличающийся:

Процесс, описанный в патенте, включает в себя:

  • сбор данных по замене терминов в запросе для одного или нескольких терминов в запросе, которые встречаются в полученном запросе;
  • сбор данных по замене терминов в запросе для одного или нескольких терминов в запросе, которые встречаются в последующих запросах и включают концепцию;
  • «включает концепцию» означает, что он связан с одним или несколькими терминами в последующих запросах;
  • сбор данных по замене терминов в данных запроса для одного или нескольких терминов в запросе в контексте концепции;
  • определение правил замены в контексте концепции на основе собранных данных терминов для замены данных в запросе.

 

risunok-1

Рис. 1. Поисковая система

 

ПРЕИМУЩЕСТВА ПРОЦЕССА В ПАТЕНТЕ

(1) Для того, чтобы определить контекст запроса, поисковая система традиционно отслеживает только одно или два слова, связанные с термином запроса, из-за сложности вычислений. Но концепция может включать в себя более двух слов, и этот подход позволяет использовать более сложные запросы и переписывать их.

(2) Правило замены термина в конкретном контексте определяется концептом или эмпирически благодаря взаимодействиям пользователя с данными результатами поиска. Расширяя формирование контекста и выводя его за пределы двух слов, поисковая система может определять правила замены, направленные на более конкретный контекст, и потенциально улучшать результаты поиска.

Вот этот патент:

Использование концептов в качестве контекстов для замены терминов в запросе

US 9104750 B1

Номер заявки: US 13/650,322

Дата публикации: 11 августа 2015

Дата подачи: 12 октября 2012

Изобретатели: Кедар Дамдер, Томас Штроманн, П. Пандуранг Наяк, Роберт Спалек

Отрывок

Способы, системы и устройства, в том числе компьютерные программы, закодированные на носителе компьютерной памяти, для сбора данных, для замены терминов в запросе на основе одного или нескольких указанных понятий.

Согласно одному из вариантов реализации способ включает в себя прием запроса, с, по меньшей мере, тремя последующими терминами в запросе; определение того, что последующие условия в запросе представляют собой концепцию; и в ответ на определение того, что последующие условия в запросе представляют собой концепцию, сбор данных для замены терминов в запросе для одного или нескольких терминов в запросе, которые встречаются в запросах и включают концепцию.

ПОХОЖИЕ СТАТЬИ В ПРОШЛОМ

Я написал три статьи, которые связаны с данной темой:

  • «Патент Google Hummingbird?»;
  • «Как Google заменяет термины в запросе в условиях сочетаемости»;
  • «Как Google переписывает термины поиска».

УСЛОВИЯ ЗАМЕНЫ В ПЕРЕПИСЫВАНИИ ЗАПРОСОВ

Когда кто-то вводит запрос в Google, полученные результаты могут быть уникальными или включать в себя дополнительные прошлые результаты. Такого типа пересмотра можно добиться путем добавления к исходному запросу дополнительных терминов, которые являются условиями замены терминов, появившихся в исходном запросе.

Если вы хотите изучить этот процесс, я рекомендую вам внимательно ознакомиться с патентом, но я хотел бы представить три примера из патента, которые иллюстрируют процесс, связанный с ним. Для каждого из этих трех процессов у меня есть исходный запрос и переписанный, и отрывок из патента, который объясняет часть преобразования исходного запроса и замены на запрос с терминами замены.

ПРИМЕР ПАЗЛА NEW YORK TIMES

  1. Оригинальный запрос = «Пазл New York Times»
  2. Пересмотренный запрос = «Пазл? Кроссворд (New York Times)».

 

risunok-1

 

Рис. 2. Запрос «Пазл New York Times»

 

Во время состояния (I), поисковая система замены анализирует суммарные данные условий замены запроса и определяет, получено ли одно или несколько правил замены путем этого анализа. Например, система замены может определить, что вместо слова «Кроссворд» часто используется термин «Пазл» в контексте концепции New York Times, что обозначено положительной индикацией; в некоторых вариантах реализации, индикация может быть количественным показателем, приписанным данным по запросу термина в журнале запросов, и количественный счет может быть проанализирован с помощью одного или более критериев в оценке замены поисковой системы потенциального термина для замены. В другом примере, система замены поисковой системы может определить, что термин в запросе данных «Подписка» не используется для замены термина «Пазл» в контексте концепции New York Times, так как указана отрицательная индикация. При этом замена в поисковой системе определяет, что термин «Кроссворд» часто заменяет термин «Пазл» в контексте New York Times, и посылает указание на набор правил замены, чтобы добавить правило замены «Пазл? Кроссворд (Нью-Йорк Таймс:)» в коллекцию. Для последующих пользовательских запросов, которые содержат исходные условия запроса «New York Times Пазл», замена поисковой системы может затем применить правило подстановки «Пазл? Кроссворд (New York Times)» и связаться с пересмотренным запросом в поисковой системе, чтобы включить термин замены «Кроссворд» в пересмотренный запрос.

risunok-2

Рис. 3. Пересмотренный запрос «Пазл New York Times»

 

ПРИМЕР СО СТАДИОНОМ NEW YORK YANKEES

  1. Первоначальный запрос = «Стадион New York Yankees».

  2. Пересмотренный запрос = «Yankees? Бейсбол («Нью-Йорк»: «Стадион»)».

Патент показывает нам некоторые из замен, которые может применять поисковая система, и вот один из этапов этого анализа:

При этом замена в поисковой системе определяет, что термин «бейсбол» часто используется вместо термина Yankees в контексте комбинированных понятий «Нью-Йорк» и «Стадион» и посылает указание на набор правил замены для добавления подстановки «Yankees? Бейсбол? («Нью-Йорк»: «Стадион»)». Для последующих пользовательских запросов, которые содержат исходные условия запроса «Нью-Йорк стадион Yankees» замена в поисковой системе происходит путем подстановки «Yankees? Бейсбол? («Нью-Йорк»: «Стадион»)» и связывается с программой пересмотра запросов. Термин замены «бейсбол» включается в пересмотренный запрос.

 

risunok-3

Рис. 4. Запрос «Стадион New York Yankees»

 

ПРИМЕР «СТАВКА НАЛОГА ПО СОЦИАЛЬНОМУ СТРАХОВАНИЮ»

  1. Оригинальный запрос = «Ставка налога по социальному страхованию».
  2. Пересмотренный запрос = «Ставка? Расчет («Социальное страхование» «Налог»)»

Во время состояния (I), поисковая система замены анализирует суммарные данные условий замены запроса и определяет, получено ли одно или несколько правил замены путем этого анализа. Например, замена поисковой системы может определить, что термин в запросе данных «Расчет» часто заменяется термином «Ставка» в контексте концепции «Социальное страхование» и «Налог», что обозначено положительной индикацией; в некоторых вариантах реализации, индикация может быть количественным показателем, приписанным данным по запросу термина в журнале запросов, и количественный счет может быть проанализирован с помощью одного или более критериев в оценке замены поисковой системы потенциального термина для замены. В другом примере, замена поисковой системы может определить, что термин «Страховое пособие» не часто заменяет термин «Ставка» в контексте концепции «Социальное страхование» и «Налог», как указано в отрицательной индикации. При этом замена поисковой системы определяет, что термин «Расчет» часто заменяет термин «Ставка» в контексте объединенных понятий «Социальное страхование» и «Налог», и посылает указание в набор правил замены для добавления правил подстановки «Ставка? Расчет («Социальное страхование», «Налог»)». Для последующих пользовательских запросов, которые содержат исходные условия запроса «Ставка налога социального страхования», замена поисковой системы может применять правило подстановки «Ставка? Расчет («Социальное страхование», «Налог»)» и связывается с программой пересмотра запроса поисковой системы. Термин «Расчет» включен в пересмотренный запрос.

 

risunok-4

Рис. 5. Запрос «Ставка налога по социальному страхованию»

 

Выводы

Данные замены могут быть взяты из текстов в сети, или в лог-файлах запросов. Примеры показывают что:

  • Термин «Бейсбол» часто заменяет термин «Yankees» в контексте комбинированных понятий и концепции «Нью-Йорк» и «Стадион».
  • Замена поисковой системы может определить, что термин «Расчет» часто заменяется термином «Ставка» в контексте понятий «Социальное страхование» и «Налог», как обозначено положительным указанием.
  • Термин «Кроссворд» часто заменяется термином «Пазл» в контексте «Нью-Йорк Таймс» и посылает указание набору правил замены для добавления правил подстановки «Пазл? Кроссворд».

Как показывают эти примеры, Google изучает, как работают слова, и ситуации, когда слова могут быть взаимозаменяемыми в определенных условиях, а это важно знать, чтобы обеспечить потенциально лучшие результаты поиска. Согласно данным из интервью, взятого журналистами Bloomberg News, «RankBrain отвечает за 15 % совершенно новых запросов Google в день».

 

Источник: searchengineland.com

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *

Нажимая на кнопку «Отправить комментарий», вы соглашаетесь с Условиями использования