Новый алгоритм «Королев» улучшит работу Яндекса

Новый алгоритм «Королев» улучшит работу Яндекса

В конце августа текущего года представители Яндекса презентовали обновленную версию поисковика, использующую алгоритм «Королев». Нововведение создано на базе нейронной сети, которая определяет релевантность смысла запросов содержанию страниц веб-ресурсов. Алгоритм заметно повышает точность поисковой выдачи.

Для обучения используются данные поисковой статистики и оценки пользователей, заметно ускоряя темпы развития и качество работы. Развитию поиска обычные юзеры будут помогать наравне с разработчиками. К созданию «Королева» компания Яндекс пришла благодаря «Палеху» (предыдущей версии алгоритма поиска), который находил релевантную страницу по ключевикам и смысловому содержанию контента. «Палех» стал важным этапом развития алгоритмов на основе нейронных сетей. Основной проблемой работы поисковиков были трудности, связанные с распознанием слов из длинных запросов. Дело в том, что алгоритмы, столкнувшись с редкими грамматическими конструкциями, не могли их распознавать, используя поведенческую статистику. Для решения обозначенной проблемы и был запущен «Палех».

Инновационная технология изучения запросов на основе семантических векторов позволила распознавать низкочастотные конструкции с длинными хвостами. В отличие от алгоритмов, анализирующих смысл контента, «Палех» переводил запросы и тайтлы страниц в группы чисел и сравнивал их друг с другом. Степень сходства для нейросети стала критерием релевантности. Успех, нового алгоритма побудил разработчиков продолжать разработки перспективного алгоритма, увеличивая область анализируемой информации. Так появился «Королев».

В отличие от своего предшественника новый алгоритм сравнивает семантические векторы запросов и целых страниц вместо традиционных тайтлов. В блоге компании разработчики дали несколько комментариев по поводу особенностей работы «Королева». Нейронная сеть, используемая новым алгоритмом, обучается на поисковой статистике. «Королев» учитывает, какие страницы привлекли внимание пользователей по разным запросам и как долго они на них оставались. Чем больше времени пользователь уделяет контенту, тем он релевантней его считает система. Если пользователь голосует за страницу собственным временем, то это явное доказательство полезности ее содержимого.

Преобразование контента в семантические векторы нейросетями требует колоссальных затрат вычислительных мощностей. В этом отношении предыдущий алгоритм менее затратный. Если для «Палеха» смысловой анализ происходил в самом конце и требовал обработки порядка 150 документов, то «Королеву» приходится обрабатывать около 200 000. Именно потому алгоритм начинает смысловой анализ в самом начале индексирования. При вводе запроса «Королев» сравнивает его семантический вектор с уже индексированными страницами, что позволяет снизить затраты времени. Помимо этого, алгоритм также учитывает запросы, по которым страницу посещали другие пользователи. Дополнительную информацию о работе «Палеха» и «Королева» вы узнаете в следующих публикациях на stk-promo.


Если есть вопросы?
Звоните прямо сейчас +7(495) 256-14-54
или оставьте заявку и мы перезвоним в течение 30 минут

Ваши контактные данные в безопасности и не будут переданы третьим лицам

Обратная связь

Заказать продвижение

Заказать контекстную рекламу

Заказать экспресс аудит



Заказать разработку сайта