Google начал учитывать контекст слов при русскоязычном поиске

Google начал учитывать контекст слов при русскоязычном поиске

13.12.2019     

Компания Google обновила алгоритмы для поиска по русскоязычным сайтам. Это крупнейший апдейт системы за последние пять лет. Его главная цель – улучшить результаты выдачи. 

Значительное нововведение

Google сообщил, что добавил алгоритм BERT в свою поисковую систему для веб-ресурсов на русском языке. Технология усовершенствует механизмы машинного обучения поисковика и позволит лучше понимать запросы пользователей благодаря комплексному анализу вводимых слов. По словам Панду Найака, вице-президента Google, это обновление стало крупнейшим за последние пять лет, а разработка самого алгоритма – грандиозный успех для всей компании. 

Технология BERT (Bidirectional Encoder Representations from Transformers) представлена Google в прошлом году. Она использует возможности нейросетей для предварительного обучения обработке текста на естественном языке. Алгоритм годится не только для формирования поисковой выдачи, но и создания любых других сервисов, работающих с пользовательским контентом по формуле «вопрос-ответ». 

С декабря этого года возможности BERT начали использоваться и для обработки русскоязычного сегмента Google. 

Как работает технология

Результат поиска зависит от того, какие ключевые слова заданы системе. Чаще всего поисковики просто формируют выдачу по релевантности контента сайтов в базе запросу пользователя. Однако такой подход достаточно ограничен в своих возможностях и не учитывает контекст используемых фраз.  

«Когда люди открывают страницу Google Поиска, они не всегда знают, как лучше сформулировать запрос: иногда они не могут подобрать нужные слова или не помнят, как пишутся те или иные термины», – поясняет проблему Панду Найк. 

Алгоритм BERT – это двунаправленная технология обработки языка. Она способна не только анализировать отдельные слова в поисковом запросе, но и учитывать порядок, интерпретировать их по отношению друг к другу. Подобная система гораздо лучше понимает, какая именно информация нужна пользователю вне зависимости от того, каким образом была составлена фраза. Алгоритм одинаково хорошо справляется с запросом и в формате набора ключевых слов, и в виде простых вопросов. 

В качестве примера работы технологии Google приводит результаты выдачи по запросу «Может ли преподаватель выгнать студента с занятия?». Старый алгоритм давал ответ на вопрос «Имеет ли преподаватель право не пустить студента на пару?», что имеет другой смысл. BERT обрабатывает фразу пользователя более правильно, помещая на первую строку подходящий контент. 

 

Что изменится для сайтов

Представители Google никак не прокомментировали влияние нового алгоритма на поисковый трафик для сайтов. Однако они уточнили, что результаты работы BERT должны повысить эффективность поиска по непопулярным низкочастотным запросам. Также технология будет задействована для формирования «нулевой» выдачи – случая, когда Google не может найти релевантные сайты и выводит наиболее близкие к запросу результаты. 



Источник: https://infostart.ru/journal/news/tekhnologii/google-nachal-uchityvat-kontekst-slov-pri-russkoyazychnom-poiske_1167724/
Автор:
Александр Вашкевич Аналитик


Комментарии
В избранное Подписаться на ответы Сортировка: Древо развёрнутое
Свернуть все
1. DenisCh 13.12.19 10:45 Сейчас в теме
Интересно, что он теперь будет выдавать на слово "сказочный" ? ))
MikhailDr; dimisa; narutouzumaki_13; Dmitri93; +4 Ответить
3. MikhailDr 16.12.19 07:59 Сейчас в теме
(1)я даже знаю какая там будет картинка в выдаче
2. VmvLer 13.12.19 11:00 Сейчас в теме
Главная цель совсем другая и не только у гугла
Оставьте свое сообщение

См. также

Число загрузок мобильных приложений обновило рекорд

Новость Аналитика ИТ-новость Мобильные приложения

Пользователи стали устанавливать больше мобильных приложений, а количество загрузок достигло рекорда. Кроме того, увеличилось и время использования приложений, выяснили аналитики агентства App Annie.

вчера в 14:11    263    user1015646    0       

Роспечать предложила создать сервисы для поиска фейков и анализа контента

Новость Искусственный интеллект ИТ-новость Новости компаний

Роспечать предложила использовать искусственный интеллект для распознавания поддельных новостей. Каким образом нейросеть будет определять дипфейки, эксперты не знают.

вчера в 11:30    258    VKuser24342747    2       

Microsoft заблокировала возможность деинсталляции Edge из Windows 10

Новость Windows Интернет ИТ-новость Новости компаний

Microsoft официально подтвердила, что пользователи не смогут деинсталлировать новый браузер Edge после обновления Windows 10.

13.08.2020    458    SKravchenko    0       

Создан новый язык программирования Armada для работы с параллельными вычислениями

Новость ИТ-новость Языки программирования

Группа исследователей опубликовала новый язык программирования Armada. Язык предназначен для формальной проверки высокопроизводительных параллельных программ.

12.08.2020    1133    SKravchenko    8       

Энтузиаст запустил в Minecraft компьютер на Windows 95

Новость ОС Windows Видеоигры ИТ-новость

Разработчик delta2force представил мод VM Computers для популярной игры-песочницы Minecraft. Он позволяет добавить в игру виртуальный компьютер и запустить на нем Windows 95.

12.08.2020    558    user1015646    2       

Выпущен ПК весом 83 грамма с поддержкой нескольких десктопных ОС

Новость Гаджеты ИТ-новость Микроэлектроника

Компания XCY выпустила миниатюрный компьютер Mini PC Stick, по размеру напоминающий флешку, помещающуюся в ладони. В качестве ОС на него можно установить Windows 10 или Linux.

11.08.2020    894    user-programmist    10       

Сбербанк создаст криптовалюту, привязанную к рублю

Новость Банки Блокчейн ИТ-новость Новости компаний

Сбербанк выпустит собственную криптовалюту Sbercoin – стейблкоин, курс которого будет привязан к рублю. Он упростит внутренние транзакции и не противоречит закону о цифровых финансовых активах (ЦФА).

11.08.2020    584    user1015646    7       

Windows 10 сможет запускать приложения с Android-смартфонов

Новость Windows Android Infostart Software Partners Маркет Новости компаний

5 августа 2020 года Microsoft объявила о новшествах, которые появятся в Insider Preview Build 20185. Одной из самых интересных функций стало дальнейшее развитие службы «Ваш телефон».

07.08.2020    914    capitan    4       

Программист из Slack превратил MacOS 8 в кроссплатформенное приложение

Новость ОС Mac OS ИТ-новость

Разработчик создал приложение, позволяющее запустить MacOS 8 на современных компьютерах как обычное приложение. Для этого не понадобится даже предварительно устанавливать эмулятор.

06.08.2020    746    VKuser24342747    0       

МТС получил первую в России лицензию на развитие сети 5G

Новость ИТ-новость Новости компаний Телекоммуникации

Роскомнадзор предоставил МТС лицензию на строительство сети 5G по всей территории России — в 83 из 85 субъектов. Срок действия лицензии - до лета 2025 года. Для развития сети были выданы частоты от 24,25 до 24,65 ГГц.

05.08.2020    754    user-programmist    1       

Работа с большими данными во всем мире должна регулироваться профстандартом

Новость Искусственный интеллект ИТ-новость

Британское компьютерное общество (BCS) вместе с Королевским статистическим обществом (RSS) и Королевской инженерной академией (RAEng) начали работу по созданию профстандартов в отрасли больших данных (BigData).

05.08.2020    640    SKravchenko    3       

GitHub представил дорожную карту развития сервиса

Новость GitHub ИТ-новость

GitHub будет лучше знакомить разработчиков с грядущими обновлениями сервиса при помощи публичных дорожных карт. Пользователи смогут влиять на выполнение запланированных улучшений и помогать им продвигаться вперед по карте.

05.08.2020    655    VKuser24342747    0       

IEEE опубликовал свежий рейтинг языков программирования

Новость ИТ-новость Языки программирования

Институт инженеров электротехники и электроники IEEE Spectrum недавно опубликовал свой рейтинг языков программирования за 2020 год. Как и в последние несколько лет Python снова лидирует, но есть и несколько сюрпризов.

04.08.2020    877    SKravchenko    1       

Facebook запускает конкурента Zoom

Новость ИТ-новость Мессенджеры Новости компаний

23 июля Facebook объявил, что расширяет возможности Messenger Rooms и Facebook Live, – теперь пользователи могут организовывать онлайн-совещания с участием до 50 человек.

03.08.2020    681    SKravchenko    0       

Виртуальные фанаты заполнят пустые стадионы

Новость Искусственный интеллект ИТ-новость Телекоммуникации

Из-за пандемии COVID-19 сто двадцатый сезон в истории главной лиги бейсбола США пройдет с пустыми стадионами. Но Fox Sports для своих трансляций будет заполнять трибуны виртуальными фанатами с цифровой визуализацией.

31.07.2020    733    SKravchenko    2       

Начался выпуск российских материнских плат для ARM-процессоров «Байкал»

Новость Импортозамещение ИТ-новость Микроэлектроника

Первую российскую материнскую плату для нового ARM-процессора Baikal-M представили компании «Байкал электроникс», «Эдельвейс» и «Базальт СПО». Ориентировочная стоимость платы – 50 тыс. рублей.

30.07.2020    846    user1015646    3       

Банки оценили переход на отечественное ПО в сотни миллиардов рублей

Новость Банки ИТ-новость Цифровая экономика

Российские банки пересчитали планируемые расходы на внедрение отечественных программ. Затраты финансовых учреждений могут составить до 150 млрд рублей.

30.07.2020    622    VKuser24342747    0       

Молодые сотрудники используют больше разных приложений для работы

Новость Автоматизация Аналитика ИТ-новость

Исследование, проведенное консалтинговой фирмой Creative Strategies по изучению сотрудничества, показало значительные различия в стиле и подходе к работе у разных возрастных групп.

29.07.2020    913    SKravchenko    0       

Microsoft представила утилиту для мониторинга процессов в Linux

Новость Linux ИТ-новость Новости компаний

Компания Microsoft выпустила утилиту ProcMon (Process Monitor) для Linux. Программное обеспечение распространяется под открытой лицензией MIT. Ранее ProcMon была доступна только для Windows.

29.07.2020    802    user1015646    2       

Google сделает Android Go обязательной на устройствах с ОЗУ меньше 2 ГБ

Новость Google ИТ-новость Мобильные приложения

С октября 2020 года на все новые Android-устройства, имеющие объем ОЗУ 2 ГБ и менее, Google заставит устанавливать Android Go – модифицированную версию Android для устройств начального уровня.

28.07.2020    1692    SKravchenko    0       

Google Cloud представил новые средства безопасности

Новость Google Безопасность ИТ-новость

Облачная платформа Google Cloud разработала новые инструменты для обеспечения безопасности. Они ориентированы на крупные коммерческие компании, банки и государственные учреждения.

28.07.2020    773    user1015646    0       

ПК на Windows могут перейти на ARM-процессоры

Новость Windows Mac OS ИТ-новость Микроэлектроника

22 июня Apple объявила о переходе Mac на процессоры собственного производства на базе архитектуры ARM. Первые системы появятся к концу года, начав двухлетний переходный период.

24.07.2020    1959    SKravchenko    1       

Разработчики GitHub представили GCM Core – инструмент универсальной аутентификации для Git-серверов

Новость GitHub ИТ-новость

Git Credential Manager Core – это кроссплатформенный инструмент, который может стать альтернативой традиционной HTTPS- или SSH-аутентификации для Git-серверов. Планируется, что в будущем он заменит существующие утилиты аутентификации для Windows, macOS и Linux.

24.07.2020    1213    user1015646    1       

Google выпустила большое обновление Chrome

Новость Google Безопасность Интернет Интерфейсы ИТ-новость

14 июля Google выпустила стабильную версию браузера Chrome 84 Desktop для Windows, Mac и Linux. Новый Chrome получил поддержку Web OTP API, ярлыки PWA и умеет блокировать навязчивые уведомления.

23.07.2020    1822    SKravchenko    0       

GitHub разместил пленочный архив открытого кода в арктическом хранилище

Новость GitHub ИТ-новость

GitHub завершил масштабный перенос архива открытого исходного кода в хранилище Arctic World Archive. Данные будут храниться в виде фотоснимков на пленочных накопителях.

22.07.2020    1218    VKuser24342747    2