Яндекс запустит новый поиск 22 августа

Яндекс запустит новый поиск 22 августа
наш канал в Telegram!

Запуск новой версии поиска

26 июля 2017 года "Яндекс" изменил свой слоган с "Найдется все" на "Поиск №1 в России" в рамках новой рекламной кампании, приуроченной, очевидно, к запуску нового поиска, который намечен на 22 августа 2017 года.

новый слоган яндекса

Презентация, посвященная запуску нового алгоритма поиска, будет проходить в Московском планетарии. На мероприятии представители Яндекса расскажут посетителям о новых технологиях, используемых в поиске, и покажут что происходит "по ту сторону" поиска.

От используемого в данный момент Матрикснета Яндекс переходит к категориальному бустингу (CatBoost), так как данный алгоритм способен обрабатывать разнородные данные, и делать это качественнее и быстрее Матрикснета. Матрикснет "нес службу" в Яндексе с 2009 года.

Немного теории из официальных источников

В основе Матрикснета лежит механизм градиентного бустинга. Его особенность — в том, что он хорошо подходит для работы с разнородными данными. Такими данными, скажем, могут быть температура, влажность, сила ветра, снимки со спутников и сводки с наземных радаров — по ним можно предсказать, какая будет погода. Кроме того, градиентный бустинг даёт точные результаты даже там, где данных относительно мало. Этим он отличается от нейронных сетей, которым для обучения требуется огромный массив однородной информации.

Само собой, у моделей на основе градиентного бустинга есть и недостатки. Все данные, на которых учится модель, должны быть представлены в числовом виде. Иногда это не так-то просто — например, когда мы имеем дело с типами облаков, жанрами музыки, породами собак и прочими вещами, которые понятны человеку, но которые трудно объяснить машине.

Сегодня Яндекс представляет преемника Матрикснета — новый метод машинного обучения CatBoost. В нём также используется градиентный бустинг, но CatBoost, во-первых, превосходит Матрикснет по точности предсказаний, а во-вторых, способен учитывать так называемые категориальные признаки — то есть признаки, которые принимают одно из конечного количества значений. Так, облака могут быть кучевыми, перистыми, перисто-кучевыми и так далее. Жанры музыки включают рок, рэп, классику, альтернативу, метал. Пудель, овчарка, спаниель и эрдельтерьер — породы собак. Подобные данные больше не нужно выражать в числах: CatBoost воспринимает их в исходном виде. Обученные с его помощью модели позволяют использовать всё многообразие доступных данных, не тратя время на их перевод в числовую форму.

Яндекс уже опробовал CatBoost в таких сервисах, как:

  • Дзен, для ранжирования ленты рекомендаций,
  • Яндекс.Погода - для расчета прогноза на основе технологии Метеум.

Видео-презентация

Презентация в Московском планетарии 22 августа

Если вы хотите попасть на презентацию Яндекса в Московском планетарии - у вас есть шанс! Яндекс разыгрывает 100 приглашений среди тех, кто заполнит данную форму - https://yandex.ru/promo/events/newsearch

Ваши комментарии|отзывы|вопросы

comments powered by Disqus