Подписаться на новости
logo logo
Сообщество робототехников

Машинное обучение в сервисах «Яндекса»: рассказывает представитель компании

Машинное-обучение-в-сервисах-Яндекса-рассказывает-представитель-компании
Пятница, 30 Ноября 2018, в 16:16
Искусственный интеллект

«Яндекс» начал работать с машинным обучением в 2011 году. Сегодня компания применяет технологию в самых разных областях – от перевода до автоматизации колл-центров. Подробности об этом на AI Conference рассказал Михаил Благутин, руководитель направления стратегии и развития аналитических и ML-сервисов «Яндекс.Облако». 

Спикер остановился на трех направлениях машинного обучения, которые развивает «Яндекс»: это синтез и распознавание речи, нейросетевой перевод и компьютерное зрение. Ниже – самые интересные тезисы из доклада.

 

Машинное-обучение-в-сервисах-Яндекса-рассказывает-представитель-компании

 

Синтез и распознавание речи

Функция синтеза и распознавания речи – ключевой компонент голосового помощника «Алиса», чья месячная аудитория в 2018 году составила 30 млн пользователей. На данный момент технология способна:

  • распознавать и синтезировать речь в режиме реального времени;
  • поддерживать русский, английский и турецкий языки;
  • интегрироваться с телефонией по MRCP.

Михаил Благутин утверждает, что самый зрелый и большой интерес у клиентов «Яндекса» сформировался именно к автоматизации телефонии. Это область, в которой есть действительно понятный экономический эффект. 

 

Машинное-обучение-в-сервисах-Яндекса-рассказывает-представитель-компании

Из презентации спикера

Существует несколько сценариев использования МО в колл-центрах. К примеру – обзвон клиентов с информированием о текущих промоакциях, плановых работах, сбор информации о качестве обслуживания и т.д. Синтезатор речи также может информировать о статусе заказа, подтверждать оплату, проверять адреса и время доставки. Правда, конкретные имена клиентов «Яндекса», которые используют эту разработку, спикер не назвал.

Смотрите также: "Алиса от «Яндекса»: чему нейросеть научилась за два месяца"


Прямой нейросетевой перевод 

Машинный перевод на основе правил – Rule-based Machine Translation (RBMT), – который появился еще в 50-х, обрабатывал каждое слово отдельно (думаем, большинство читателей помнит, какие странные результаты показывали автопереводчики). Значимый сдвиг произошел в 2014 году. Тогда на сайте Корнеллского университета появилась статья с первыми образцами работы нейронного машинного перевода. Сейчас МП выдает вполне адекватные тексты, но, как показала практика, в полной мере пока заменить человека не может.

Качество перевода во многом зависит от стиля исходного материала. Переводы художественных текстов у них практически всегда получаются плохо. Часть материалов после автоперевода требует последующей вычитки. А пользовательский контент (статьи в блогах, отзывы на форумах и пр.) уже успешно переводят нейросети. 

 

Машинное-обучение-в-сервисах-Яндекса-рассказывает-представитель-компании

Вот внутренняя статистика «Яндекса» об использовании их сервиса перевода:

Машинное-обучение-в-сервисах-Яндекса-рассказывает-представитель-компании

Компьютерное зрение

Сервис распознавания текста (OCR), построенный на основе компьютерного зрения, был запущен в «Яндексе» в 2014 году. Он поддерживает 43 языка. Среди стандартных функций – тэги на базе поисковых запросов, поиск похожих изображений в Интернете и подсказки по форматированию. На данный момент OCR используют в:

  • «Яндекс.Диске»;
  • переводчике auto.ru;
  • «Алисе».

Одна из интересных функций компьютерного зрения «Яндекса» – определение качества картинки. Благодаря ей появилась DeepHD – технология, которая умеет улучшать качество видео. 

С помощью DeepHD «Яндекс» улучшил качество советских мультфильмов. В основе работы технологии – генеративно-состязательные нейросети, которые позволили воссоздать высокую четкость деталей старых изображений (о результатах применения технологии мы рассказывали ранее). 


Машинное-обучение-в-сервисах-Яндекса-рассказывает-представитель-компании

Слева – изображение до обработки, справа – обработанное технологией DeepHD

Скачать полную презентацию спикера можно по ссылке.

 

Узнать больше интересного

рейтинг

433

просмотров

0

комментариев

порекомендовать друзьям

комментарии

Нет комментариев

Гость

Дорогие друзья! Помните, что администрация сайта будет удалять:

  • Комментарии с грубой и ненормативной лексикой
  • Прямые или косвенные оскорбления героя поста или читателей
  • Короткие оценочные комментарии ("ужасно", "класс", "отстой")
  • Комментарии, разжигающие национальную и социальную рознь