Голосовой помощник Alibaba лучше, чем у Google

Он ежедневно обрабатывает миллионы запросов от сотен тысяч живых пользователей. И делает это просто прекрасно. Голосовой помощник Алибаба поражает воображение. 

В мае этого года Google произвёл сенсацию, когда представил Duplex, своего жутко похожего на человека голосового помощника. Он способного делать заказы в ресторанах и посещать салоны. Казалось, это знаменует собой новую веху в генерации речи и понимании естественного языка. Гугл приоткрыл занавес и показал будущее Искусственного интеллекта.

Но пока Google медленно внедряет эту функцию, собственный голосовой помощник Alibaba уже работает сверхурочно. 2 декабря прошла конференция Neural Information Processing Systems. Это одно из крупнейших в мире мероприятий, посвященных Искусственному интеллекту. Alibaba продемонстрировала агент по обслуживанию клиентов для своей логистической компании Cainiao. Это предприятие обеспечивает всю доставку Алиэкспресс и Тмолл. И Джин Жонг, декан Лаборатории машинного интеллекта и технологий Alibaba, сказал, что агент уже обслуживает миллионы запросов клиентов в день.

Демонстрационный разговор

Предварительно записанный демонстрационный звонок включал голосовой помощник Алибаба, спрашивающего клиента, куда бы он хотел доставить свой заказ. И в  ходе обмена мнениями Искусственный Интеллект успешно прошел несколько диалоговых элементов. Таким образом он продемонстрировал широту возможностей на естественном языке.

Вот этот диалог, в переводе с упрощенного китайского:

Агент: Здравствуйте, я голосовой помощник
Алибаба Cainiao. 
Клиент: Привет. 
A: Да, привет, у вас запланирована утренняя доставка на
588 Culture West Road. Вам будет удобно ее получить? 
C: Кто ты? 
A: Я голосовой помощник Cainiao. Я хотел бы подтвердить вашу утреннюю доставку на 588 Culture West Road. Это вам удобно? 
C: Утром меня не будет дома. 
A: Тогда у вас есть другой адрес, который вы хотели бы использовать?

Почему голосовой помощник Алибаба круче, чем у Гугл Дуплекс

В течение 30 секунд агент плавно обработал три общих и хитрых диалоговых компонента: прерывание, нелинейный разговор и неявное намерение. Прерывание говорит само за себя: агент может реагировать на прерывание клиента и продолжать передавать соответствующую информацию, не начиная заново или не пропуская такт.

Нелинейный разговор происходит , когда клиент спрашивает : «Кто ты?» Это требует агента , чтобы зарегистрировать , что клиент не отвечает на предыдущий вопрос, а начало новой строки запроса. В ответ агент вновь представляет себя, прежде чем вернуться к первоначальному вопросу.

Неявное намерение происходит , когда клиент отвечает: «Утром меня не будет дома». Хотя он прямо не говорит, что не сможет забрать посылку, голосовой помощник Алибаба умеет читать между строк и находит решение.

Эти элементы могут быть обычным явлением в человеческих разговорах, но машины часто не могут с ними справиться. То, что голосовой помощник Alibaba может сделать это, говорит о том, что он более изощренный, чем Google Duplex, судя по аналогичным примерам звонков, продемонстрированным Google. Однако стоит отметить, что демонстрационный звонок Alibaba предназначен для представления на сцене; опыт может отличаться в реальности.

В настоящее время агент используется только для координации доставки пакетов, но Джин сказал, что он может быть расширен для обработки других тем. Он не мог полностью раскрыть, как обучали ассистента. Но он намекал на использование огромного количества записей о клиентах, имеющихся в распоряжении компании, в дополнение к другим ресурсам. Согласно обычному дню, в среднем в компании проводится 50 000 звонков в службу поддержки клиентов.  И эта цифра увеличивается в пять раз, в день холостяка – 11 ноября. 

Роботы Алибаба уже общаются с вами

Alibaba также разрабатывает цифровые помощник для других сфер. В результате мы уже общаемся с ними.  Среди них робот, который может принять ваш заказ в шумных ресторанах. Виртуальный аватар, похожий на человека, который может задавать вопросы о продуктах Alibaba. Чат-бот, умеющий торговаться.  Его уже используют 20% продавцов на перепродажной платформе Alibaba Xianyu .

По своей сути каждый из этих помощников оснащен механизмом распознавания речи и обработки естественного языка AliMe, разработанным компанией Machine Intelligence and Technology Lab. Затем они упаковываются и адаптируются к различным частям бизнеса.

Самым большим преимуществом Alibaba в этой области является огромное количество данных, необходимых для обучения ИИ. Помощники учатся и совершенствуются быстрее из-за большого количества практики, которую они получают при работе со всеми видами ситуаций. Огромный бизнес стимул для быстрого развертывания этих технологий также помогает. Помимо обработки большого количества обращений в службу поддержки, Alibaba поставляет один миллиард пакетов в день. Перенос определенных задач на ИИ помогает облегчить бремя людей и обеспечить бесперебойную работу бизнеса.