Написать пост

ИИ от Microsoft позволил чат-ботам поддерживать живую беседу с человеком

Аватар Тимур Кондратьев

Microsoft представила технологию «full duplex voice sense» для социальных чат-ботов, основанных на ИИ. Благодаря ей боты смогут предугадывать, что скажет человек, когда лучше прервать его, а когда — сделать паузу.

Microsoft рассказала, что инженеры компании разработали новый способ анализа человеческой речи одновременно с разговором специально для чат-ботов. Благодаря новой технологии боты могут предсказывать, что человек скажет дальше, когда нужно сделать паузу или в какой момент лучше прервать пользователя.

Подробнее о технологии

Инновационный способ ведения разговора называется «full duplex voice sense» и дает ботам, которые общаются посредством голоса, способность поддерживать продолжительную беседу с пользователем. Термин «full duplex» означает способность вести диалог в обоих направлениях одновременно. Благодаря этому пользователи смогут общаться с роботами так же просто, как разговаривать по телефону с живым человеком.

Технология дебютировала в ботах Microsoft Xiaoice (Китай) и Rinna (Япония). Директор Microsoft Zo AI Ин Ван (Ying Wang) рассказал, что компания планирует расширить такой же функциональностью других популярных ботов, к которым относятся Zo (США), Ruuh (Индия) и Rinna (Индонезия), в течение 6 месяцев. В Microsoft утверждают, что подобные боты будут созданы для каждой страны с населением выше 100 миллионов.

Ниже продемонстрирован пример работы бота Xiaoice с помощью умной колонки Xiaomi Yeelight:

Превью видео mV83EXNqEqo

Для обучения нейросетей, на которых основана технология, использовались данные популярных социальных чат-ботов Microsoft, которые вели диалог с 200 млн людей по всему миру на протяжении последних лет.

По словам Вана, решение прервать пользователя зависит от того, какую команду или вопрос он задал. Например, если Xiaoice рассказывает историю, ее не прервут посторонние шумы и разговоры, пока пользователь не даст явную команду. Также это распространяется на важные задания по управлению интернетом вещей: лишние звуки будут проигнорированы.

Для чего это нужно?

Такой подход в «оживлении» беседы с машиной не просто делает общение приятнее, но и способствует более высокому уровню вовлечения пользователей. Преследуя эту цель, Amazon внедрила поддержку контекстных вопросов в своего голосового помощника Alexa, а также запустила Alexa Prize — приз за создание бота, способного поддерживать диалог с человеком в течение 20 минут.

Разработка технологий искусственного интеллекта всегда была первоочередной для Microsoft. Напомним, что в 2016 году компания выпустила фреймворк, позволяющий создать собственного бота, не владея глубокими знаниями в программировании.

Следите за новыми постами
Следите за новыми постами по любимым темам
1К открытий1К показов