Google разработала новый алгоритм диаризации
Алгоритм диаризации выделяет из аудиоптока высказывания отдельных участников беседы. Разработка базируется на рекуррентной нейронной сети (RNN).
Материалы, посвященные разработкам в области программного распознавания образов.
Алгоритм диаризации выделяет из аудиоптока высказывания отдельных участников беседы. Разработка базируется на рекуррентной нейронной сети (RNN).
XNLI расширяет датасет MultiNLU и дает развитие системам машинного обучения для распознавания большего количества языков, в том числе редких.
SilentVoice отслеживает колебания воздуха у рта говорящего и переводит их в текст. Система распознаёт шёпот и отсекает посторонние шумы.
Агент ActiveQA перефразирует задаваемый пользователем вопрос, в нескольких вариантах отправляет запрос в базу QA и предоставляет наиболее точный ответ.
Теперь информация о вызывающем абоненте будет отображаться прямо на экране во время звонка. Голосовой помощник Duplex будет определять имя и цель звонка.
Microsoft рассказала об изменениях приложения Snip Insights, которое распознаёт детали на снимках экрана и умеет переводить с них тексты.
Она помогает чат-ботам выявлять в тексте и речи указания на имена, даты, время, местоположение и числа. NER можно подключить к любому навыку «Алисы».
Задача участников соревнования состоит в улучшении существующих технологий распознавания или создании нового классификатора рисунков в Quick, Draw!.