Yobe разработала систему VISPR для распознавания голоса в шумной обстановке
Новости
Технология использует ИИ, вычленяющий голоса из звукового потока. Затем VISPR определяет голос пользователя по контрольным биометрическим идентификаторам.
568 открытий571 показов
Компания Yobe представила систему Voice Identification System for user Profile Retrieval (VISPR), способную выделить голос пользователя даже в шумной обстановке. Технология, использующая искусственный интеллект, позволит использовать голосовое управление смартфоном на вечеринке, в толпе, на шумном мероприятии — там, где голос сложно распознать среди других звуков.
Принцип работы
Канал обработки сигнала адаптируется к окружающей обстановке: акустике комнаты, уровню шумов, количеству улавливаемых голосов. Обработчик сигнала анализирует звук с учётом свойств микрофона, что позволяет добиться лучшего результата. Искусственный интеллект разделяет звук на отдельные голоса и посторонние шумы.
Затем VISPR ищет в каждом из вычлененных голосов контрольные биометрические идентификаторы, уникальные для каждого человека.
Разработчики VISPR
Стартап Yobe, разработчик VISPR, был основан в MIT и получил поддержку венчурной компании Clique Capital Partners, а также грант Национального научного фонда SBIR. Всего было потрачено около двух миллионов долларов. Соучредитель и генеральный директор Yobe Кен Саттон считает VISPR более надёжной системой, чем представленные на рынке аналоги. Он заявляет, что VISPR повышает точность обработки речи до 85 процентов.
В октябре 2018 года компания Google представила свою систему вычленения голоса VoiceFilter. Разработчики обучили две отдельные нейросети: одна распознаёт говорящего, другая сравнивает звуковые спектрограммы.
568 открытий571 показов