Глубокую нейронную сеть научили распознавать речь и музыку как человек

Глубокая нейронная сеть умеет выполнять такие же сенсорные задачи, что и человек. В будущем модель научат определять местоположение исходящего звука.

Исследователи из Массачусетского технологического института, используя глубокую нейронную сеть, создали модель, выполняющую такие же функциональные задачи на слух, что и человек.

Возможности модели

Модель состоит из множества блоков обработки информации, которые могут обучаться на огромных объемах данных для выполнения поставленных задач. Процессоры, составляющие нейронную сеть, могут быть объединены в архитектуры разными способами, что влияет на производительность модели.

Джош Макдермотт (Josh McDermott) — доцент кафедры нейробиологии и когнитивных наук Массачусетского технологического института отметил, что созданная модель является «машинной системой, умеющей выполнять такие же сенсорные задачи, как и человек».

Исследователи обучили свою нейронную сеть выполнять две слуховые задачи, одна из которых включает речь, а другая музыку. В «речевой задаче» нейронной сети нужно было определить слово в середине записи с человеческой речью. В «музыкальной задаче» требовалось определить жанр воспроизводимой музыки. Каждая аудиозапись сопровождалась фоновым шумом, чтобы сделать задание сложнее и реалистичнее.

После длительного обучения модель научилась распознавать речь и музыку с точностью человека, допуская ошибки лишь в наиболее сложных для восприятия записях.

В будущем авторы планируют разработать модели, умеющие выполнять другие типы слуховых задач, такие как определение местоположения исходящего звука.

Напомним, что в начале февраля 2018 года другая группа исследователей из Массачусетского технологического института разработали метод обучения роботов абстрактно «мыслить».

873 открытий875 показов

Также рекомендуем

За и против внедрения ИИ

В этой статье помогаем ускорить ознакомление с основными типами AI и показываем принципы принятия решений по внедрению AI.

10 плагинов ChatGPT на каждый день

Составили подборку из 10 плагинов ChatGPT Plus, которые можно использовать в ежедневной работе. Они наверняка повысят вашу продуктивность.

Дата-аналитик и ML-инженер: разбираем обязанности специалистов

Рассказываем, чем занимается ML-инженер на примере задач в Дзене и разбираемся, как с этим связан дата-аналитик.

Как работают нейросети и в каких областях скоро заменят людей

Рассказали, как в скором времи нейросети вроде ChatGPT заменят людей, какую угрозу кибербезопасности они представляют и как влияют на школы.