Глубокую нейронную сеть научили распознавать речь и музыку как человек

Глубокую нейронную сеть научили распознавать речь и музыку как человек

Исследователи из Массачусетского технологического института, используя глубокую нейронную сеть, создали модель, выполняющую такие же функциональные задачи на слух, что и человек.

Возможности модели

Модель состоит из множества блоков обработки информации, которые могут обучаться на огромных объемах данных для выполнения поставленных задач. Процессоры, составляющие нейронную сеть, могут быть объединены в архитектуры разными способами, что влияет на производительность модели.

Джош Макдермотт (Josh McDermott) — доцент кафедры нейробиологии и когнитивных наук Массачусетского технологического института отметил, что созданная модель является «машинной системой, умеющей выполнять такие же сенсорные задачи, как и человек».

Исследователи обучили свою нейронную сеть выполнять две слуховые задачи, одна из которых включает речь, а другая музыку. В «речевой задаче» нейронной сети нужно было определить слово в середине записи с человеческой речью. В «музыкальной задаче» требовалось определить жанр воспроизводимой музыки. Каждая аудиозапись сопровождалась фоновым шумом, чтобы сделать задание сложнее и реалистичнее.

После длительного обучения модель научилась распознавать речь и музыку с точностью человека, допуская ошибки лишь в наиболее сложных для восприятия записях.

В будущем авторы планируют разработать модели, умеющие выполнять другие типы слуховых задач, такие как определение местоположения исходящего звука.

Напомним, что в начале февраля 2018 года другая группа исследователей из Массачусетского технологического института разработали метод обучения роботов абстрактно «мыслить».

Источник: MIT News

Ещё интересное для вас:
Тест: что вы знаете о работе мозга?
Что посмотреть и куда сходить разработчку — ближайшие события