Глубокую нейронную сеть научили распознавать речь и музыку как человек

Глубокую нейронную сеть научили распознавать речь и музыку как человек

Исследователи из Массачусетского технологического института, используя глубокую нейронную сеть, создали модель, выполняющую такие же функциональные задачи на слух, что и человек.

Возможности модели

Модель состоит из множества блоков обработки информации, которые могут обучаться на огромных объемах данных для выполнения поставленных задач. Процессоры, составляющие нейронную сеть, могут быть объединены в архитектуры разными способами, что влияет на производительность модели.

Джош Макдермотт (Josh McDermott) — доцент кафедры нейробиологии и когнитивных наук Массачусетского технологического института отметил, что созданная модель является «машинной системой, умеющей выполнять такие же сенсорные задачи, как и человек».

Исследователи обучили свою нейронную сеть выполнять две слуховые задачи, одна из которых включает речь, а другая музыку. В «речевой задаче» нейронной сети нужно было определить слово в середине записи с человеческой речью. В «музыкальной задаче» требовалось определить жанр воспроизводимой музыки. Каждая аудиозапись сопровождалась фоновым шумом, чтобы сделать задание сложнее и реалистичнее.

После длительного обучения модель научилась распознавать речь и музыку с точностью человека, допуская ошибки лишь в наиболее сложных для восприятия записях.

В будущем авторы планируют разработать модели, умеющие выполнять другие типы слуховых задач, такие как определение местоположения исходящего звука.

Напомним, что в начале февраля 2018 года другая группа исследователей из Массачусетского технологического института разработали метод обучения роботов абстрактно «мыслить».

Источник: MIT News

Ещё интересное для вас:
— Биты, байты, Ада Лавлейс — тест на знание околоIT.
— Level Up — события и курсы, на которых можно поднять свой уровень.
— Работа мечты — лучшие IT-вакансии для вас.