Написать пост

Глубокую нейронную сеть научили распознавать речь и музыку как человек

Аватар Инна Шхагошева

Глубокая нейронная сеть умеет выполнять такие же сенсорные задачи, что и человек. В будущем модель научат определять местоположение исходящего звука.

Исследователи из Массачусетского технологического института, используя глубокую нейронную сеть, создали модель, выполняющую такие же функциональные задачи на слух, что и человек.

Возможности модели

Модель состоит из множества блоков обработки информации, которые могут обучаться на огромных объемах данных для выполнения поставленных задач. Процессоры, составляющие нейронную сеть, могут быть объединены в архитектуры разными способами, что влияет на производительность модели.

Джош Макдермотт (Josh McDermott) — доцент кафедры нейробиологии и когнитивных наук Массачусетского технологического института отметил, что созданная модель является «машинной системой, умеющей выполнять такие же сенсорные задачи, как и человек».

Исследователи обучили свою нейронную сеть выполнять две слуховые задачи, одна из которых включает речь, а другая музыку. В «речевой задаче» нейронной сети нужно было определить слово в середине записи с человеческой речью. В «музыкальной задаче» требовалось определить жанр воспроизводимой музыки. Каждая аудиозапись сопровождалась фоновым шумом, чтобы сделать задание сложнее и реалистичнее.

После длительного обучения модель научилась распознавать речь и музыку с точностью человека, допуская ошибки лишь в наиболее сложных для восприятия записях.

В будущем авторы планируют разработать модели, умеющие выполнять другие типы слуховых задач, такие как определение местоположения исходящего звука.

Напомним, что в начале февраля 2018 года другая группа исследователей из Массачусетского технологического института разработали метод обучения роботов абстрактно «мыслить».

Следите за новыми постами
Следите за новыми постами по любимым темам
873 открытий874 показов