Голосовой deep fake: исследователи из Facebook научили алгоритм подражать речи человека

Новости

MelNet анализирует спектрограммы аудиодорожек обычных выступлений на TED Talks, подмечает присущие спикеру особенности речи и воспроизводит короткие реплики

653 открытий658 показов

Похоже, настало время аудио дип-фейков. Исследователи из группы Facebook AI Research разработали алгоритм MelNet, который синтезирует речь со свойственными конкретному человеку характеристиками. К примеру, он научился подражать голосу Билла Гейтса.

MelNet анализирует спектрограммы аудиодорожек обычных выступлений на TED Talks, подмечает особенности речи, присущие спикеру, и воспроизводит короткие реплики.

Как раз длиной реплик и ограничены возможности алгоритма. Короткие фразы он воспроизводит очень близко к оригиналу. Однако интонация человека меняется, когда он говорит на разные темы, с разным настроением, разной подачей. Подражать этому алгоритм пока не умеет, поэтому длинные предложения звучат искусственно.

Издание MIT Technology Review отмечает, что даже такой алгоритм может сильно повлиять на сервисы вроде голосовых ботов. Там как раз всё общение сводится к обмену короткими репликами.

Подобный подход — анализ спектрограмм речи — использовали учёные из Google AI при работе над алгоритмом Translatotron. Этот ИИ умеет переводить фразы с одного языка на другой, сохраняя особенности речи говорящего.

653 открытий658 показов

Также рекомендуем

Google представила CodeMender — ИИ, который самостоятельно исправляет уязвимости в коде

Google запустила CodeMender — ИИ, который сам находит и исправляет уязвимости в коде, создаёт патчи и делает ПО безопаснее в реальном времени

Нейросети для отчета по практике: лучшие помощники ИИ для написания отчета по практике

Полный список нейросетей для написания отчета по практике. Лучшие сервисы искусственного интеллекта для генерации отчета после практических работ.

Инженер загрузил 187 000 порно-файлов на сервер властей США — и потерял допуск к ядерной программе

Инженер DOE США лишился доступа к ядерным секретам после того, как случайно загрузил 187 000 порно-файлов на сервер правительства

Нейросети для написания НИР: ИИ-сервисы для научно-исследовательской работы

Полный список нейросетей для генерации НИР. Лучшие сервисы искусственного интеллекта, которые помогут написать научно-исследовательскую работу. Обзор функционала, стоимости и преимуществ.