Google выпустила Translatotron 2 — улучшенный ИИ для синхронного перевода устной речи. Теперь его нельзя использовать для дипфейка

Translatotron — это ИИ-алгоритм от Google AI, который синхронно переводит устную речь с одного языка на другой. Для этого ему не нужно использовать текстовую расшифровку, как это делают классические алгоритмы.

Первую версию ИИ Translatotron представили в мае 2019 года. 

Раньше можно было создать дипфейк с помощью технологии

В первой версии Translatotron был один существенный недостаток — технологией можно было злоупотреблять для создания дипфейков. 

Дело в том, что Translatotron умеет генерировать голос для озвучки переведённых фраз. Этой функцией могли воспользоваться мошенники. 

Теперь так не получится

В Translatotron 2 разработчики решили проблему злоупотребления возможностями алгоритма.

Теперь ИИ сохраняет оригинальный голос говорящего. Это затрудняет создание дипфейков с помощью Translatotron.

Модель Translatotron 2, которая переводит испанскую речь в английскую

Что ещё нового

За 2 года Google улучшила качество перевода и «естественность» речи. Например, в озвучке стало гораздо меньше помех и зажёванных слов. 

Ещё мощно прокачали производительность алгоритма. 

Послушать примеры перевода → 

Источник: MarkTechPost

***

«Яндекс» уже внедрила технологию синхронного перевода в свой браузер для русского дубляжа видео на YouTube в режиме реального времени.   

Хинт для программистов: если зарегистрируетесь на соревнования Huawei Cup, то бесплатно получите доступ к онлайн-школе для участников. Можно прокачаться по разным навыкам и выиграть призы в самом соревновании.

Перейти к регистрации