Baidu решила проблему расшифровки аудиозаписей при помощи ИИ

Почти каждый интервьюер скажет, что одной из худших частей его работы является текстовая расшифровка аудиозаписей. Перевод даже короткой беседы в текстовый формат может занять часы, и это действительно неудобно. Но китайская компания Baidu придумала подход к решению этой проблемы.

Она выпустила бета-версию SwiftScribe — приложения, которое использует нейронную сеть для транскрибирования аудиозаписей. Оно не только предоставляет относительно корректный текст, но и учится на исправлениях пользователей. Пока что приложение находится в статусе закрытой беты, в которой участвуют около полусотни приглашённых Baidu специалистов.

Но мы же здесь не журналисты, как оно поможет нам?

Безусловно, инструмент для расшифровки текста при помощи ИИ пригодится не только журналистам или полицейским. Её можно будет использовать, например, для улучшения работы голосовой почты и голосового общения с компьютерами в целом.

Источник: Engadget