Написать пост

Представлен сервис для распознавания речи Amazon Transcribe

Аватар Екатерина Никитина

Новый инструмент из линейки Amazon Web Services предназначен для распознавания речи из аудио- и видеофайлов и преобразования ее в грамотный текст.

На конференции AWS re:Invent компания представила новый облачный сервис Amazon Transcribe. Он извлекает из аудио- и видеофайлов речь и представляет ее в виде адекватного, грамматически правильного текста.

С помощью API можно запустить процесс всего парой строк кода. Amazon Transcribe конвертирует в текст любой медиафайл, хранящийся в Amazon S3.

Сейчас сервис поддерживает два языка — американский английский и испанский, но разработчики обещают на этом не останавливаться.

Превью видео oVo-IKiM8Xk

Amazon Transcribe возвращает текст с отметками времени для каждого слова, что упрощает поиск по медиафайлу. Сервис работает даже с записями телефонных разговоров, качество которых может быть далеким от идеального.

В ближайшем будущем Amazon обещает добавить поддержку пользовательского словаря и распознавания нескольких голосов. Это пригодится для обработки записей конференций, интервью или телефонных звонков.

Следите за новыми постами
Следите за новыми постами по любимым темам
611 открытий611 показов