Представлен сервис для распознавания речи Amazon Transcribe

Amazon Transcribe

На конференции AWS re:Invent компания представила новый облачный сервис Amazon Transcribe. Он извлекает из аудио- и видеофайлов речь и представляет ее в виде адекватного, грамматически правильного текста.

С помощью API можно запустить процесс всего парой строк кода. Amazon Transcribe конвертирует в текст любой медиафайл, хранящийся в Amazon S3.

Сейчас сервис поддерживает два языка — американский английский и испанский, но разработчики обещают на этом не останавливаться.

Amazon Transcribe возвращает текст с отметками времени для каждого слова, что упрощает поиск по медиафайлу. Сервис работает даже с записями телефонных разговоров, качество которых может быть далеким от идеального.

В ближайшем будущем Amazon обещает добавить поддержку пользовательского словаря и распознавания нескольких голосов. Это пригодится для обработки записей конференций, интервью или телефонных звонков.

Источник: TechCrunch