Представлен сервис для распознавания речи Amazon Transcribe
Новости Отредактировано
Новый инструмент из линейки Amazon Web Services предназначен для распознавания речи из аудио- и видеофайлов и преобразования ее в грамотный текст.
616 открытий623 показов
На конференции AWS re:Invent компания представила новый облачный сервис Amazon Transcribe. Он извлекает из аудио- и видеофайлов речь и представляет ее в виде адекватного, грамматически правильного текста.
С помощью API можно запустить процесс всего парой строк кода. Amazon Transcribe конвертирует в текст любой медиафайл, хранящийся в Amazon S3.
Сейчас сервис поддерживает два языка — американский английский и испанский, но разработчики обещают на этом не останавливаться.
Amazon Transcribe возвращает текст с отметками времени для каждого слова, что упрощает поиск по медиафайлу. Сервис работает даже с записями телефонных разговоров, качество которых может быть далеким от идеального.
В ближайшем будущем Amazon обещает добавить поддержку пользовательского словаря и распознавания нескольких голосов. Это пригодится для обработки записей конференций, интервью или телефонных звонков.
616 открытий623 показов