Google обновила Cloud Speech API, добавив поддержку 30 языков

Cloud Speech API

Cloud Speech API, инструмент, использующий нейронные сети для распознавания речи, был выпущен компанией Google в 2016 году. Компания открыла доступ к сервису в апреле 2017 года, а в понедельник, 14 августа, сервис получил крупное обновление. 

Что нового в Cloud Speech API?

Наиболее значимой является поддержка 30 новых языков. До обновления сервис уже поддерживал 89, при этом некоторые из них являются лишь вариациями других. Среди новых языков есть грузинский, армянский, азербайджанский и латышский. Компания утверждает, что суммарно обновление пригодится примерно миллиарду человек.

Кроме того, Google представила и несколько новых функций. Появилась возможность фиксировать время произнесения каждого слова. Данная функция будет полезна журналистам и исследователям, так как уменьшит время проверки интервью. Сооснователь компании Happy Scribe Андре Басти отметил:

Возможность синхронизировать воспроизведение аудио и текста существенно уменьшает время вычитки сгенерированных текстов.

Лимит длительности каждой записи увеличился с 80 минут до 3 часов. Кроме того, можно подать заявку на дополнительное увеличение этого показателя.

Ценовая политика не изменилась: разработчики по-прежнему могут воспользоваться обработкой 60 минут аудио бесплатно. Каждые последующие 15 секунд стоят $0,006.

Сама Google использует API, например, в клавиатуре Gboard и голосовом поиске. Эти сервисы уже обновились, получив последнюю реализацию Cloud Search API, а другие сервисы, основанные на этой технологии, получат обновление в ближайшем будущем.

Источник: TechCrunch