Google открыла доступ к Cloud Speech API, лежащей в основе Google Ассистента технологии распознавания речи

Новости Отредактировано

Технология распознавания речи Cloud Speech API, используемая в Google Ассистенте, получила обновление и стала доступна разработчикам.

8К открытий8К показов

С этого дня независимые разработчики получили доступ к Cloud Speech API, технологии распознавания речи, на которой основаны продукты Google. Продукт, получивший обновление, теперь доступен в Google Cloud.

Открытая бета-версия Cloud Speech была выпущена прошлым летом. Эта технология с простым API позволяет разработчикам преобразовывать аудио в текст. Модели нейронной сети могут распознавать более 80 языков и диалектов, а готовая транскрипция появляется сразу после проговаривания текста.

API построен на базе технологии, которая обеспечивает функцию распознавания речи в Google Assistant, Search и Now, однако в новой версии были внесены изменения для адаптации технологии под нужды пользователей Cloud.

Чем отличается новая версия Cloud Speech API?

Благодаря отзывам разработчиков команда Google смогла повысить точность транскрипции продолжительных аудиозаписей и ускорить процесс обработки данных в 3 раза по сравнению с первоначальной версией. Также была добавлена поддержка других аудиоформатов, включая WAV, OPUS и Speex.

По статистике, раньше этот API использовался чаще всего для управления приложениями и устройствами с помощью голосового поиска, речевых команд и голосового меню. Но Cloud Speech может быть использован в совершенно разных IoT-устройствах, включая автомобили, телевизоры, колонки и, конечно, телефоны и ПК.

Среди частых случаев применения технологии стоит отметить её использование в организациях для анализа работы колл-центров, отслеживания общения с клиентами и повышения продаж.

8К открытий8К показов

Также рекомендуем

Искать и покупать товары теперь можно прямо внутри ChatGPT

OpenAI добавила поиск и покупку товаров в ChatGPT — теперь можно сравнивать цены, читать отзывы и оформлять заказы прямо в чате

Microsoft вернулась к найму после года увольнений. Но теперь ИИ решает, кого брать, а кого — нет

Microsoft снова нанимает после массовых сокращений, но теперь ИИ решает, кого брать. Компания делает ставку на AI-first сотрудников

Что нового в октябрьских обновлениях Google System

Октябрьские обновления Google System приносят Play services v25.39 и Play Store v48.3: Quick Start для детских аккаунтов, улучшенный фильтр чувствительного контента в видео, апгрейд «Не беспокоить за рулём» и обновлённые иконки Play Protect. Как проверить версии и обновиться.

Какие есть паттерны в React и для чего они нужны: часть 1

В этой части Юсуп Изрипов рассказывает, что такое Container & Presentational Components, Higher-Order Component (HOC) и паттерн Render Props в React и что с ними делать.