Google обновила Cloud Speech API, добавив поддержку 30 языков

Новости

Google обновила нейросетевой API для распознавания речи. Cloud Speech API получил поддержку 30 новых языков и временных отметок.

499 открытий511 показов

Cloud Speech API, инструмент, использующий нейронные сети для распознавания речи, был выпущен компанией Google в 2016 году. Компания открыла доступ к сервису в апреле 2017 года, а в понедельник, 14 августа, сервис получил крупное обновление.

Что нового в Cloud Speech API?

Наиболее значимой является поддержка 30 новых языков. До обновления сервис уже поддерживал 89, при этом некоторые из них являются лишь вариациями других. Среди новых языков есть грузинский, армянский, азербайджанский и латышский. Компания утверждает, что суммарно обновление пригодится примерно миллиарду человек.

Кроме того, Google представила и несколько новых функций. Появилась возможность фиксировать время произнесения каждого слова. Данная функция будет полезна журналистам и исследователям, так как уменьшит время проверки интервью. Сооснователь компании Happy Scribe Андре Басти отметил:

Возможность синхронизировать воспроизведение аудио и текста существенно уменьшает время вычитки сгенерированных текстов.

Лимит длительности каждой записи увеличился с 80 минут до 3 часов. Кроме того, можно подать заявку на дополнительное увеличение этого показателя.

Ценовая политика не изменилась: разработчики по-прежнему могут воспользоваться обработкой 60 минут аудио бесплатно. Каждые последующие 15 секунд стоят $0,006.

Сама Google использует API, например, в клавиатуре Gboard и голосовом поиске. Эти сервисы уже обновились, получив последнюю реализацию Cloud Search API, а другие сервисы, основанные на этой технологии, получат обновление в ближайшем будущем.

499 открытий511 показов

Также рекомендуем

🔥 Павел Дуров: у меня 106 детей, Telegram не продается, а брат создает «убийцу ChatGPT»

Павел Дуров заявил, что у него 106 детей, мессенджер Telegram не продаётся, а его брат создаёт ИИ, способный превзойти ChatGPT

Как экономить на облаке: считаем деньги правильно

Пошагово объясняем, как компании выстраивают учет затрат в облаке, ставят теги и снижают расходы на 20–30% без потери производительности.

OpenAI и Anthropic объединились для создания открытых ИИ-агентов под эгидой Linux Foundation

OpenAI и Anthropic создали Agentic AI Foundation под Linux Foundation, объединив MCP, Goose и AGENTS.md в единый стандарт ИИ-агентов

🔥 ИИ-модель s1, созданная за $50 и 26 минут, оказалась умнее ChatGPT в математике

ИИ-модель s1, обученная за $50 и 26 минут, обошла ChatGPT в математике. Это ставит под вопрос необходимость миллиардных вложений в ИИ