Google добавила в Gemini новую функцию: теперь ИИ может генерировать музыкальные треки длиной до 30 секунд. За это отвечает модель Lyria 3 от Google DeepMind.
Функция уже начала раскатываться в бета-режиме в приложении Gemini. Она доступна пользователям старше 18 лет на восьми языках, включая английский, немецкий, испанский и японский. Подписчики планов AI Plus, Pro и Ultra получат более высокий лимит генераций.
Как это работает
Механика простая: вы описываете идею (жанр, настроение, конкретную ситуацию) или загружаете фото или видео, чтобы задать атмосферу. Gemini генерирует 30-секундный трек, инструментальный или с текстом. Лирику писать не нужно — слова создаются автоматически.
Обложка для трека тоже появляется сама. Ее рисует модель Nano Banana.
Google подчеркивает, что цель — не «создание шедевров», а быстрый способ выразить идею. Такой формат явно больше заточен под соцсети, чем дальнейшее выкладывание на стриминговые платформы.
Что с авторскими правами
Сгенерированные треки получают встроенную цифровую метку SynthID — это невидимый водяной знак, позволяющий определить, что контент создан ИИ Google.
Компания заявляет, что модель обучена создавать оригинальную музыку, а не копировать конкретных исполнителей. Если в промпте упомянуть артиста, Gemini интерпретирует это как «стилистическое вдохновение», а не задачу имитации.
Также внедрены фильтры, проверяющие результат на сходство с существующими произведениями. При подозрении на нарушение прав, контент можно отправить на проверку.
Короткий формат — стратегический выбор
Тридцать секунд был выбран не просто так. Это формат TikTok, Reels и Shorts. В отличие от полноценных музыкальных генераторов, Gemini не пытается заменить студию звукозаписи.
Google скорее предлагает инструмент для быстрых идей: джингл для видео, саундтрек к мему, музыкальный комментарий к фото.