Google слила Gemini Omni за 8 дней до Google I/O 2026: разбор утечки
Карточка Gemini Omni появилась в Gemini 11 мая — за восемь дней до Google I/O. Разбираем, что умеет новая модель и почему Google делает ставку на редактирование, а не на генерацию.
Новости Tproger11 мая 2026 года, за восемь дней до Google I/O, пользователи Reddit обнаружили в интерфейсе Gemini карточку новой видеомодели — Gemini Omni. Она не заменяет существующий Veo 3.1 (кодовое имя Toucan): обе модели видны в одной вкладке одновременно. Главное отличие Omni — редактирование видео прямо в чате, а не генерация с нуля.
Кратко
Gemini Omni: что важно знать
- Gemini Omni появился в интерфейсе 11 мая — на восемь дней раньше официального анонса на Google I/O (19 мая 2026).
- Ключевые функции: удаление водяных знаков, замена объектов, переработка сцен по текстовому запросу — всё внутри чата.
- Сырое качество генерации уступает Seedance 2 от ByteDance, но инструменты редактирования конкурентоспособны.
- OpenAI закрыла Sora в апреле 2026 — Omni целится именно в освободившуюся нишу видеоредактирования.
- Доступ через Flash и Pro-тарифы; кредитная система. Две генерации почти полностью расходуют дневной лимит ИИ Pro.
- Максимальная длина клипа в раннем доступе — около 10 секунд.
Как произошла утечка
11 мая 2026 года Reddit-пользователи заметили новую карточку в разделе генерации видео Google Gemini. Текст гласил: «Create with Gemini Omni: meet our new video model, remix your videos, edit directly in chat, try templates, and more». Карточка появилась рядом с Toucan — внутренним именем инструмента на базе Veo 3.1.
Присутствие двух моделей в одной вкладке сигнализирует о стратегии сосуществования, а не замены. Google делает ставку на специализацию: Veo 3.1 — для качественной генерации по промпту, Omni — для итеративного редактирования готовых клипов.
Карточки моделей в Gemini не бывают заглушками: они проходят циклы локализации и пользовательского тестирования. То, что карточка Omni оказалась видимой в production-вкладке, означает: релиз был уже подготовлен к моменту утечки.
Gemini Omni против конкурентов: Veo 3.1, Seedance 2, Runway
Сильная сторона Omni — функции редактирования, которых нет ни у одного конкурента в масштабируемом виде. По сырому качеству генерации картина иная.
Первые тесты
Что работает
Тестировщики с ранним доступом отметили стабильную работу шаблонной генерации: несколько запусков давали воспроизводимые результаты. Видео с математическими формулами рендерилось точно — анимация выглядела естественно.
Инструменты редактирования показали себя лучше, чем ожидалось. Удаление водяных знаков сработало в нескольких тест-кейсах. Замена объектов внутри клипов — с учётом разного освещения — прошла надёжнее, чем рецензенты прогнозировали для первой итерации. Переработка сцен по тексту корректно отрабатывала на коротких клипах.
Стоимость: две генерации видео потратили почти весь дневной лимит тарифа ИИ Pro — сопоставимо с текущим Imagen 3 Pro для изображений.
Что не работает
Главная проблема — сырое качество генерации. В тестах со сценой ужина объекты появлялись в середине клипа без предупреждения: классический артефакт видеодиффузионных моделей, когда механизм временной согласованности «теряет» элементы сцены между кадрами. Seedance 2 от ByteDance по-прежнему лидирует на бенчмарках генерации.
Лимит в 10 секунд в раннем доступе ставит Omni ниже Seedance 2 для сценариев с длинными клипами.
Контекст: пустая ниша после Sora
26 апреля 2026 года OpenAI закрыла Sora. Это убрало с рынка самый узнаваемый потребительский бренд в сегменте видео-ИИ и оставило реальную нишу именно в редактировании: Sora предлагала функции трансформации и вариации, которые конкуренты не закрыли полностью.
Omni с его редактированием в чате целится ровно в этот пробел. Если функциональность работает так, как описано в карточке модели, Omni конкурирует не с Seedance 2 по бенчмаркам, а по рабочему процессу: насколько быстро автор идёт от «у меня есть клип» до «у меня есть нужный клип».
Ставка Google — не переиграть Seedance 2 в генерации. Ставка в том, чтобы сделать редактирование достаточно быстрым, чтобы качество генерации стало вторичным для большинства авторов.
Объединение модальностей
Google сейчас держит Nano Banana 2 (внутреннее кодовое имя имиджевой модели, публично известной как Imagen 3) и Veo 3.1 (видео) в разных вкладках Gemini. Позиционирование Omni как нативной видеомодели — «встроенной в чат», а не как отдельного инструмента — указывает на движение к единому разговорному сеансу, обрабатывающему текст, изображения и видео последовательно, без переключения контекста. Если Omni расширится на неподвижные изображения и текст в одной сессии, Google закроет пробел, которого нет ни у кого из топовых провайдеров.
Что пока неизвестно
- Цена за генерацию. Ставка кредитного потребления в раннем доступе высокая, но конвертация кредитов в рубли/доллары для Omni не публиковалась.
- Лимиты API. Карточка упоминает API-доступ, но квоты и тарифы для разработчиков не раскрыты.
- Обучающие данные. Информации об обучающем датасете не утекло; в контексте споров о правах на видео (включая претензии к Seedance 2 по голливудским материалам) Google предстоит ответить на этот вопрос.
- Долгосрочный роадмап. Сосуществование Veo и Omni — стартовая позиция. Будет ли Veo 3.1 поглощён Omni, выведен или продолжит жить как отдельная линейка — неизвестно.
Вопросы и ответы
Что такое Gemini Omni?
Gemini Omni — новая видеомодель Google, ориентированная на редактирование видео внутри интерфейса Gemini. В отличие от Veo 3.1, которая генерирует видео по промпту с нуля, Omni позволяет удалять водяные знаки, менять объекты и переписывать сцены текстовым запросом прямо в чате.
Заменит ли Omni Veo 3.1?
Нет. Обе модели видны одновременно в одной вкладке Gemini, что указывает на стратегию параллельного существования: Veo 3.1 — для чистой генерации, Omni — для итеративного редактирования.
Чем Gemini Omni лучше конкурентов?
Встроенное редактирование видео в чате — функция, которой нет ни у Seedance 2, ни у Runway Gen-4, ни у Veo 3.1. По сырому качеству генерации Omni уступает Seedance 2 от ByteDance, но выигрывает по рабочему процессу для авторов, работающих с готовыми клипами.
Сколько стоит использование Gemini Omni?
Конкретные цены не объявлены. По данным ранних тестов, две генерации видео расходуют почти весь дневной лимит тарифа ИИ Pro — это сопоставимо с генерацией изображений через Imagen 3 Pro.
Когда будет официальный релиз?
Официальный анонс ожидался на Google I/O 2026 — 19 мая 2026 года. Дата широкой доступности на момент подготовки материала не объявлена.
Итог
Утечка описывает продукт, а не его финальное исполнение. Если редактирование в чате работает так, как описано, Omni заполняет нишу, которую никто из конкурентов не занял. Если артефакты генерации, заметные в ранних тестах, сохранятся в релизе — фрейминг «редактирование прежде всего» окажется способом уйти от бенчмарков, которые Google проиграл бы. Ответ стал известен на Google I/O 2026.
Если у вас подключён тариф Google ИИ Pro — откройте вкладку генерации видео в Gemini: карточка Omni уже может быть видна. Официальный анонс запланирован на Google I/O 2026 (19 мая).
Источники: TestingCatalog, WaveSpeed Blog, AwesomeAgents.