🔥 Google Genie 3 научился создавать 3D-миры, по которым можно прогуляться в 720p@24fps

Новости

В ближайшие годы подобное может подхватить и игровая индустрия...

298 открытий3К показов

Google DeepMind представила Genie 3 — новую версию своего ИИ, способного генерировать интерактивные 3D-миры по текстовому описанию.

Теперь пользователи могут «прогуляться» по созданным мирам в разрешении 720p при 24 кадрах в секунду и с сохранением визуальной и физической целостности сцены на протяжении нескольких минут.

Если раньше модели могли генерировать лишь видео или фрагменты виртуальных пространств, то Genie 3 позволяет взаимодействовать с миром в реальном времени, включая свободную навигацию и реакцию на действия пользователя.

Что умеет Genie 3

Модель способна:

воспроизводить физику — от отражений на воде до ветра и взаимодействия с поверхностью;
генерировать правдоподобные ландшафты — от японских садов до вулканов и побережий;
создавать фантастические сцены — например, парящего острова, порталов в пустыню или сказочных лесов;
переносить пользователя в прошлое или другие места — от Древней Греции до улиц Венеции;
поддерживать «chain-of-memory» — помнить, что происходило в мире несколько минут назад, и обеспечивать целостность среды при повторном возвращении в локации;
интегрировать «promptable events» — то есть менять погоду, добавлять объекты или события по текстовому запросу.

ИИ для агентов и обучения

Genie 3 не просто красивый генератор. Это модель, с которой уже взаимодействуют обучающиеся агенты.

Например, агент SIMA от DeepMind решает задачи внутри этих миров, отправляя навигационные команды.

Genie 3 не знает целей агента, а лишь «пишет» развитие мира в ответ на его действия. Это делает симуляции полезными для тестирования и развития будущих автономных систем.

В чём техническая сложность?

Генерация мира — авторегрессивная, кадр за кадром, с учётом всей предыдущей траектории перемещения.

Чтобы пользователь мог вернуться в ранее посещённое место и увидеть его таким же — модель должна вспомнить и восстановить детали ландшафта и окружения. Это требует огромной вычислительной мощности, особенно при работе в 24 fps в реальном времени.

Пока не AGI, но шаг в ту сторону

Genie 3 не претендует на полную имитацию реальности — модель не способна точно воспроизвести реальные географические объекты, ограничена в действиях агентов, а продолжительность взаимодействия пока не превышает нескольких минут.

Но даже так, это один из самых продвинутых подобных ИИ в открытом доступе.

Ответственность и осторожность

DeepMind подчёркивает, что Genie 3 доступен пока лишь в рамках ограниченного исследовательского превью — для академиков и разработчиков, чтобы собрать отзывы и лучше оценить риски.

298 открытий3К показов

Также рекомендуем

В South Park вышла серия «Deep Learning», посвящённая ChatGPT

Вышла новая серия Южного Парка, посвящённая языковой модели ChatGPT. Нейросеть также написала часть сценария.

🔥 Робот Google научился побеждать людей в настольном теннисе

🔥 Робот Google научился побеждать людей в настольном теннисе

Учёные создали робота, который выиграл 45% матчей против людей в настольный теннис. Эта разработка представляет собой важный шаг в применении искусственного интеллекта в спорте и может стать новым тренажёром для игроков всех уровней

OpenAI, Oracle и SoftBank вложат $500 млрд в развитие ИИ в США

OpenAI, Oracle и SoftBank вложат $500 млрд в развитие ИИ в США

Крупнейшие IT-гиганты США — OpenAI, Oracle и SoftBank — инвестируют $500 млрд в проект Stargate, развивая ИИ и создавая 100 тыс рабочих мест в США

🔥 Релиз Grml 2025.08: отказ от Debian 10, чистка устаревших пакетов и улучшения в grml-zshrc

🔥 Релиз Grml 2025.08: отказ от Debian 10, чистка устаревших пакетов и улучшения в grml-zshrc

Grml 2025.08 вышел на базе Debian 13 с ядром 6.12.41: отказ от Debian 10 и старых скриптов, улучшения grml-zshrc и обновление пакетов