Gemini с режимом Deep Think впервые получил «золото» на Международной математической олимпиаде

Новости

Искусственный интеллект получил золото на Международной математической олимпиаде — Gemini Deep Think решает задачи на уровне лучших школьников мира

212 открытий4К показов

Google DeepMind официально подтвердил: продвинутая версия модели Gemini с режимом Deep Think впервые набрала 35 баллов из 42 возможных на Международной математической олимпиаде (IMO) — и получила золотую медаль. Это первый случай, когда AI-система показала результат на уровне лучших молодых математиков мира.

Международная математическая олимпиада (ММО) – самое престижное в мире соревнование для молодых математиков, проводится ежегодно с 1959 года. Каждую страну представляют шесть лучших математиков, не имеющих высшего образования, которые соревнуются в решении шести исключительно сложных задач по алгебре, комбинаторике, геометрии и теории чисел. Медали вручаются лучшим участникам, при этом только лишь около 8% получают золотую медаль.

В прошлом году объединённые системы AlphaProof и AlphaGeometry 2 от Google DeepMind достигли серебряного стандарта , решив четыре из шести задач и набрав 28 баллов. А вычисления заняли 2,5 дня.

Gemini с режимом Deep Think впервые получил «золото» на Международной математической олимпиаде 1

🤖 Зачем ИИ пошёл на олимпиаду?

IMO — не соревнование по шаблонам. Участники решают шесть задач за 4,5 часа по алгебре, геометрии, комбинаторике и теории чисел, где даже формулировки требуют нетривиального понимания. Каждую страну представляют шестеро лучших школьников, отобранных годами тренировок. Google DeepMind решила пять задач из шести.

В 2024 году системы AlphaGeometry и AlphaProof решали задачи IMO, но требовали ручного перевода между формальным языком и естественным. В этом году Gemini Deep Think работал end-to-end: понимал условие задачи на естественном языке, сам генерировал доказательства и укладывался в лимит времени.

🧠 Как Gemini научили мыслить по-олимпиадному?

Gemini работал в режиме Deep Think — это улучшенный pipeline reasoning’а, который:

исследует параллельно несколько возможных стратегий доказательства;
учится на огромном датасете реальных решений IMO;
строит цепочки логических рассуждений, не опираясь на формальные языки;
использует обучение с подкреплением и инструкции с мета-наставлениями;
способен превращать язык в структуру — и обратно;
использует многошаговые рассуждения для решения задач и доказательства теорем.

По сути, это уже не просто языковая модель, а когнитивный ассистент, умеющий строить гипотезы, опровергать и доказывать — почти как человек.

«Решения Gemini были ясными, точными и простыми для понимания. Это один из самых впечатляющих AI-дебютов за всю историю Олимпиады».

Профессор Грегор Долинар, президент Международной математической олимпиады

Почему это важно?

AI выходит за пределы генерации текста. Он решает задачи, требующие творческого абстрактного мышления.
Новая парадигма обучения. Модель учится не только на данных, но и на методах решения.
Фундаментальная математика — следующий рубеж. После кода, картинок и рецептов ИИ начинает осваивать поле, где обычно побеждают гении с олимпиадным складом ума.

Что дальше?

Google DeepMind уже готовит открытый доступ к Gemini Deep Think для математиков и подписчиков AI Ultra. Разработчики уверены: следующий шаг — универсальный ассистент-исследователь, который поможет справиться с нерешёнными задачами науки.

Комментарий от Tproger:

ИИ теперь не «просто решает задачи». Это пример того, как новые архитектуры reasoning + RL дают результат в задачах, с которыми не способно справиться большинство людей.

212 открытий4К показов

Также рекомендуем

Японский школьник взломал 7 млн аккаунтов через вайб-хакинг с ChatGPT

Японский школьник с помощью ChatGPT взломал 7 млн аккаунтов Kaikatsu Club, создав скрипт для обхода защиты и массовой выгрузки данных

Партнер Microsoft выдавал человеческий аутсорс за ИИ. Теперь стартап с ценой $1,3 млрд банкротится

ИИ-стартап Builder.ai с оценкой $1,3 млрд обанкротился — вместо нейросетей сервис использовал аутсорс, выдавая его за ИИ-платформу

«Я узнал о своей смерти из Google»: как ИИ от Google объявил живого журналиста умершим

ИИ Google ошибочно «убил» журналиста: система AI Overview сообщила о его смерти, несмотря на опровержения самого Барри

«Вайб-кодинг» уничтожает программирование: почему слепо доверять ИИ — плохая идея

Слепое копирование кода из ИИ без понимания его работы — это «вайб-кодинг», который ведет к хаосу в коде, багам и потере навыков