Перетяжка, Премия ТПрогер, 13.11
Перетяжка, Премия ТПрогер, 13.11
Перетяжка, Премия ТПрогер, 13.11

Gemini с режимом Deep Think впервые получил «золото» на Международной математической олимпиаде

Новости

Искусственный интеллект получил золото на Международной математической олимпиаде — Gemini Deep Think решает задачи на уровне лучших школьников мира

206 открытий4К показов
Gemini с режимом Deep Think впервые получил «золото» на Международной математической олимпиаде

Google DeepMind официально подтвердил: продвинутая версия модели Gemini с режимом Deep Think впервые набрала 35 баллов из 42 возможных на Международной математической олимпиаде (IMO) — и получила золотую медаль. Это первый случай, когда AI-система показала результат на уровне лучших молодых математиков мира.

Международная математическая олимпиада (ММО) – самое престижное в мире соревнование для молодых математиков, проводится ежегодно с 1959 года. Каждую страну представляют шесть лучших математиков, не имеющих высшего образования, которые соревнуются в решении шести исключительно сложных задач по алгебре, комбинаторике, геометрии и теории чисел. Медали вручаются лучшим участникам, при этом только лишь около 8% получают золотую медаль.

В прошлом году объединённые системы AlphaProof и AlphaGeometry 2 от Google DeepMind достигли серебряного стандарта , решив четыре из шести задач и набрав 28 баллов. А вычисления заняли 2,5 дня.

Gemini с режимом Deep Think впервые получил «золото» на Международной математической олимпиаде 1

🤖 Зачем ИИ пошёл на олимпиаду?

IMO — не соревнование по шаблонам. Участники решают шесть задач за 4,5 часа по алгебре, геометрии, комбинаторике и теории чисел, где даже формулировки требуют нетривиального понимания. Каждую страну представляют шестеро лучших школьников, отобранных годами тренировок. Google DeepMind решила пять задач из шести.

В 2024 году системы AlphaGeometry и AlphaProof решали задачи IMO, но требовали ручного перевода между формальным языком и естественным. В этом году Gemini Deep Think работал end-to-end: понимал условие задачи на естественном языке, сам генерировал доказательства и укладывался в лимит времени.

🧠 Как Gemini научили мыслить по-олимпиадному?

Gemini работал в режиме Deep Think — это улучшенный pipeline reasoning’а, который:

  • исследует параллельно несколько возможных стратегий доказательства;
  • учится на огромном датасете реальных решений IMO;
  • строит цепочки логических рассуждений, не опираясь на формальные языки;
  • использует обучение с подкреплением и инструкции с мета-наставлениями;
  • способен превращать язык в структуру — и обратно;
  • использует многошаговые рассуждения для решения задач и доказательства теорем.

По сути, это уже не просто языковая модель, а когнитивный ассистент, умеющий строить гипотезы, опровергать и доказывать — почти как человек.

«Решения Gemini были ясными, точными и простыми для понимания. Это один из самых впечатляющих AI-дебютов за всю историю Олимпиады».

Профессор Грегор Долинар, президент Международной математической олимпиады

Почему это важно?

  • AI выходит за пределы генерации текста. Он решает задачи, требующие творческого абстрактного мышления.
  • Новая парадигма обучения. Модель учится не только на данных, но и на методах решения.
  • Фундаментальная математика — следующий рубеж. После кода, картинок и рецептов ИИ начинает осваивать поле, где обычно побеждают гении с олимпиадным складом ума.

Что дальше?

Google DeepMind уже готовит открытый доступ к Gemini Deep Think для математиков и подписчиков AI Ultra. Разработчики уверены: следующий шаг — универсальный ассистент-исследователь, который поможет справиться с нерешёнными задачами науки.

Комментарий от Tproger:

ИИ теперь не «просто решает задачи». Это пример того, как новые архитектуры reasoning + RL дают результат в задачах, с которыми не способно справиться большинство людей.

Следите за новыми постами
Следите за новыми постами по любимым темам
206 открытий4К показов