Gemini с режимом Deep Think впервые получил «золото» на Международной математической олимпиаде
Новости
Искусственный интеллект получил золото на Международной математической олимпиаде — Gemini Deep Think решает задачи на уровне лучших школьников мира
206 открытий4К показов
Google DeepMind официально подтвердил: продвинутая версия модели Gemini с режимом Deep Think впервые набрала 35 баллов из 42 возможных на Международной математической олимпиаде (IMO) — и получила золотую медаль. Это первый случай, когда AI-система показала результат на уровне лучших молодых математиков мира.
Международная математическая олимпиада (ММО) – самое престижное в мире соревнование для молодых математиков, проводится ежегодно с 1959 года. Каждую страну представляют шесть лучших математиков, не имеющих высшего образования, которые соревнуются в решении шести исключительно сложных задач по алгебре, комбинаторике, геометрии и теории чисел. Медали вручаются лучшим участникам, при этом только лишь около 8% получают золотую медаль.
В прошлом году объединённые системы AlphaProof и AlphaGeometry 2 от Google DeepMind достигли серебряного стандарта , решив четыре из шести задач и набрав 28 баллов. А вычисления заняли 2,5 дня.
🤖 Зачем ИИ пошёл на олимпиаду?
IMO — не соревнование по шаблонам. Участники решают шесть задач за 4,5 часа по алгебре, геометрии, комбинаторике и теории чисел, где даже формулировки требуют нетривиального понимания. Каждую страну представляют шестеро лучших школьников, отобранных годами тренировок. Google DeepMind решила пять задач из шести.
В 2024 году системы AlphaGeometry и AlphaProof решали задачи IMO, но требовали ручного перевода между формальным языком и естественным. В этом году Gemini Deep Think работал end-to-end: понимал условие задачи на естественном языке, сам генерировал доказательства и укладывался в лимит времени.
🧠 Как Gemini научили мыслить по-олимпиадному?
Gemini работал в режиме Deep Think — это улучшенный pipeline reasoning’а, который:
- исследует параллельно несколько возможных стратегий доказательства;
- учится на огромном датасете реальных решений IMO;
- строит цепочки логических рассуждений, не опираясь на формальные языки;
- использует обучение с подкреплением и инструкции с мета-наставлениями;
- способен превращать язык в структуру — и обратно;
- использует многошаговые рассуждения для решения задач и доказательства теорем.
По сути, это уже не просто языковая модель, а когнитивный ассистент, умеющий строить гипотезы, опровергать и доказывать — почти как человек.
«Решения Gemini были ясными, точными и простыми для понимания. Это один из самых впечатляющих AI-дебютов за всю историю Олимпиады».
Профессор Грегор Долинар, президент Международной математической олимпиады
Почему это важно?
- AI выходит за пределы генерации текста. Он решает задачи, требующие творческого абстрактного мышления.
- Новая парадигма обучения. Модель учится не только на данных, но и на методах решения.
- Фундаментальная математика — следующий рубеж. После кода, картинок и рецептов ИИ начинает осваивать поле, где обычно побеждают гении с олимпиадным складом ума.
Что дальше?
Google DeepMind уже готовит открытый доступ к Gemini Deep Think для математиков и подписчиков AI Ultra. Разработчики уверены: следующий шаг — универсальный ассистент-исследователь, который поможет справиться с нерешёнными задачами науки.
Комментарий от Tproger:
ИИ теперь не «просто решает задачи». Это пример того, как новые архитектуры reasoning + RL дают результат в задачах, с которыми не способно справиться большинство людей.
206 открытий4К показов




