GPT-5.5 Instant: −52,5% галлюцинаций на high-stakes
Новая default-модель ChatGPT обещает на 52,5% меньше галлюцинаций в медицине, праве и финансах и более короткие ответы без лишних эмодзи. Через API доступна как chat-latest.
Новости TprogerУ ChatGPT с 5 мая 2026 года новая default-модель — GPT-5.5 Instant, она заменяет GPT-5.3 Instant. Главное обещание OpenAI: на запросах, где ошибка стоит дорого (медицина, право, финансы — компания называет такие промпты high-stakes), модель выдаёт на 52,5% меньше выдуманных фактов. На диалогах, которые пользователи сами раньше помечали как ошибочные, число неточностей упало на 37,3%.
Default-модель ChatGPT — это то, что видят сотни миллионов пользователей бесплатной версии. Поэтому даже относительно небольшие улучшения качества дают заметный совокупный эффект на каждодневное общение с ChatGPT.
Главное
Ключевые выводы
Что меняется в ChatGPT с GPT-5.5 Instant
- Снижение галлюцинаций: −52,5% выдуманных утверждений на high-stakes-промптах (медицина, право, финансы); −37,3% неточностей на разговорах, помеченных пользователями как ошибочные.
- Бенчмарки: AIME 2025 — 81,2 против 65,4 у GPT-5.3 Instant; MMMU-Pro (мультимодальное рассуждение) — 76 против 69,2.
- Стиль ответов: короче, по делу, меньше навязчивых уточняющих вопросов и эмодзи. По описанию OpenAI — менее многословные ответы без избыточного форматирования.
- Персонализация: GPT-5.5 Instant умеет искать по прошлым диалогам, файлам и Gmail (для пользователей Plus и Pro на вебе, мобильные приложения — позже). Источники памяти теперь видны и редактируются пользователем.
- Доступ: всем пользователям ChatGPT бесплатно; через API — как
chat-latest. GPT-5.3 остаётся доступной для платных подписчиков ещё три месяца.
Главная цифра: −52,5% галлюцинаций на high-stakes
OpenAI делает основной фокус анонса на снижении галлюцинаций — придумывания фактов, которых в реальности нет. На внутреннем наборе high-stakes-промптов (медицинских, юридических, финансовых) GPT-5.5 Instant выдаёт в среднем на 52,5% меньше выдуманных утверждений, чем GPT-5.3 Instant. На разговорах, которые пользователи сами помечали как фактически неверные, число неточностей в новой модели снизилось на 37,3%.
Это не самый высокий показатель снижения галлюцинаций, который OpenAI когда-либо называла, но он целевой: компания подчёркивает, что улучшение сделано именно в тех областях, где правильный ответ критичен — потому что некачественный совет в финансах или медицине обходится дороже, чем неточность в рецепте салата.
Бенчмарки: математика и мультимодальность
- AIME 2025 (American Invitational Mathematics Examination — олимпиадный набор по математике): GPT-5.5 Instant — 81,2, GPT-5.3 Instant — 65,4. Разрыв в 16 пунктов.
- MMMU-Pro (мультимодальное рассуждение с изображениями + текст): 76 против 69,2.
- STEM-задачи и анализ изображений — улучшены в общем сравнении, без конкретных публичных цифр.
Сама OpenAI в анонсе показывает наглядный пример: на задаче с квадратным уравнением GPT-5.3 Instant ошибается в алгебре, приходит к выводу «решений нет» и останавливается. GPT-5.5 Instant тоже сначала подтверждает неверный ход, но при подстановке обнаруживает несоответствие, пересматривает разложение и доходит до правильного ответа через формулу корней.
Память и персонализация
Второй акцент анонса — расширение «памяти» ChatGPT. GPT-5.5 Instant умеет обращаться к поисковому инструменту, чтобы подтянуть в ответ контекст из прошлых разговоров, загруженных файлов и подключённого Gmail. Сначала это получают пользователи Plus и Pro на вебе, потом фича дойдёт до мобильных приложений и до тарифов Free, Go, Business и Enterprise.
Параллельно меняется работа с «источниками памяти»: теперь во всех моделях ChatGPT показывает, на какой именно прошлый диалог, файл или письмо опирался ответ. Эти источники можно удалить или поправить, если ассистент опирался на неверную информацию. Если вы делитесь чатом с кем-то, источники памяти у получателя не видны — приватные данные не утекают вместе со ссылкой.
Стиль: меньше воды и эмодзи
Помимо точности, OpenAI пишет, что новая модель отвечает короче и по делу, не задаёт лишних уточняющих вопросов и не выкладывает ответы блоками с тяжёлым форматированием и лишними эмодзи (в оригинале — gratuitous emojis). На примере из анонса GPT-5.3 Instant отвечал на запрос «как сказать коллеге, чтобы поменьше болтал» развёрнутым эссе с четырьмя сценариями, эмодзи и шутками; GPT-5.5 Instant даёт более лаконичный совет.
Что важно разработчикам
Через API GPT-5.5 Instant доступна как алиас chat-latest — то есть запросы на эту модель всегда уходят на текущую default-модель ChatGPT, и при следующем апдейте OpenAI алиас тоже переключится. Если нужен стабильный pinned-id для прод-интеграций, OpenAI предлагает явные версии. GPT-5.3 остаётся в платных аккаунтах ещё три месяца — это объявленное окно для миграции прод-кода без риска поломки поведения. После окна старая модель уйдёт в архив.
Контекст: что было с GPT-4o
OpenAI за последний год убедилась, что снятые с поддержки модели у некоторых пользователей вызывают сильную эмоциональную реакцию. Когда GPT-4o уводили в архив, под петициями подписывались десятки тысяч человек, описывая модель как «лучшего друга» или «зеркало». Несмотря на это, GPT-4o выключили в феврале 2026.
С GPT-5.3 Instant OpenAI прямо называет окно — три месяца, и объявляет это в день релиза новой default-модели. Это полезный сигнал и для тех, кто строит на API: можно планировать миграцию интеграций, а не узнавать о deprecation постфактум.
Частые вопросы
Что значит «default-модель» в ChatGPT?
Это та модель, которая отвечает на ваши сообщения, если вы не выбрали другую вручную. Большинство пользователей бесплатной и базовой подписки никогда не лезут в селектор моделей — им важен именно default. До 5 мая 2026 это был GPT-5.3 Instant, теперь — GPT-5.5 Instant.
Доступно ли это в России?
Прямой доступ к ChatGPT и API OpenAI из России официально не работает; пользователи обычно ходят через VPN или зарубежные прокси. GPT-5.5 Instant раздают всем существующим пользователям — отдельной активации не нужно. Если вы уже как-то заходите в ChatGPT, default-модель просто обновится.
52,5% — это много или мало?
Цифра говорит о снижении на high-stakes-запросах (медицина, право, финансы), не о всех галлюцинациях вообще. Это значит, что в критичных для решения областях ответ стал примерно вдвое реже содержать выдуманные факты. На бытовых вопросах эффект, скорее всего, слабее — там и базовый уровень галлюцинаций ниже.
Как именно работает поиск по прошлым диалогам и Gmail?
Модель решает, нужен ли ей контекст из вашей памяти, и при необходимости вызывает поисковый инструмент: ищет по сохранённым разговорам, загруженным файлам и Gmail, если он подключён. Источники видны в ответе, и их можно удалить или поправить вручную.
Стоит ли мигрировать прод-интеграции на chat-latest сразу?
Не обязательно. chat-latest — это «всегда самая свежая default»-модель, что удобно для прототипов, но опасно для продакшена: поведение меняется без вашего ведома. Для продакшена надёжнее закреплять конкретную версию (gpt-5.5) и обновляться по плану. Окно совместимости с GPT-5.3 — три месяца, времени на тестирование достаточно.
Выводы
GPT-5.5 Instant — точечный, не громкий релиз. OpenAI не анонсирует прорыв в фундаментальных способностях, а делает default-модель надёжнее в трёх чувствительных доменах и в целом приятнее в общении: короче, без лишних вопросов, без избыточного форматирования.
Для пользователя ChatGPT это значит, что качество дефолтных ответов выросло без всяких настроек — модель просто обновилась. Для разработчика — новый default через API chat-latest и три месяца окна, чтобы оттестировать поведение и решить, переключаться ли с GPT-5.3 на GPT-5.5.
Анонс OpenAI — на openai.com/index/gpt-5-5-instant. Разбор от TechCrunch — здесь.