Claude Opus 4.8: рекордные бенчмарки и дешёвый fast mode

Флагманская модель Anthropic обновилась до версии 4.8. Улучшения коснулись агентных задач, честности самооценки и цен на ускоренный режим. Разбираем, что изменилось и почему разработчикам это важно.

Обложка: Claude Opus 4.8: рекордные бенчмарки и дешёвый fast mode

Anthropic обновила флагманскую модель Claude Opus до версии 4.8. Новинка работает надёжнее в агентных сценариях, честнее оценивает собственные ошибки и при этом сохраняет прежнюю цену за токены. Для разработчиков главное новшество — режим fast mode стал втрое дешевле.

Claude Opus 4.8 — это топовая модель семейства Claude, ориентированная на сложные задачи: программирование, юридический анализ, глубокое исследование и многошаговые рабочие процессы. Версия 4.8 пришла на смену 4.7 и доступна уже сегодня через API и веб-интерфейс claude.ai.

Ключевые выводы

Claude Opus 4.8 вышел 28 мая 2026 года и заменил версию 4.7 по той же цене.

Fast mode ускоряет работу в 2,5 раза и стоит втрое меньше, чем раньше.

Модель показывает рекордные результаты на бенчмарках кодирования, юридических задач и компьютерного использования.

В Claude Code появились динамические рабочие процессы с сотнями параллельных подагентов.

Opus 4.8 в 4 раза реже пропускает собственные ошибки в коде, чем предшественник.

Что улучшилось

По словам Anthropic, ключевое изменение — надёжность в агентных задачах. Ранние тестировщики отмечают, что модель задаёт правильные уточняющие вопросы, замечает неточности в планах и не пытается «продавить» заведомо слабое решение. На бенчмарке Super-Agent Opus 4.8 стал единственной моделью, которая завершила все тестовые сценарии от начала до конца, обойдя GPT-5.5 при равной стоимости.

В программировании прирост заметен на всех уровнях сложности: по данным CursorBench, вызов инструментов стал эффективнее — модель использует меньше шагов для достижения того же результата. На юридическом бенчмарке Legal Agent Benchmark модель впервые преодолела порог в 10% по стандарту all-pass — показатель, который ранее был недостижим для языковых моделей.

Ещё один важный аспект — честность. Anthropic специально обучает модели избегать необоснованных заявлений, и в 4.8 этот навык заметно усилился: по внутренним оценкам, модель в четыре раза реже пропускает ошибки в собственном коде без комментариев.

Новые функции платформы

Вместе с моделью Anthropic выпустила несколько обновлений инфраструктуры:

  • Dynamic workflows в Claude Code — возможность запускать сотни параллельных подагентов в одной сессии для масштабных задач вроде миграции кодовой базы.
  • Effort control в claude.ai — ползунок, который позволяет выбирать между скоростью и глубиной ответа.
  • System entries в Messages API — разработчики теперь могут обновлять системные инструкции прямо в массиве сообщений, не прерывая кеш подсказок.

Цены и доступность

Обычный режим стоит прежние 5 долларов за миллион входных токенов и 25 долларов за миллион выходных. Fast mode — 10 и 50 долларов соответственно, что втрое ниже, чем у предыдущих версий. Модель доступна через Claude API под именем claude-opus-4-8.

Часто задаваемые вопросы
1
Чем Claude Opus 4.8 отличается от Claude 4 Sonnet?

Opus — это флагманское семейство моделей Anthropic, ориентированное на максимальное качество в сложных задачах. Sonnet — более быстрая и дешевая линейка для повседневной работы. Opus 4.8 превосходит Sonnet в программировании, юриспруденции и многошаговых агентных сценариях.

2
Что такое fast mode?

Это режим ускоренной работы модели. В Opus 4.8 он обрабатывает запросы в 2,5 раза быстрее обычного, но стоит дороже. При этом цена fast mode снизилась втрое по сравнению с Opus 4.7.

3
Что такое dynamic workflows?

Функция в Claude Code, которая позволяет модели планировать работу и запускать сотни параллельных подагентов в одной сессии. После выполнения Claude проверяет результаты и только потом сообщает пользователю итог. Подходит для масштабных миграций кода и рефакторинга.

Выводы

Основные улучшения Claude Opus 4.8 сосредоточены вокруг надёжности агентных задач и честности модели. Для разработчиков это означает, что Claude Code станет более самостоятельным инструментом, способным вести масштабные проекты с меньшим контролем со стороны человека. Снижение цен на fast mode делает флагманскую модель более доступной для задач, где важна скорость.

В ближайшие недели Anthropic планирует выпустить семейство Mythos — модели ещё более высокого интеллектуального уровня, чем Opus. Они уже проходят тестирование в рамках проекта Glasswing, но для массового запуска требуются дополнительные кибербезопасные меры.

Источник: Anthropic — Introducing Claude Opus 4.8