Alibaba выпустила Qwen3.6-Plus — ИИ-модель для агентного кодинга с контекстом в 1 млн токенов
Alibaba выпустила Qwen3.6-Plus — языковую модель для агентного кодинга с контекстом 1 млн токенов. Бесплатна на OpenRouter.
Новости TprogerAlibaba выпустила Qwen3.6-Plus — новую языковую модель, ориентированную на агентные задачи: автономное написание кода, работу с длинными документами и многошаговые сценарии. Модель доступна бесплатно в preview-режиме на OpenRouter.
Qwen3.6-Plus поддерживает контекстное окно в 1 млн токенов (около 2000 страниц текста) и генерирует до 65 536 выходных токенов. По ранним тестам, модель работает по замерам пользователей OpenRouter, примерно в 3 раза быстрее Claude Opus 4.5.
Ключевые выводы
- Qwen3.6-Plus — новая модель Alibaba для агентного кодинга и длинных документов
- Контекст 1 млн токенов, до 65 536 выходных токенов
- Поддерживает режим цепочечного мышления (thinking mode) и нативный вызов функций
- Обгоняет Claude 4.5 Opus на Terminal-Bench 2.0 (61,6 vs 59,3) и OmniDocBench (91,2 vs 87,7)
- Бесплатна в preview на OpenRouter, но free tier собирает промпты для обучения
Бенчмарки: где Qwen3.6-Plus выигрывает
По опубликованным результатам Qwen3.6-Plus показывает сильные результаты на агентных и документных бенчмарках:
- Terminal-Bench 2.0 (агентный кодинг в терминале) — 61,6 vs 59,3 у Claude 4.5 Opus
- OmniDocBench v1.5 (распознавание документов) — 91,2 vs 87,7 у Claude 4.5 Opus
- RealWorldQA (рассуждение по изображениям) — 85,4 vs 77,0 у Claude 4.5 Opus
- SWE-bench Verified (исправление багов в реальных репозиториях) — 78,8, уступает Claude 4.5 Opus (80,9)
Модель поддерживает обработку изображений в контексте документных и аналитических задач, но не предназначена для генерации изображений.
Архитектура и скорость
Qwen3.6-Plus построена на гибридной архитектуре нового поколения. Ранние пользователи отмечают, что модель «более решительна» в ответах — использует меньше токенов для достижения результата и показывает лучшую надёжность в многошаговых агентных сценариях.
Скорость генерации — примерно в 3 раза выше, чем у Claude Opus 4.6 по ранним замерам сообщества. Однако time-to-first-token на бесплатном тире составляет в среднем 11,5 секунд, что ощутимо влияет на интерактивные сценарии.
Доступность и ограничения
- Доступна на OpenRouter бесплатно в preview-режиме
- Бесплатный тир собирает промпты и ответы для обучения — учитывайте при работе с конфиденциальными данными
- Платный API-доступ без сбора данных также доступен
- Нативный вызов функций (function calling) — можно использовать как агента без дополнительных обёрток
Часто задаваемые вопросы
Чем Qwen3.6-Plus отличается от предыдущих моделей Qwen?
Qwen3.6-Plus — первая модель линейки, заточенная под агентные задачи: автономный кодинг, многошаговые сценарии, работа с длинными документами (до 1 млн токенов контекста). Предыдущие модели Qwen фокусировались на общих задачах.
Qwen3.6-Plus лучше Claude Opus?
На некоторых бенчмарках — да: Terminal-Bench 2.0, OmniDocBench, RealWorldQA. Но на SWE-bench Verified (реальные баг-фиксы) Claude 4.5 Opus всё ещё впереди (80,9 vs 78,8). Выбор зависит от конкретных задач.
Безопасно ли использовать бесплатный тир?
Бесплатный тир на OpenRouter собирает промпты и ответы для обучения модели. Не отправляйте через него конфиденциальные данные, коммерческий код или персональную информацию. Для production-задач используйте платный API.
Какие задачи лучше всего подходят для Qwen3.6-Plus?
Агентный кодинг (автономное написание и отладка кода), анализ длинных документов (до 2000 страниц), многошаговые автоматизации с вызовом функций. Модель менее подходит для мультимодальных задач и creative writing.
Выводы
Qwen3.6-Plus — сильная модель для агентных задач, особенно в кодинге и работе с документами. Бесплатный preview на OpenRouter подходит для прототипирования и личных проектов, для production — платный API.