Amazon Bedrock запустила Advanced Prompt Optimization: оптимизация промптов сразу для 5 моделей
Новый инструмент AWS автоматически переписывает промпты в цикле с обратной связью и позволяет сравнить их сразу на пяти моделях. Три метода оценки и поддержка мультимодальных входных данных.
Новости TprogerAmazon Bedrock получила новый инструмент Advanced Prompt Optimization: он автоматически переписывает промпты под конкретную модель и позволяет сравнить результат сразу на пяти моделях одновременно. Инструмент пригодится при смене модели или когда нужно выжать максимум из текущей.
Amazon Bedrock — управляемый сервис AWS для работы с большими языковыми моделями. Advanced Prompt Optimization — новый модуль внутри него, который принимает шаблон промпта, тестовые данные и критерий оценки, а затем в цикле с обратной связью переписывает промпт до получения лучших результатов по выбранной метрике.
Инструмент запущен 14 мая 2026 года. Он поддерживает мультимодальные входные данные — PNG, JPG и PDF, — что позволяет оптимизировать промпты для задач анализа документов и изображений. Оценку качества можно задать тремя разными способами.
Главное
Amazon Bedrock Advanced Prompt Optimization
Ключевые факты
Инструмент оптимизирует промпты для любой модели Bedrock в режиме метрической обратной связи.
Сравнение сразу на 5 моделях одновременно — удобно при миграции.
Три метода оценки: Lambda-функция, LLM-as-a-Judge, steering criteria.
Поддержка мультимодальных входных данных: PNG, JPG, PDF.
Judge-модель по умолчанию — Anthropic Claude Sonnet 4.6.
Доступно в 14 регионах AWS с 14 мая 2026. Оплата — по тарифам инференса Bedrock.
Как работает Advanced Prompt Optimization
Вы подготавливаете шаблон промпта в формате JSONL: описываете переменные, примеры пользовательских данных, опциональные эталонные ответы и метрику оценки. После этого запускаете задачу через консоль Bedrock или API CreateAdvancedPromptOptimizationJob.
Bedrock отправляет ваши шаблоны в выбранные инференс-модели (до 5 штук), оценивает ответы по заданной метрике, затем переписывает промпт и повторяет цикл. На выходе — исходный и финальный шаблоны с оценками качества, оценкой стоимости и задержки.
Формат входного файла
Файл загружается напрямую в консоль или импортируется из Amazon S3. Туда же можно указать директорию для сохранения результатов оптимизации.
Три метода оценки промптов
Lambda-функция
Подходит, если у вас есть конкретная измеримая метрика: accuracy, F1, точность структурированного JSON. Вы разворачиваете Lambda с функцией compute_score, которая программно сравнивает ответ модели с эталонным. Ссылку на Lambda указываете в поле evaluationMetricLambdaArn.
LLM-as-a-Judge
Для открытых задач — суммаризация, генерация, объяснение — где нет жёсткой метрики, но есть рубрика качества. Настраивается через поле customLLMJConfig: задаёте именованные метрики со шкалой оценок, judge-модель проверяет каждую пару промпт—ответ и возвращает оценку с пояснением. По умолчанию в роли судьи — Claude Sonnet 4.6, но можно выбрать другую из доступного списка.
Steering criteria
Самый простой вариант: вы перечисляете критерии в свободной форме — голос бренда, требования к формату, ограничения по безопасности — без написания полного судейского промпта. LLM-judge использует эти критерии для целостной оценки. Judge-модель здесь тоже Claude Sonnet 4.6.
Сценарии использования
Миграция между моделями. Выберите текущую модель как baseline и до 4 других моделей-кандидатов. Инструмент покажет, какой промпт даёт лучший результат на каждой из них, без ручного перебора.
Улучшение производительности текущей модели. Если менять модель не планируете, выберите только одну. Оптимизатор покажет разницу «до и после» — оценки, стоимость инференса, задержку.
- Анализ документов и изображений (PNG, JPG, PDF как входные переменные)
- Задачи с чёткой метрикой — классификация, извлечение структурированных данных
- Задачи с субъективной оценкой — суммаризация, вопросно-ответные системы, генерация текста
- Тестирование промптов перед выходом в продакшн на эталонных наборах данных
Доступность и стоимость
Advanced Prompt Optimization доступна с 14 мая 2026 года в 14 регионах AWS: США (Северная Вирджиния, Огайо, Орегон), Азиатско-Тихоокеанский регион (Мумбаи, Сеул, Сингапур, Сидней, Токио), Канада (Центральная), Европа (Франкфурт, Ирландия, Лондон, Цюрих), Южная Америка (Сан-Паулу).
Стоимость — по стандартным тарифам инференса Amazon Bedrock: оплата за токены, потреблённые в ходе оптимизации, без отдельной надбавки за сам инструмент.
Как попробовать
- Откройте консоль Amazon Bedrock и перейдите на страницу Advanced Prompt Optimization.
- Нажмите Create prompt optimization и выберите до 5 инференс-моделей.
- Подготовьте JSONL-файл с шаблонами промптов, тестовыми данными и метрикой оценки.
- Загрузите файл или укажите S3-путь. При необходимости — ссылку на Lambda или рубрику для LLM-as-Judge.
- Запустите задачу, дождитесь результатов: оптимизированные промпты с оценками и стоимостью.
С новым инструментом вы можете тестировать промпты на реальных данных и быть уверены в отсутствии регрессий на известных сценариях, одновременно улучшая производительность на проблемных задачах.
Часто задаваемые вопросы
Что такое Amazon Bedrock Advanced Prompt Optimization?
Это инструмент в составе Amazon Bedrock, который автоматически переписывает промпты для улучшения их качества под конкретную модель. Использует цикл метрической обратной связи — принимает шаблон, тестовые данные и метрику, затем итеративно оптимизирует промпт.
Сколько моделей можно сравнивать одновременно?
До 5 моделей одновременно. Можно выбрать текущую модель как baseline и протестировать до 4 альтернативных — полезно при миграции или сравнении провайдеров.
Какие форматы входных данных поддерживаются?
Помимо текстовых переменных, поддерживаются мультимодальные входы: файлы PNG, JPG и PDF через S3. Это позволяет оптимизировать промпты для задач анализа изображений и документов.
Как выбрать метод оценки промптов?
Три варианта: Lambda-функция с кастомной логикой оценки (для точных метрик), LLM-as-a-Judge с рубрикой (для субъективных задач) и steering criteria — перечень требований в свободной форме без написания judge-промпта.
В каких регионах AWS доступна эта функция?
В 14 регионах: США (3 региона), Азиатско-Тихоокеанский регион (5 регионов), Канада, Европа (4 региона), Южная Америка. Полный список — в официальном анонсе AWS.
Выводы
Advanced Prompt Optimization в Amazon Bedrock снимает одну из главных болей при работе с LLM — ручной перебор вариантов промптов. Особенно ценен инструмент при смене модели: вместо переписывания промптов вручную можно запустить задачу и получить оптимизированный вариант с понятными метриками качества, стоимости и задержки.
Попробовать инструмент можно в консоли Amazon Bedrock, а техническую документацию и примеры кода — в официальном репозитории AWS на GitHub. Обратная связь принимается через AWS re:Post для Amazon Bedrock.