Amazon Bedrock запустила Advanced Prompt Optimization: оптимизация промптов сразу для 5 моделей

Новый инструмент AWS автоматически переписывает промпты в цикле с обратной связью и позволяет сравнить их сразу на пяти моделях. Три метода оценки и поддержка мультимодальных входных данных.

Обложка: Amazon Bedrock запустила Advanced Prompt Optimization: оптимизация промптов сразу для 5 моделей

Amazon Bedrock получила новый инструмент Advanced Prompt Optimization: он автоматически переписывает промпты под конкретную модель и позволяет сравнить результат сразу на пяти моделях одновременно. Инструмент пригодится при смене модели или когда нужно выжать максимум из текущей.

Amazon Bedrock — управляемый сервис AWS для работы с большими языковыми моделями. Advanced Prompt Optimization — новый модуль внутри него, который принимает шаблон промпта, тестовые данные и критерий оценки, а затем в цикле с обратной связью переписывает промпт до получения лучших результатов по выбранной метрике.

Инструмент запущен 14 мая 2026 года. Он поддерживает мультимодальные входные данные — PNG, JPG и PDF, — что позволяет оптимизировать промпты для задач анализа документов и изображений. Оценку качества можно задать тремя разными способами.

Главное
Amazon Bedrock Advanced Prompt Optimization
Ключевые факты

Инструмент оптимизирует промпты для любой модели Bedrock в режиме метрической обратной связи.

Сравнение сразу на 5 моделях одновременно — удобно при миграции.

Три метода оценки: Lambda-функция, LLM-as-a-Judge, steering criteria.

Поддержка мультимодальных входных данных: PNG, JPG, PDF.

Judge-модель по умолчанию — Anthropic Claude Sonnet 4.6.

Доступно в 14 регионах AWS с 14 мая 2026. Оплата — по тарифам инференса Bedrock.

Как работает Advanced Prompt Optimization

Вы подготавливаете шаблон промпта в формате JSONL: описываете переменные, примеры пользовательских данных, опциональные эталонные ответы и метрику оценки. После этого запускаете задачу через консоль Bedrock или API CreateAdvancedPromptOptimizationJob.

Bedrock отправляет ваши шаблоны в выбранные инференс-модели (до 5 штук), оценивает ответы по заданной метрике, затем переписывает промпт и повторяет цикл. На выходе — исходный и финальный шаблоны с оценками качества, оценкой стоимости и задержки.

Формат входного файла

			{
  "version": "bedrock-2026-05-14",
  "templateId": "my-template-001",
  "promptTemplate": "Summarize the following document: {{document}}",
  "steeringCriteria": ["Be concise", "Use bullet points"],
  "evaluationSamples": [
    {
      "inputVariables": [{"document": "Sample text..."}],
      "referenceResponse": "Expected summary"
    }
  ]
}
		

Файл загружается напрямую в консоль или импортируется из Amazon S3. Туда же можно указать директорию для сохранения результатов оптимизации.

Три метода оценки промптов

Lambda-функция

Подходит, если у вас есть конкретная измеримая метрика: accuracy, F1, точность структурированного JSON. Вы разворачиваете Lambda с функцией compute_score, которая программно сравнивает ответ модели с эталонным. Ссылку на Lambda указываете в поле evaluationMetricLambdaArn.

LLM-as-a-Judge

Для открытых задач — суммаризация, генерация, объяснение — где нет жёсткой метрики, но есть рубрика качества. Настраивается через поле customLLMJConfig: задаёте именованные метрики со шкалой оценок, judge-модель проверяет каждую пару промпт—ответ и возвращает оценку с пояснением. По умолчанию в роли судьи — Claude Sonnet 4.6, но можно выбрать другую из доступного списка.

Steering criteria

Самый простой вариант: вы перечисляете критерии в свободной форме — голос бренда, требования к формату, ограничения по безопасности — без написания полного судейского промпта. LLM-judge использует эти критерии для целостной оценки. Judge-модель здесь тоже Claude Sonnet 4.6.

Сценарии использования

Миграция между моделями. Выберите текущую модель как baseline и до 4 других моделей-кандидатов. Инструмент покажет, какой промпт даёт лучший результат на каждой из них, без ручного перебора.

Улучшение производительности текущей модели. Если менять модель не планируете, выберите только одну. Оптимизатор покажет разницу «до и после» — оценки, стоимость инференса, задержку.

  • Анализ документов и изображений (PNG, JPG, PDF как входные переменные)
  • Задачи с чёткой метрикой — классификация, извлечение структурированных данных
  • Задачи с субъективной оценкой — суммаризация, вопросно-ответные системы, генерация текста
  • Тестирование промптов перед выходом в продакшн на эталонных наборах данных

Доступность и стоимость

Advanced Prompt Optimization доступна с 14 мая 2026 года в 14 регионах AWS: США (Северная Вирджиния, Огайо, Орегон), Азиатско-Тихоокеанский регион (Мумбаи, Сеул, Сингапур, Сидней, Токио), Канада (Центральная), Европа (Франкфурт, Ирландия, Лондон, Цюрих), Южная Америка (Сан-Паулу).

Стоимость — по стандартным тарифам инференса Amazon Bedrock: оплата за токены, потреблённые в ходе оптимизации, без отдельной надбавки за сам инструмент.

Как попробовать

  1. Откройте консоль Amazon Bedrock и перейдите на страницу Advanced Prompt Optimization.
  2. Нажмите Create prompt optimization и выберите до 5 инференс-моделей.
  3. Подготовьте JSONL-файл с шаблонами промптов, тестовыми данными и метрикой оценки.
  4. Загрузите файл или укажите S3-путь. При необходимости — ссылку на Lambda или рубрику для LLM-as-Judge.
  5. Запустите задачу, дождитесь результатов: оптимизированные промпты с оценками и стоимостью.
С новым инструментом вы можете тестировать промпты на реальных данных и быть уверены в отсутствии регрессий на известных сценариях, одновременно улучшая производительность на проблемных задачах.
Channy YunPrincipal Developer Advocate, AWS
Часто задаваемые вопросы
1
Что такое Amazon Bedrock Advanced Prompt Optimization?

Это инструмент в составе Amazon Bedrock, который автоматически переписывает промпты для улучшения их качества под конкретную модель. Использует цикл метрической обратной связи — принимает шаблон, тестовые данные и метрику, затем итеративно оптимизирует промпт.

2
Сколько моделей можно сравнивать одновременно?

До 5 моделей одновременно. Можно выбрать текущую модель как baseline и протестировать до 4 альтернативных — полезно при миграции или сравнении провайдеров.

3
Какие форматы входных данных поддерживаются?

Помимо текстовых переменных, поддерживаются мультимодальные входы: файлы PNG, JPG и PDF через S3. Это позволяет оптимизировать промпты для задач анализа изображений и документов.

4
Как выбрать метод оценки промптов?

Три варианта: Lambda-функция с кастомной логикой оценки (для точных метрик), LLM-as-a-Judge с рубрикой (для субъективных задач) и steering criteria — перечень требований в свободной форме без написания judge-промпта.

5
В каких регионах AWS доступна эта функция?

В 14 регионах: США (3 региона), Азиатско-Тихоокеанский регион (5 регионов), Канада, Европа (4 региона), Южная Америка. Полный список — в официальном анонсе AWS.

Выводы

Advanced Prompt Optimization в Amazon Bedrock снимает одну из главных болей при работе с LLM — ручной перебор вариантов промптов. Особенно ценен инструмент при смене модели: вместо переписывания промптов вручную можно запустить задачу и получить оптимизированный вариант с понятными метриками качества, стоимости и задержки.

Попробовать инструмент можно в консоли Amazon Bedrock, а техническую документацию и примеры кода — в официальном репозитории AWS на GitHub. Обратная связь принимается через AWS re:Post для Amazon Bedrock.