Otimize e migre solicitações no Amazon Bedrock

O Amazon Bedrock oferece otimização imediata, uma ferramenta de migração e otimização de modelos que ajuda você a obter o melhor desempenho dos modelos básicos. O Amazon Bedrock oferece duas opções de otimização rápida.

A otimização simples executa uma reescrita rápida e heurística de um único prompt curto para um modelo.
A Otimização Avançada de Prompt (AdvPO) permite que você otimize seus prompts para qualquer modelo no Bedrock enquanto compara seus prompts originais com avisos otimizados em até 5 modelos simultaneamente.

Você pode usar isso se estiver migrando para um novo modelo ou apenas quiser obter um melhor desempenho em seu modelo atual. Se você estiver trocando de modelo, selecione seu modelo atual como linha de base e até 4 outros modelos. Se você não estiver mudando de modelo, basta selecionar seu modelo atual para ver antes e depois da otimização. O otimizador usa seus modelos de solicitação (até 10 por trabalho) e exemplos de entradas do usuário para valores variáveis (até 100 por modelo de solicitação). Também requer respostas verdadeiras e uma métrica de avaliação para orientar a otimização. É até compatível com entradas multimodais, como jpeg, png ou PDF. Você pode fornecer uma LLM-as-a-judge rubrica, uma função Lambda ou critérios curtos de orientação em linguagem natural. A avaliação orienta a otimização imediata. O otimizador funciona em um ciclo de feedback baseado em avaliação para otimizar as respostas imediatas e resultantes do modelo. Ele gera os modelos de solicitação original e final com pontuações de avaliação, estimativas de custo e latência.

Escolha um método de otimização

	Otimização simples	Otimização avançada de prompts
Caso de uso	Reescrita básica de um único prompt para avisos curtos	Otimização flexível e iterativa em que sua avaliação orienta a reescrita imediata, para migração de modelos e ajuste de desempenho
Melhor para	Solicitações curtas (aproximadamente 1.000 tokens ou menos)	Modelos de solicitação de qualquer tamanho que caibam na janela de contexto do modelo
Entrada	Texto de aviso único	Até 10 modelos de prompt com amostras de avaliação, incluindo multimodais
Modelos	1 modelo	Até 5 modelos comparados simultaneamente
Avaliação	Nenhuma (reescrita heurística)	Sua escolha: critérios de direção, LLM-as-judge rubrica ou função Lambda personalizada
Saída	Solicitação reescrita (instantânea)	Modelos otimizados com pontuações de avaliação, estimativas de custo e latência por modelo
Execução	Síncrono (segundos)	Trabalho assíncrono (de 15 minutos a horas, dependendo do número de modelos de solicitação e amostras de avaliação)
Multimodal	Não	Sim (imagens, PDFs)
Migração de modelos	Parcial: pode reescrever os prompts, mas sem comparação lado a lado	Sim, compare o modelo atual com os candidatos lado a lado

Atenção O Javascript está desativado ou não está disponível no seu navegador.

Para usar a documentação da AWS, o Javascript deve estar ativado. Consulte as páginas de Ajuda do navegador para obter instruções.

Convenções do documento

Capacidades adicionais

Como funciona