As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.
Otimize e migre solicitações no Amazon Bedrock
O Amazon Bedrock oferece otimização imediata, uma ferramenta de migração e otimização de modelos que ajuda você a obter o melhor desempenho dos modelos básicos. O Amazon Bedrock oferece duas opções de otimização rápida.
-
A otimização simples executa uma reescrita rápida e heurística de um único prompt curto para um modelo.
-
A Otimização Avançada de Prompt (AdvPO) permite que você otimize seus prompts para qualquer modelo no Bedrock enquanto compara seus prompts originais com avisos otimizados em até 5 modelos simultaneamente.
Você pode usar isso se estiver migrando para um novo modelo ou apenas quiser obter um melhor desempenho em seu modelo atual. Se você estiver trocando de modelo, selecione seu modelo atual como linha de base e até 4 outros modelos. Se você não estiver mudando de modelo, basta selecionar seu modelo atual para ver antes e depois da otimização. O otimizador usa seus modelos de solicitação (até 10 por trabalho) e exemplos de entradas do usuário para valores variáveis (até 100 por modelo de solicitação). Também requer respostas verdadeiras e uma métrica de avaliação para orientar a otimização. É até compatível com entradas multimodais, como jpeg, png ou PDF. Você pode fornecer uma LLM-as-a-judge rubrica, uma função Lambda ou critérios curtos de orientação em linguagem natural. A avaliação orienta a otimização imediata. O otimizador funciona em um ciclo de feedback baseado em avaliação para otimizar as respostas imediatas e resultantes do modelo. Ele gera os modelos de solicitação original e final com pontuações de avaliação, estimativas de custo e latência.
Escolha um método de otimização
| Otimização simples | Otimização avançada de prompts | |
|---|---|---|
| Caso de uso | Reescrita básica de um único prompt para avisos curtos | Otimização flexível e iterativa em que sua avaliação orienta a reescrita imediata, para migração de modelos e ajuste de desempenho |
| Melhor para | Solicitações curtas (aproximadamente 1.000 tokens ou menos) | Modelos de solicitação de qualquer tamanho que caibam na janela de contexto do modelo |
| Entrada | Texto de aviso único | Até 10 modelos de prompt com amostras de avaliação, incluindo multimodais |
| Modelos | 1 modelo | Até 5 modelos comparados simultaneamente |
| Avaliação | Nenhuma (reescrita heurística) | Sua escolha: critérios de direção, LLM-as-judge rubrica ou função Lambda personalizada |
| Saída | Solicitação reescrita (instantânea) | Modelos otimizados com pontuações de avaliação, estimativas de custo e latência por modelo |
| Execução | Síncrono (segundos) | Trabalho assíncrono (de 15 minutos a horas, dependendo do número de modelos de solicitação e amostras de avaliação) |
| Multimodal | Não | Sim (imagens, PDFs) |
| Migração de modelos | Parcial: pode reescrever os prompts, mas sem comparação lado a lado | Sim, compare o modelo atual com os candidatos lado a lado |