View a markdown version of this page

Otimize e migre solicitações no Amazon Bedrock - Amazon Bedrock

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Otimize e migre solicitações no Amazon Bedrock

O Amazon Bedrock oferece otimização imediata, uma ferramenta de migração e otimização de modelos que ajuda você a obter o melhor desempenho dos modelos básicos. O Amazon Bedrock oferece duas opções de otimização rápida.

  • A otimização simples executa uma reescrita rápida e heurística de um único prompt curto para um modelo.

  • A Otimização Avançada de Prompt (AdvPO) permite que você otimize seus prompts para qualquer modelo no Bedrock enquanto compara seus prompts originais com avisos otimizados em até 5 modelos simultaneamente.

    Você pode usar isso se estiver migrando para um novo modelo ou apenas quiser obter um melhor desempenho em seu modelo atual. Se você estiver trocando de modelo, selecione seu modelo atual como linha de base e até 4 outros modelos. Se você não estiver mudando de modelo, basta selecionar seu modelo atual para ver antes e depois da otimização. O otimizador usa seus modelos de solicitação (até 10 por trabalho) e exemplos de entradas do usuário para valores variáveis (até 100 por modelo de solicitação). Também requer respostas verdadeiras e uma métrica de avaliação para orientar a otimização. É até compatível com entradas multimodais, como jpeg, png ou PDF. Você pode fornecer uma LLM-as-a-judge rubrica, uma função Lambda ou critérios curtos de orientação em linguagem natural. A avaliação orienta a otimização imediata. O otimizador funciona em um ciclo de feedback baseado em avaliação para otimizar as respostas imediatas e resultantes do modelo. Ele gera os modelos de solicitação original e final com pontuações de avaliação, estimativas de custo e latência.

Escolha um método de otimização

Otimização simples Otimização avançada de prompts
Caso de uso Reescrita básica de um único prompt para avisos curtos Otimização flexível e iterativa em que sua avaliação orienta a reescrita imediata, para migração de modelos e ajuste de desempenho
Melhor para Solicitações curtas (aproximadamente 1.000 tokens ou menos) Modelos de solicitação de qualquer tamanho que caibam na janela de contexto do modelo
Entrada Texto de aviso único Até 10 modelos de prompt com amostras de avaliação, incluindo multimodais
Modelos 1 modelo Até 5 modelos comparados simultaneamente
Avaliação Nenhuma (reescrita heurística) Sua escolha: critérios de direção, LLM-as-judge rubrica ou função Lambda personalizada
Saída Solicitação reescrita (instantânea) Modelos otimizados com pontuações de avaliação, estimativas de custo e latência por modelo
Execução Síncrono (segundos) Trabalho assíncrono (de 15 minutos a horas, dependendo do número de modelos de solicitação e amostras de avaliação)
Multimodal Não Sim (imagens, PDFs)
Migração de modelos Parcial: pode reescrever os prompts, mas sem comparação lado a lado Sim, compare o modelo atual com os candidatos lado a lado