View a markdown version of this page

So funktioniert die erweiterte Prompt-Optimierung - Amazon Bedrock

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

So funktioniert die erweiterte Prompt-Optimierung

-Übersicht

Advanced Prompt Optimization (AdvPO) ermöglicht es Ihnen, Ihre Eingabeaufforderungen für jedes Modell auf Bedrock zu optimieren und gleichzeitig Ihre ursprünglichen Eingabeaufforderungen mit optimierten Eingabeaufforderungen für bis zu 5 Modelle gleichzeitig zu vergleichen. Sie können dies verwenden, wenn Sie zu einem neuen Modell migrieren oder einfach nur die Leistung Ihres aktuellen Modells verbessern möchten. Wenn Sie das Modell ändern, wählen Sie Ihr aktuelles Modell als Basismodell und bis zu 4 weitere Modelle aus. Wenn Sie das Modell nicht ändern, wählen Sie einfach Ihr aktuelles Modell aus, um die Zeit vor und nach der Optimierung zu überprüfen. Der Optimierer verwendet Ihre Eingabeaufforderungsvorlagen (bis zu 10 pro Job), Beispielbenutzereingaben für Variablenwerte (Bewertungsmuster, bis zu 100 pro Eingabeaufforderungsvorlage), Ground-Truth-Antworten und eine Bewertungsmetrik als Leitfaden für die Optimierung. Er ist sogar mit multimodalen Eingaben wie JPEG, PNG oder PDF kompatibel. Sie können eine LLM-as-a-judge Rubrik, eine Lambda-Funktion oder kurze Steuerungskriterien für natürliche Sprache angeben. Die Bewertung steuert die schnelle Optimierung. Der Optimierer arbeitet in einer evaluationsbasierten Feedback-Schleife, um die Eingabeaufforderung und die daraus resultierenden Modellantworten zu optimieren, und gibt die ursprünglichen und endgültigen Prompt-Vorlagen mit Bewertungsergebnissen, Kostenschätzungen und Latenz aus.

Wenn Sie Eingabeaufforderungen aus einem Modell migrieren möchten, das nicht zu Bedrock gehört, und trotzdem direkte Vergleiche durchführen möchten, können Sie dies beispielsweise tun, indem Sie die Inferenz für Ihr Modell, das nicht zu Bedrock gehört, separat ausführen und dann a anwenden, um diese Ergebnisse zu bewerten. Benutzerdefinierter Lambda-Evaluator Erstellen Sie dann einen Advanced Prompt Optimization-Job mit demselben Lambda-Funktionsevaluator für Ihre Bedrock-Zielmodelle. Auf diese Weise können Sie Ihr altes Modell vor und nach der Prompt-Optimierung direkt mit Ihrem neuen Modell vergleichen.

So funktioniert die Optimierungsschleife

Ihre Bewertungsmuster werden in die Platzhaltervariablen in Ihrer Eingabeaufforderungsvorlage eingefügt und dann zur Inferenz mit Ihren Zielmodellen gesendet. Multimodale Eingaben (Bilder und PDFs) werden zusammen mit der Aufforderung in der Payload an das Modell gesendet, sollten aber nicht in einer Variablen mit doppelten geschweiften Klammern referenziert werden. {{placeholder}} Die Antworten werden entsprechend Ihrer Bewertungsmethode benotet. Der Service analysiert die Bewertungsergebnisse, schreibt Ihre Eingabeaufforderungen automatisch neu und sendet sie dann an die Modelle zurück. Diese Feedback-Schleife wiederholt sich und wird gemäß den firmeneigenen internen Optimierungsparametern abgeschlossen.

Es ist wichtig, dass Sie Ihre Bewertungsmethode und Ihre Bewertungskriterien so genau wie möglich definieren, da die Bewertung die schnelle Optimierung steuert.

Sowohl der Datensatz als auch der metric/lambda Code prägen die Qualität der Optimierung. Das System verwendet Ihren Datensatz, um Prompt-Kandidaten zu testen, und liest Ihren Metrikcode (Quelltext und Docstrings), um zu verstehen, was „gut“ bedeutet, und um zu diagnostizieren, wo Eingabeaufforderungen fehlschlagen.

Was Sie erhalten

Am Ende des Optimierungsjobs erhalten Sie:

  • Ihre Prompt-Vorlagen vor und nach der Optimierung

  • Bewertungsergebnisse für jede Bewertungsstichprobe

  • Latenz (Zeit bis zum ersten Token oder TTFT) für jedes Modell

  • Kostenschätzungen für jedes Modell

Cost (Kosten)

Alle Inferenz- und Lambda-Funktionsaufrufe werden in Ihrem Konto ausgeführt. AWS Lambda-Operationen werden zu den öffentlichen Preisen von Lambda abgerechnet. Die Preise für Inferenzen (einschließlich LLM-as-a-judge Bewertungen) werden gemäß den öffentlichen Preisen von Bedrock für On-Demand-Inferenz berechnet. Neben den Inferenzkosten fallen keine gesonderten Servicegebühren für Advanced Prompt Optimization an. Das aktuelle LLM-as-a-judge Standardmodell ist Anthropic Claude Sonnet 4.6, sofern Sie kein anderes Modell für Ihre benutzerdefinierte LLMJ-Eingabeaufforderung auswählen.

Eine Berechnungsmethode zur Schätzung der Kosten für die Durchführung einer Optimierung finden Sie auf der Seite mit der öffentlichen Preisgestaltung von Bedrock unter Prompt Optimization und dann unter Advanced Prompt Optimization.

Erwartete Dauer

Bei einer einzigen Aufforderung mit nur wenigen Testbeispielen konnte der Job 15 bis 20 Minuten lang ausgeführt werden. Bei vielen Eingabeaufforderungen mit jeweils einer großen Anzahl von Testbeispielen konnte der Auftrag über eine Stunde, möglicherweise mehrere Stunden, dauern. Das liegt daran, dass jede Eingabeaufforderungsvorlage mehrere Runden von Inferenz-, Bewertungs- und Umschreibschleifen durchläuft, die auf jedem von Ihnen bereitgestellten Testprobendatensatz basieren.