

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

# So funktioniert Advanced Prompt Optimization
<a name="advanced-prompt-optimization-how"></a>

## -Übersicht
<a name="advanced-prompt-optimization-how-overview"></a>

Advanced Prompt Optimization verwendet Ihre Eingabeaufforderungsvorlagen, Bewertungsmuster und eine Bewertungsmethode und führt dann iterative Inferenz-, Evaluierungs- und Umschreibungsschleifen durch. Es gibt optimierte Eingabeaufforderungen mit Bewertungsmetriken für jedes Zielmodell aus. Es unterstützt multimodale Eingaben, einschließlich PNG-, JPG- und PDF-Dateien.

## Wie funktioniert die Optimierungsschleife
<a name="advanced-prompt-optimization-how-loop"></a>

Ihre Bewertungsmuster werden in die Platzhaltervariablen in Ihrer Eingabeaufforderungsvorlage eingefügt und dann zur Inferenz mit Ihren Zielmodellen gesendet. Multimodale Eingaben (Bilder und PDFs) werden zusammen mit der Aufforderung in der Payload an das Modell gesendet, sollten aber nicht in einer Variablen mit doppelten geschweiften Klammern referenziert werden. `{{placeholder}}` Die Antworten werden entsprechend Ihrer Bewertungsmethode benotet. Der Service analysiert die Bewertungsergebnisse, schreibt Ihre Eingabeaufforderungen automatisch neu und sendet sie dann an die Modelle zurück. Diese Feedback-Schleife wiederholt sich und wird gemäß den firmeneigenen internen Optimierungsparametern abgeschlossen.

Es ist wichtig, dass Sie Ihre Bewertungsmethode und Ihre Bewertungskriterien so genau wie möglich definieren, da die Bewertung die schnelle Optimierung steuert.

## Was Sie erhalten
<a name="advanced-prompt-optimization-how-output"></a>

Am Ende des Optimierungsjobs erhalten Sie:
+ Ihre Prompt-Vorlagen vor und nach der Optimierung
+ Bewertungsergebnisse für jede Bewertungsstichprobe
+ Latenz (Zeit bis zum ersten Token oder TTFT) für jedes Modell
+ Kostenschätzungen für jedes Modell

## Cost (Kosten)
<a name="advanced-prompt-optimization-how-cost"></a>

Alle Inferenz- und Lambda-Funktionsaufrufe werden in Ihrem Konto ausgeführt. AWS Lambda-Operationen werden zu den öffentlichen Preisen von Lambda abgerechnet. Die Preise für Inferenzen (einschließlich LLM-as-a-judge Bewertungen) werden gemäß den öffentlichen Preisen von Bedrock für On-Demand-Inferenz berechnet. Neben den Inferenzkosten fallen keine gesonderten Servicegebühren für Advanced Prompt Optimization an. Das aktuelle LLM-as-a-judge Standardmodell ist Anthropic Claude Sonnet 4.6, sofern Sie kein anderes Modell für Ihre benutzerdefinierte LLMJ-Eingabeaufforderung auswählen.

Eine Berechnungsmethode zur Schätzung der Kosten für die Durchführung einer Optimierung finden Sie auf der Seite mit der öffentlichen Preisgestaltung von Bedrock unter Prompt-Optimierung und dann unter Advanced Prompt Optimization.

## Erwartete Dauer
<a name="advanced-prompt-optimization-how-duration"></a>

Bei einer einzigen Aufforderung mit nur wenigen Testbeispielen konnte der Job 15 bis 20 Minuten lang ausgeführt werden. Bei vielen Eingabeaufforderungen mit jeweils einer großen Anzahl von Testbeispielen konnte der Auftrag über eine Stunde, möglicherweise mehrere Stunden, dauern. Das liegt daran, dass jede Eingabeaufforderungsvorlage mehrere Runden von Inferenz-, Bewertungs- und Umschreibschleifen durchläuft, die auf jedem von Ihnen bereitgestellten Testprobendatensatz basieren.