Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.
Zugang und Sicherheit für Modelle mit offenem Gewicht
Bevor Sie mit der Reinforcement Fine-Tuning (RFT) beginnen, stellen Sie sicher, dass Sie wissen, welche Art von Zugriff Amazon Bedrock für den Betrieb benötigt. RFT-specific RFT benötigt aufgrund seiner Funktionen zur Ausführung von Prämienfunktionen zusätzliche Berechtigungen, die über die standardmäßige Feinabstimmung hinausgehen.
Voraussetzungen
Bevor Sie die OpenAI kompatiblen Fine-Tuning-APIs von Amazon Bedrock verwenden, stellen Sie sicher, dass Sie über Folgendes verfügen:
-
Ein AWS Konto mit entsprechenden Berechtigungen für den Zugriff auf Amazon Bedrock
-
Authentifizierung — Sie können sich authentifizieren mit:
-
Amazon Bedrock API-Schlüssel (für OpenAI SDK erforderlich und für HTTP-Anfragen verfügbar)
-
AWS Anmeldeinformationen (unterstützt für HTTP-Anfragen)
Anmerkung
Wenn Sie term/long kurzfristige API-Schlüssel von Amazon Bedrock verwenden, stellen Sie sicher, dass Ihre Rolle Zugriff auf die folgenden IAM-Richtlinienberechtigungen hat: und.
AmazonBedrockMantleFullAccessLambda-Berechtigungen für Belohnungsfunktionen -
-
OpenAISDK (optional) — Installieren Sie das OpenAI Python-SDK, wenn Sie SDK-based Anfragen verwenden.
-
Umgebungsvariablen — Legen Sie die folgenden Umgebungsvariablen fest:
-
OPENAI_API_KEY— Stellen Sie Ihren Amazon Bedrock API-Schlüssel ein -
OPENAI_BASE_URL— Stellen Sie den Amazon Bedrock-Endpunkt für Ihre Region ein (z. B.https://bedrock-mantle.us-west-2.api.aws/v1)
Weitere Informationen finden Sie unter Antworten-API.
-
-
Trainingsdaten, die zu diesem Zweck als JSONL-Dateien formatiert wurden.
fine-tuneWeitere Informationen finden Sie unter Daten für Modelle mit offenem Gewicht vorbereiten.
Lambda-Berechtigungen für Belohnungsfunktionen
Sie müssen Lambda-Aufrufberechtigungen hinzufügen. Im Folgenden finden Sie ein Beispiel für eine Richtlinie, die Sie verwenden können:
{ "Version": "2012-10-17", "Statement": [ { "Effect": "Allow", "Action": [ "lambda:InvokeFunction" ], "Resource": [ "arn:aws:lambda:*:*:function:reward-function-name" ] } ] }
Sie können auch von Amazon Bedrock gehostete Modelle als Judges für die Einrichtung von Prämienfunktionen verwenden. Sie müssen der Lambda-Ausführungsrolle spezifische Berechtigungen hinzufügen, um Foundation-Modelle aufzurufen. In Ihrer Lambda-Rolle können Sie diese verwalteten Richtlinien für LLMs zur Benotung konfigurieren. Siehe AmazonBedrockLimitedAccess.
Im Folgenden finden Sie ein Beispiel für das Aufrufen von Amazon Bedrock Foundation-Modellen als Judge mithilfe der Invoke API:
{ "Version": "2012-10-17", "Statement": [ { "Effect": "Allow", "Action": [ "bedrock:InvokeModel" ], "Resource": [ "arn:aws:bedrock:*:*:foundation-model/*" ] } ] }