View a markdown version of this page

Inferenz mithilfe der Anthropic Messages API - Amazon Bedrock

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Inferenz mithilfe der Anthropic Messages API

Die Anthropic Messages API bietet systemeigenen Zugriff auf Claude-Modelle im Anforderungs- und Antwortformat von Anthropic. Sie können die Messages-API sowohl auf den Endpunkten als auch auf den bedrock-mantle bedrock-runtime Endpunkten verwenden, sodass Sie flexibel den Authentifizierungs- und Integrationsstil wählen können, der zu Ihrer Anwendung passt.

Endpunkt Basis-URL Anwendungsfall
bedrock-mantle https://bedrock-mantle.{region}.api.aws/anthropic/v1/messages Für neue Anwendungen empfohlen. Unterstützt API-Schlüsselauthentifizierung undArbeitsbereiche () Anthropic-compatible.
bedrock-runtime https://bedrock-runtime.{region}.amazonaws.com Verwendung mit vorhandenen AWS SDK-Integrationen und Aufrufprotokollierung.

Unterstützte Regionen

Die Nachrichten-API ist auf dem bedrock-mantle Endpunkt in allen Regionen verfügbar, die dies unterstützen bedrock-mantle (sieheUnterstützte Regionen und Endpunkte). Am bedrock-runtime Endpunkt ist sie in allen Regionen verfügbar, in denen Claude-Modelle verfügbar sind. Details dazu finden Sie unter Regionale Verfügbarkeit.

Voraussetzungen

Bevor Sie die Nachrichten-API verwenden, stellen Sie sicher, dass Sie über Folgendes verfügen:

  • Modellzugriff — Fordern Sie Zugriff auf Claude-Modelle in der Amazon Bedrock-Konsole an. Siehe Zugriff auf Modelle beantragen.

  • Authentifizierung — Hängt vom Endpunkt ab:

    • bedrock-mantle— Verwenden Sie einen Amazon Bedrock API-Schlüssel (sieheAPI-Schlüssel) oder AWS SigV4-Anmeldeinformationen.

    • bedrock-runtime— Verwenden Sie AWS SigV4-Anmeldeinformationen über das AWS SDK (boto3 usw.).

  • Anthropischer Versionsheader — Alle Anfragen erfordern eine API-Version:

    • bedrock-mantle: anthropic-version: 2023-06-01 Als HTTP-Header festgelegt.

    • bedrock-runtime: Wird "anthropic_version": "bedrock-2023-05-31" im Hauptteil der Anfrage festgelegt.

Grundlegende Anfrage

Um eine einfache Nachricht an ein Claude-Modell zu senden, wählen Sie die Registerkarte für Ihre bevorzugte Methode und folgen Sie dann den Schritten:

bedrock-mantle (curl)
curl -X POST https://bedrock-mantle.us-east-1.api.aws/anthropic/v1/messages \ -H "x-api-key: $BEDROCK_API_KEY" \ -H "anthropic-version: 2023-06-01" \ -H "Content-Type: application/json" \ -d '{ "model": "anthropic.claude-sonnet-4-6-v1", "max_tokens": 1024, "messages": [ {"role": "user", "content": "Explain quantum computing in one sentence."} ] }'
bedrock-runtime (Python)
import boto3 import json client = boto3.client("bedrock-runtime", region_name="us-east-1") response = client.invoke_model( modelId="anthropic.claude-sonnet-4-6-v1", body=json.dumps({ "anthropic_version": "bedrock-2023-05-31", "max_tokens": 1024, "messages": [ {"role": "user", "content": "Explain quantum computing in one sentence."} ] }) ) result = json.loads(response["body"].read()) print(result["content"][0]["text"])
bedrock-runtime (curl)

Verwenden Sie die AWS CLI, um das Modell aufzurufen:

aws bedrock-runtime invoke-model \ --model-id anthropic.claude-sonnet-4-6-v1 \ --body '{ "anthropic_version": "bedrock-2023-05-31", "max_tokens": 1024, "messages": [ {"role": "user", "content": "Explain quantum computing in one sentence."} ] }' \ --cli-binary-format raw-in-base64-out \ output.json

Antworten streamen

Um Antwort-Token während ihrer Generierung inkrementell zu erhalten, wählen Sie die Registerkarte für Ihre bevorzugte Methode und folgen Sie dann den Schritten:

bedrock-mantle (curl)
curl -X POST https://bedrock-mantle.us-east-1.api.aws/anthropic/v1/messages \ -H "x-api-key: $BEDROCK_API_KEY" \ -H "anthropic-version: 2023-06-01" \ -H "Content-Type: application/json" \ -d '{ "model": "anthropic.claude-sonnet-4-6-v1", "max_tokens": 1024, "stream": true, "messages": [ {"role": "user", "content": "Write a short poem about cloud computing."} ] }'
bedrock-runtime (Python)
import boto3 import json client = boto3.client("bedrock-runtime", region_name="us-east-1") response = client.invoke_model_with_response_stream( modelId="anthropic.claude-sonnet-4-6-v1", body=json.dumps({ "anthropic_version": "bedrock-2023-05-31", "max_tokens": 1024, "messages": [ {"role": "user", "content": "Write a short poem about cloud computing."} ] }) ) for event in response["body"]: chunk = json.loads(event["chunk"]["bytes"]) if chunk["type"] == "content_block_delta": print(chunk["delta"]["text"], end="")

Unterstützte Features

Die Nachrichten-API unterstützt die folgenden erweiterten Funktionen mit Claude-Modellen:

Das vollständige Anforderungs- und Antwortformat der Messages-API, einschließlich aller Parameter und Funktionen, finden Sie unterAnthropic Claude Nachrichten-API von.

Tokens zählen

Um die Anzahl der Eingabe-Token zu zählen, die eine Anfrage verbrauchen würde, bevor sie zur Inferenz gesendet wird, verwenden Sie den anthropischen count_tokens Pfad auf dem bedrock-mantle Endpunkt. Dies ist der einzige Pfad zum Zählen von Tokens, der für Claude-Modelle unterstützt wird, die nicht auf einem Region-specific Endpunkt verfügbar sind, einschließlich Claude-Modellen, die nur bedrock-runtime mit Cross-Region Inference (CRIS) gestartet werden. Einzelheiten und ein Beispiel finden Sie unter Zählen Sie Token mithilfe des Bedrock-Mantle-Endpunkts.