View a markdown version of this page

Inferensi menggunakan Anthropic Messages API - Amazon Bedrock

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Inferensi menggunakan Anthropic Messages API

Anthropic Messages API menyediakan akses asli ke model Claude menggunakan format permintaan dan respons Anthropic. Anda dapat menggunakan Messages API di kedua bedrock-runtime titik akhir bedrock-mantle dan memberi Anda fleksibilitas untuk memilih gaya otentikasi dan integrasi yang sesuai dengan aplikasi Anda.

Titik akhir URL dasar Kasus penggunaan
bedrock-mantle https://bedrock-mantle.{region}.api.aws/anthropic/v1/messages Direkomendasikan untuk aplikasi baru. Mendukung autentikasi kunci API danRuang kerja () Anthropic-compatible.
bedrock-runtime https://bedrock-runtime.{region}.amazonaws.com Gunakan dengan integrasi AWS SDK yang ada dan logging pemanggilan.

Wilayah yang Didukung

API Pesan tersedia di bedrock-mantle titik akhir di semua Wilayah yang mendukung bedrock-mantle (lihatWilayah dan Titik Akhir yang Didukung). Pada bedrock-runtime titik akhir, tersedia di semua Wilayah di mana model Claude tersedia. Lihat Ketersediaan wilayah untuk detail.

Prasyarat

Sebelum menggunakan Messages API, pastikan Anda memiliki yang berikut:

  • Akses model — Minta akses ke model Claude di konsol Amazon Bedrock. Lihat Minta akses ke model.

  • Otentikasi — Tergantung pada titik akhir:

    • bedrock-mantle— Gunakan kunci Amazon Bedrock API (lihatKunci API) atau kredenal AWS SiGv4.

    • bedrock-runtime— Gunakan kredensi AWS SiGv4 melalui AWS SDK (boto3, dll.).

  • Header versi antropik - Semua permintaan memerlukan versi API:

    • bedrock-mantle: Ditetapkan anthropic-version: 2023-06-01 sebagai header HTTP.

    • bedrock-runtime: Ditetapkan "anthropic_version": "bedrock-2023-05-31" di badan permintaan.

Permintaan dasar

Untuk mengirim pesan dasar ke model Claude, pilih tab untuk metode pilihan Anda, lalu ikuti langkah-langkahnya:

bedrock-mantle (curl)
curl -X POST https://bedrock-mantle.us-east-1.api.aws/anthropic/v1/messages \ -H "x-api-key: $BEDROCK_API_KEY" \ -H "anthropic-version: 2023-06-01" \ -H "Content-Type: application/json" \ -d '{ "model": "anthropic.claude-sonnet-4-6-v1", "max_tokens": 1024, "messages": [ {"role": "user", "content": "Explain quantum computing in one sentence."} ] }'
bedrock-runtime (Python)
import boto3 import json client = boto3.client("bedrock-runtime", region_name="us-east-1") response = client.invoke_model( modelId="anthropic.claude-sonnet-4-6-v1", body=json.dumps({ "anthropic_version": "bedrock-2023-05-31", "max_tokens": 1024, "messages": [ {"role": "user", "content": "Explain quantum computing in one sentence."} ] }) ) result = json.loads(response["body"].read()) print(result["content"][0]["text"])
bedrock-runtime (curl)

Gunakan AWS CLI untuk memanggil model:

aws bedrock-runtime invoke-model \ --model-id anthropic.claude-sonnet-4-6-v1 \ --body '{ "anthropic_version": "bedrock-2023-05-31", "max_tokens": 1024, "messages": [ {"role": "user", "content": "Explain quantum computing in one sentence."} ] }' \ --cli-binary-format raw-in-base64-out \ output.json

Tanggapan aliran

Untuk menerima token respons secara bertahap saat dibuat, pilih tab untuk metode pilihan Anda, lalu ikuti langkah-langkahnya:

bedrock-mantle (curl)
curl -X POST https://bedrock-mantle.us-east-1.api.aws/anthropic/v1/messages \ -H "x-api-key: $BEDROCK_API_KEY" \ -H "anthropic-version: 2023-06-01" \ -H "Content-Type: application/json" \ -d '{ "model": "anthropic.claude-sonnet-4-6-v1", "max_tokens": 1024, "stream": true, "messages": [ {"role": "user", "content": "Write a short poem about cloud computing."} ] }'
bedrock-runtime (Python)
import boto3 import json client = boto3.client("bedrock-runtime", region_name="us-east-1") response = client.invoke_model_with_response_stream( modelId="anthropic.claude-sonnet-4-6-v1", body=json.dumps({ "anthropic_version": "bedrock-2023-05-31", "max_tokens": 1024, "messages": [ {"role": "user", "content": "Write a short poem about cloud computing."} ] }) ) for event in response["body"]: chunk = json.loads(event["chunk"]["bytes"]) if chunk["type"] == "content_block_delta": print(chunk["delta"]["text"], end="")

Fitur yang didukung

Messages API mendukung fitur-fitur canggih berikut dengan model Claude:

Untuk format permintaan dan respons Messages API lengkap, termasuk semua parameter dan fitur, lihatAntropik Claude Pesan API.

Hitung token

Untuk menghitung jumlah token input yang akan dikonsumsi permintaan sebelum mengirimnya untuk inferensi, gunakan count_tokens jalur Anthropic di titik akhirbedrock-mantle. Ini adalah satu-satunya jalur penghitungan token yang didukung untuk model Claude yang tidak tersedia dengan Region-specific titik akhir, termasuk model Claude yang diluncurkan bedrock-runtime dengan inferensi lintas wilayah (CRIS) saja. Untuk detail dan contoh, lihat Hitung token menggunakan endpoint batuan dasar mantel.