

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

# Inferensi menggunakan Anthropic Messages API
<a name="inference-messages-api"></a>

Anthropic Messages API menyediakan akses asli ke model Claude menggunakan format permintaan dan respons Anthropic. Anda dapat menggunakan Messages API di kedua `bedrock-runtime` titik akhir `bedrock-mantle` dan memberi Anda fleksibilitas untuk memilih gaya otentikasi dan integrasi yang sesuai dengan aplikasi Anda.


| **Titik akhir** | **URL dasar** | **Kasus penggunaan** | 
| --- | --- | --- | 
| bedrock-mantle | https://bedrock-mantle.{region}.api.aws/anthropic/v1/messages | Direkomendasikan untuk aplikasi baru. Mendukung autentikasi kunci API dan[Ruang kerja () Anthropic-compatible](workspaces.md). | 
| bedrock-runtime | https://bedrock-runtime.{region}.amazonaws.com | Gunakan dengan integrasi AWS SDK yang ada dan logging pemanggilan. | 

## Wilayah yang Didukung
<a name="inference-messages-api-supported"></a>

API Pesan tersedia di `bedrock-mantle` titik akhir di semua Wilayah yang mendukung `bedrock-mantle` (lihat[Wilayah dan Titik Akhir yang Didukung](bedrock-mantle.md#bedrock-mantle-supported)). Pada `bedrock-runtime` titik akhir, tersedia di semua Wilayah di mana model Claude tersedia. Lihat [Ketersediaan wilayah](models-region-compatibility.md) untuk detail.

## Prasyarat
<a name="inference-messages-api-prereq"></a>

Sebelum menggunakan Messages API, pastikan Anda memiliki yang berikut:
+ **Akses model** — Minta akses ke model Claude di konsol Amazon Bedrock. Lihat [Minta akses ke model](model-access.md).
+ **Otentikasi** — Tergantung pada titik akhir:
  + `bedrock-mantle`— Gunakan kunci Amazon Bedrock API (lihat[Kunci API](api-keys.md)) atau kredenal AWS SiGv4.
  + `bedrock-runtime`— Gunakan kredensi AWS SiGv4 melalui AWS SDK (boto3, dll.).
+ **Header versi antropik** - Semua permintaan memerlukan versi API:
  + `bedrock-mantle`: Ditetapkan `anthropic-version: 2023-06-01` sebagai header HTTP.
  + `bedrock-runtime`: Ditetapkan `"anthropic_version": "bedrock-2023-05-31"` di badan permintaan.

## Permintaan dasar
<a name="inference-messages-api-basic"></a>

Untuk mengirim pesan dasar ke model Claude, pilih tab untuk metode pilihan Anda, lalu ikuti langkah-langkahnya:

------
#### [ bedrock-mantle (curl) ]

```
curl -X POST https://bedrock-mantle.us-east-1.api.aws/anthropic/v1/messages \
  -H "x-api-key: $BEDROCK_API_KEY" \
  -H "anthropic-version: 2023-06-01" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "anthropic.claude-sonnet-4-6-v1",
    "max_tokens": 1024,
    "messages": [
        {"role": "user", "content": "Explain quantum computing in one sentence."}
    ]
  }'
```

------
#### [ bedrock-runtime (Python) ]

```
import boto3
import json

client = boto3.client("bedrock-runtime", region_name="us-east-1")

response = client.invoke_model(
    modelId="anthropic.claude-sonnet-4-6-v1",
    body=json.dumps({
        "anthropic_version": "bedrock-2023-05-31",
        "max_tokens": 1024,
        "messages": [
            {"role": "user", "content": "Explain quantum computing in one sentence."}
        ]
    })
)

result = json.loads(response["body"].read())
print(result["content"][0]["text"])
```

------
#### [ bedrock-runtime (curl) ]

Gunakan AWS CLI untuk memanggil model:

```
aws bedrock-runtime invoke-model \
  --model-id anthropic.claude-sonnet-4-6-v1 \
  --body '{
    "anthropic_version": "bedrock-2023-05-31",
    "max_tokens": 1024,
    "messages": [
        {"role": "user", "content": "Explain quantum computing in one sentence."}
    ]
  }' \
  --cli-binary-format raw-in-base64-out \
  output.json
```

------

## Tanggapan aliran
<a name="inference-messages-api-streaming"></a>

Untuk menerima token respons secara bertahap saat dibuat, pilih tab untuk metode pilihan Anda, lalu ikuti langkah-langkahnya:

------
#### [ bedrock-mantle (curl) ]

```
curl -X POST https://bedrock-mantle.us-east-1.api.aws/anthropic/v1/messages \
  -H "x-api-key: $BEDROCK_API_KEY" \
  -H "anthropic-version: 2023-06-01" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "anthropic.claude-sonnet-4-6-v1",
    "max_tokens": 1024,
    "stream": true,
    "messages": [
        {"role": "user", "content": "Write a short poem about cloud computing."}
    ]
  }'
```

------
#### [ bedrock-runtime (Python) ]

```
import boto3
import json

client = boto3.client("bedrock-runtime", region_name="us-east-1")

response = client.invoke_model_with_response_stream(
    modelId="anthropic.claude-sonnet-4-6-v1",
    body=json.dumps({
        "anthropic_version": "bedrock-2023-05-31",
        "max_tokens": 1024,
        "messages": [
            {"role": "user", "content": "Write a short poem about cloud computing."}
        ]
    })
)

for event in response["body"]:
    chunk = json.loads(event["chunk"]["bytes"])
    if chunk["type"] == "content_block_delta":
        print(chunk["delta"]["text"], end="")
```

------

## Fitur yang didukung
<a name="inference-messages-api-features"></a>

Messages API mendukung fitur-fitur canggih berikut dengan model Claude:
+ **Permintaan sistem** - Atur perilaku model dengan `system` parameter.
+ **Multi-turn percakapan** — Lulus bolak-balik `user` dan `assistant` pesan.
+ **Penggunaan alat** - Tentukan alat yang dapat dipanggil model. Lihat [Gunakan alat untuk menyelesaikan respons model Amazon Bedrock](tool-use.md).
+ **Visi** - Kirim gambar dalam `content` array bersama teks.
+ **Pemikiran yang diperluas** — Aktifkan penalaran rantai pikiran. Lihat [Tingkatkan respons model dengan penalaran model](inference-reasoning.md).
+ **Prompt caching** — Cache sering digunakan konteks untuk mengurangi latensi dan biaya.

Untuk format permintaan dan respons Messages API lengkap, termasuk semua parameter dan fitur, lihat[Antropik Claude Pesan API](model-parameters-anthropic-claude-messages.md).

## Hitung token
<a name="inference-messages-api-count-tokens"></a>

Untuk menghitung jumlah token input yang akan dikonsumsi permintaan sebelum mengirimnya untuk inferensi, gunakan `count_tokens` jalur Anthropic di titik akhir`bedrock-mantle`. Ini adalah satu-satunya jalur penghitungan token yang didukung untuk model Claude yang tidak tersedia dengan Region-specific titik akhir, termasuk model Claude yang diluncurkan `bedrock-runtime` dengan inferensi lintas wilayah (CRIS) saja. Untuk detail dan contoh, lihat [Hitung token menggunakan endpoint batuan dasar mantel](count-tokens.md#count-tokens-mantle).