

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

# Anthropic Messages API를 사용한 추론
<a name="inference-messages-api"></a>

Anthropic Messages API는 Anthropic 요청 및 응답 형식을 사용하여 Claude 모델에 대한 기본 액세스를 제공합니다. `bedrock-mantle` 및 `bedrock-runtime` 엔드포인트 모두에서 메시지 API를 사용하여 애플리케이션에 맞는 인증 및 통합 스타일을 유연하게 선택할 수 있습니다.


| **Endpoint** | **기본 URL** | **사용 사례**: | 
| --- | --- | --- | 
| bedrock-mantle | https://bedrock-mantle.{region}.api.aws/anthropic/v1/messages | 새 애플리케이션에 권장됩니다. API 키 인증 및를 지원합니다[Workspaces(Anthropic 호환)](workspaces.md). | 
| bedrock-runtime | https://bedrock-runtime.{region}.amazonaws.com | 기존 AWS SDK 통합 및 호출 로깅과 함께를 사용합니다. | 

## 지원되는 리전:
<a name="inference-messages-api-supported"></a>

메시지 API는가 지원하는 모든 리전의 `bedrock-mantle` 엔드포인트에서 사용할 수 있습니다`bedrock-mantle`( 참조[지원되는 리전 및 엔드포인트](bedrock-mantle.md#bedrock-mantle-supported)). `bedrock-runtime` 엔드포인트에서는 Claude 모델을 사용할 수 있는 모든 리전에서 사용할 수 있습니다. 세부 정보는 [리전별 가용성](models-region-compatibility.md) 섹션을 참조하세요.

## 사전 조건
<a name="inference-messages-api-prereq"></a>

메시지 API를 사용하기 전에 다음이 있는지 확인합니다.
+ **모델 액세스** - Amazon Bedrock 콘솔에서 Claude 모델에 대한 액세스를 요청합니다. [모델에 대한 액세스 요청](model-access.md)을(를) 참조하세요.
+ **인증** - 엔드포인트에 따라 다릅니다.
  + `bedrock-mantle` - Amazon Bedrock API 키( 참조[API 키](api-keys.md)) 또는 AWS SigV4 자격 증명을 사용합니다.
  + `bedrock-runtime` - AWS SDK(boto3 등)를 통해 AWS SigV4 자격 증명을 사용합니다.
+ **Anthropic 버전 헤더** - 모든 요청에는 API 버전이 필요합니다.
  + `bedrock-mantle`: HTTP 헤더`anthropic-version: 2023-06-01`로 설정합니다.
  + `bedrock-runtime`: 요청 본문`"anthropic_version": "bedrock-2023-05-31"`에를 설정합니다.

## 기본 요청
<a name="inference-messages-api-basic"></a>

Claude 모델에 기본 메시지를 보내려면 원하는 방법의 탭을 선택한 다음 다음 단계를 따릅니다.

------
#### [ bedrock-mantle (curl) ]

```
curl -X POST https://bedrock-mantle.us-east-1.api.aws/anthropic/v1/messages \
  -H "x-api-key: $BEDROCK_API_KEY" \
  -H "anthropic-version: 2023-06-01" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "anthropic.claude-sonnet-4-6-v1",
    "max_tokens": 1024,
    "messages": [
        {"role": "user", "content": "Explain quantum computing in one sentence."}
    ]
  }'
```

------
#### [ bedrock-runtime (Python) ]

```
import boto3
import json

client = boto3.client("bedrock-runtime", region_name="us-east-1")

response = client.invoke_model(
    modelId="anthropic.claude-sonnet-4-6-v1",
    body=json.dumps({
        "anthropic_version": "bedrock-2023-05-31",
        "max_tokens": 1024,
        "messages": [
            {"role": "user", "content": "Explain quantum computing in one sentence."}
        ]
    })
)

result = json.loads(response["body"].read())
print(result["content"][0]["text"])
```

------
#### [ bedrock-runtime (curl) ]

 AWS CLI를 사용하여 모델을 호출합니다.

```
aws bedrock-runtime invoke-model \
  --model-id anthropic.claude-sonnet-4-6-v1 \
  --body '{
    "anthropic_version": "bedrock-2023-05-31",
    "max_tokens": 1024,
    "messages": [
        {"role": "user", "content": "Explain quantum computing in one sentence."}
    ]
  }' \
  --cli-binary-format raw-in-base64-out \
  output.json
```

------

## 스트림 응답
<a name="inference-messages-api-streaming"></a>

응답 토큰이 생성될 때 증분식으로 수신하려면 원하는 방법의 탭을 선택한 다음 다음 단계를 따릅니다.

------
#### [ bedrock-mantle (curl) ]

```
curl -X POST https://bedrock-mantle.us-east-1.api.aws/anthropic/v1/messages \
  -H "x-api-key: $BEDROCK_API_KEY" \
  -H "anthropic-version: 2023-06-01" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "anthropic.claude-sonnet-4-6-v1",
    "max_tokens": 1024,
    "stream": true,
    "messages": [
        {"role": "user", "content": "Write a short poem about cloud computing."}
    ]
  }'
```

------
#### [ bedrock-runtime (Python) ]

```
import boto3
import json

client = boto3.client("bedrock-runtime", region_name="us-east-1")

response = client.invoke_model_with_response_stream(
    modelId="anthropic.claude-sonnet-4-6-v1",
    body=json.dumps({
        "anthropic_version": "bedrock-2023-05-31",
        "max_tokens": 1024,
        "messages": [
            {"role": "user", "content": "Write a short poem about cloud computing."}
        ]
    })
)

for event in response["body"]:
    chunk = json.loads(event["chunk"]["bytes"])
    if chunk["type"] == "content_block_delta":
        print(chunk["delta"]["text"], end="")
```

------

## 지원되는 기능
<a name="inference-messages-api-features"></a>

Messages API는 Claude 모델에서 다음과 같은 고급 기능을 지원합니다.
+ **시스템 프롬프트 **- `system` 파라미터를 사용하여 모델 동작을 설정합니다.
+ **멀티턴 대화 -** 교대 `user` 및 `assistant` 메시지를 전달합니다.
+ **도구 사용** - 모델이 호출할 수 있는 도구를 정의합니다. [도구를 사용하여 Amazon Bedrock 모델 응답 완성](tool-use.md)을(를) 참조하세요.
+ **비전** - `content` 배열의 이미지를 텍스트와 함께 전송합니다.
+ **확장된 사고** chain-of-thought 추론을 활성화합니다. [모델 추론을 사용하여 모델 응답 향상](inference-reasoning.md)을(를) 참조하세요.
+ **프롬프트 캐싱** - 캐시가 자주 사용하는 컨텍스트를 사용하여 지연 시간과 비용을 줄입니다.

모든 파라미터 및 기능을 포함한 전체 메시지 API 요청 및 응답 형식은 섹션을 참조하세요[Anthropic Claude Messages API](model-parameters-anthropic-claude-messages.md).

## 토큰 수 계산
<a name="inference-messages-api-count-tokens"></a>

요청이 추론을 위해 전송하기 전에 사용할 입력 토큰 수를 계산하려면 `bedrock-mantle` 엔드포인트에서 Anthropic `count_tokens` 경로를 사용합니다. 교차 리전 추론(CRIS)으로만 시작하는 Claude 모델을 포함하여 리전별 엔드포인트`bedrock-runtime`가 있는에서 사용할 수 없는 Claude 모델에 대해 지원되는 유일한 토큰 계산 경로입니다. 자세한 정보 및 예제는 [bedrock-mantle 엔드포인트를 사용하여 토큰 계산](count-tokens.md#count-tokens-mantle) 섹션을 참조하세요.