View a markdown version of this page

Anthropic Messages API를 사용한 추론 - Amazon Bedrock

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

Anthropic Messages API를 사용한 추론

Anthropic Messages API는 Anthropic 요청 및 응답 형식을 사용하여 Claude 모델에 대한 기본 액세스를 제공합니다. bedrock-mantlebedrock-runtime 엔드포인트 모두에서 메시지 API를 사용하여 애플리케이션에 맞는 인증 및 통합 스타일을 유연하게 선택할 수 있습니다.

Endpoint 기본 URL 사용 사례:
bedrock-mantle https://bedrock-mantle.{region}.api.aws/anthropic/v1/messages 새 애플리케이션에 권장됩니다. API 키 인증 및를 지원합니다Workspaces(Anthropic 호환).
bedrock-runtime https://bedrock-runtime.{region}.amazonaws.com 기존 AWS SDK 통합 및 호출 로깅과 함께를 사용합니다.

지원되는 리전:

메시지 API는가 지원하는 모든 리전의 bedrock-mantle 엔드포인트에서 사용할 수 있습니다bedrock-mantle( 참조지원되는 리전 및 엔드포인트). bedrock-runtime 엔드포인트에서는 Claude 모델을 사용할 수 있는 모든 리전에서 사용할 수 있습니다. 세부 정보는 리전별 가용성 섹션을 참조하세요.

사전 조건

메시지 API를 사용하기 전에 다음이 있는지 확인합니다.

  • 모델 액세스 - Amazon Bedrock 콘솔에서 Claude 모델에 대한 액세스를 요청합니다. 모델에 대한 액세스 요청을(를) 참조하세요.

  • 인증 - 엔드포인트에 따라 다릅니다.

    • bedrock-mantle - Amazon Bedrock API 키( 참조API 키) 또는 AWS SigV4 자격 증명을 사용합니다.

    • bedrock-runtime - AWS SDK(boto3 등)를 통해 AWS SigV4 자격 증명을 사용합니다.

  • Anthropic 버전 헤더 - 모든 요청에는 API 버전이 필요합니다.

    • bedrock-mantle: HTTP 헤더anthropic-version: 2023-06-01로 설정합니다.

    • bedrock-runtime: 요청 본문"anthropic_version": "bedrock-2023-05-31"에를 설정합니다.

기본 요청

Claude 모델에 기본 메시지를 보내려면 원하는 방법의 탭을 선택한 다음 다음 단계를 따릅니다.

bedrock-mantle (curl)
curl -X POST https://bedrock-mantle.us-east-1.api.aws/anthropic/v1/messages \ -H "x-api-key: $BEDROCK_API_KEY" \ -H "anthropic-version: 2023-06-01" \ -H "Content-Type: application/json" \ -d '{ "model": "anthropic.claude-sonnet-4-6-v1", "max_tokens": 1024, "messages": [ {"role": "user", "content": "Explain quantum computing in one sentence."} ] }'
bedrock-runtime (Python)
import boto3 import json client = boto3.client("bedrock-runtime", region_name="us-east-1") response = client.invoke_model( modelId="anthropic.claude-sonnet-4-6-v1", body=json.dumps({ "anthropic_version": "bedrock-2023-05-31", "max_tokens": 1024, "messages": [ {"role": "user", "content": "Explain quantum computing in one sentence."} ] }) ) result = json.loads(response["body"].read()) print(result["content"][0]["text"])
bedrock-runtime (curl)

AWS CLI를 사용하여 모델을 호출합니다.

aws bedrock-runtime invoke-model \ --model-id anthropic.claude-sonnet-4-6-v1 \ --body '{ "anthropic_version": "bedrock-2023-05-31", "max_tokens": 1024, "messages": [ {"role": "user", "content": "Explain quantum computing in one sentence."} ] }' \ --cli-binary-format raw-in-base64-out \ output.json

스트림 응답

응답 토큰이 생성될 때 증분식으로 수신하려면 원하는 방법의 탭을 선택한 다음 다음 단계를 따릅니다.

bedrock-mantle (curl)
curl -X POST https://bedrock-mantle.us-east-1.api.aws/anthropic/v1/messages \ -H "x-api-key: $BEDROCK_API_KEY" \ -H "anthropic-version: 2023-06-01" \ -H "Content-Type: application/json" \ -d '{ "model": "anthropic.claude-sonnet-4-6-v1", "max_tokens": 1024, "stream": true, "messages": [ {"role": "user", "content": "Write a short poem about cloud computing."} ] }'
bedrock-runtime (Python)
import boto3 import json client = boto3.client("bedrock-runtime", region_name="us-east-1") response = client.invoke_model_with_response_stream( modelId="anthropic.claude-sonnet-4-6-v1", body=json.dumps({ "anthropic_version": "bedrock-2023-05-31", "max_tokens": 1024, "messages": [ {"role": "user", "content": "Write a short poem about cloud computing."} ] }) ) for event in response["body"]: chunk = json.loads(event["chunk"]["bytes"]) if chunk["type"] == "content_block_delta": print(chunk["delta"]["text"], end="")

지원되는 기능

Messages API는 Claude 모델에서 다음과 같은 고급 기능을 지원합니다.

  • 시스템 프롬프트 - system 파라미터를 사용하여 모델 동작을 설정합니다.

  • 멀티턴 대화 - 교대 userassistant 메시지를 전달합니다.

  • 도구 사용 - 모델이 호출할 수 있는 도구를 정의합니다. 도구를 사용하여 Amazon Bedrock 모델 응답 완성을(를) 참조하세요.

  • 비전 - content 배열의 이미지를 텍스트와 함께 전송합니다.

  • 확장된 사고 chain-of-thought 추론을 활성화합니다. 모델 추론을 사용하여 모델 응답 향상을(를) 참조하세요.

  • 프롬프트 캐싱 - 캐시가 자주 사용하는 컨텍스트를 사용하여 지연 시간과 비용을 줄입니다.

모든 파라미터 및 기능을 포함한 전체 메시지 API 요청 및 응답 형식은 섹션을 참조하세요Anthropic Claude Messages API.

토큰 수 계산

요청이 추론을 위해 전송하기 전에 사용할 입력 토큰 수를 계산하려면 bedrock-mantle 엔드포인트에서 Anthropic count_tokens 경로를 사용합니다. 교차 리전 추론(CRIS)으로만 시작하는 Claude 모델을 포함하여 리전별 엔드포인트bedrock-runtime가 있는에서 사용할 수 없는 Claude 모델에 대해 지원되는 유일한 토큰 계산 경로입니다. 자세한 정보 및 예제는 bedrock-mantle 엔드포인트를 사용하여 토큰 계산 섹션을 참조하세요.