View a markdown version of this page

Claude Sonnet 4 - Amazon Bedrock

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

Claude Sonnet 4

Orange rounded square icon with white radial loading spinner design. Anthropic - Claude Sonnet 4

모델 세부 정보

Claude Sonnet 4는 강력한 코딩 및 추론 기능, 향상된 지침, 도구 사용을 통한 확장된 사고를 갖춘 Anthropic의 균형 잡힌 모델입니다. 모델 개발 및 성능에 대한 자세한 내용은 모델/서비스 카드를 참조하세요.

  • 모델 출시 날짜: 2025년 5월 23일

  • 모델 EOL 날짜: 2026년 10월 14일

  • 최종 사용자 라이선스 계약 및 이용 약관: 보기

  • 모델 수명 주기: 레거시(특정 리전)

  • 컨텍스트 창: 토큰 200K 개

  • 최대 출력 토큰: 64K

  • 추론: 지원됨

  • 지식 마감: 2025년 3월

  • Marketplace 제품 ID: prod-4pmewlybdftbs

입력 모달리티 출력 모달리티 지원되는 APIs 지원되는 엔드포인트
오디오 임베딩 Responses bedrock-runtime
이미지 이미지 Chat Completions bedrock-mantle
음성 음성 Invoke
텍스트 텍스트 Converse
비디오 비디오

기능 및 기능

Bedrock 기능

bedrock-runtime 엔드포인트를 사용하여 지원되는 기능

bedrock-runtime 엔드포인트를 사용한 프롬프트 캐싱

자세한 내용은 더 빠른 모델 추론을 위한 프롬프트 캐싱을 참조하세요.

프롬프트 캐싱 지원 캐시 체크포인트당 최소 토큰 수 요청당 최대 캐시 체크포인트 지원되는 TTL 프롬프트 캐시 체크포인트를 허용하는 필드
1,024 4 5분 system, messagestools

가격 책정

요금은 Amazon Bedrock 요금 페이지를 참조하세요.

프로그래밍 방식 액세스

다음 모델 IDs 및 엔드포인트 URLs 사용하여이 모델에 프로그래밍 방식으로 액세스합니다. 사용 가능한 APIs 및 엔드포인트에 대한 자세한 내용은 APIs 지원엔드포인트 지원 단원을 참조하십시오.

Endpoint 모델 ID 리전 내 엔드포인트 URL 지리 추론 ID 글로벌 추론 ID
bedrock-runtime anthropic.claude-sonnet-4-20250514-v1:0 https://bedrock-runtime.{region}.amazonaws.com

us.anthropic.claude-sonnet-4-20250514-v1:0

eu.anthropic.claude-sonnet-4-20250514-v1:0

apac.anthropic.claude-sonnet-4-20250514-v1:0

global.anthropic.claude-sonnet-4-20250514-v1:0

예를 들어 리전이 us-east-1(버지니아 북부)인 경우 bedrock-runtime 엔드포인트 URL은 "https://bedrock-runtime.us-east-1.amazonaws.com"이고 bedrock-mantle의 경우 "https://bedrock-mantle.us-east-1.api.aws/v1"입니다.

서비스 티어

Amazon Bedrock은 워크로드 요구 사항에 맞는 여러 서비스 계층을 제공합니다. 표준은 약정 없이 pay-per-token 액세스를 제공합니다. Priority는 시간 기반 약정으로 더 높은 처리량을 제공합니다. Flex는 유연하고 non-time-sensitive 워크로드에 대해 저렴한 액세스를 제공합니다. 예약은 예측 가능한 워크로드에 대한 기간 약정과 함께 전용 처리량을 제공합니다. 자세한 내용은 서비스 계층을 참조하세요.

표준 우선 순위 Flex 예약됨

리전별 가용성

리전별 가용성 개요

Bedrock은 세 가지 추론 옵션을 제공합니다. 리전 내는 엄격한 규정 준수를 위해 단일 리전 내에 요청을 유지하고, 리전(미국, EU 등) 내 리전 간 지리적 교차 리전 경로는 데이터 레지던시를 준수하면서 더 높은 처리량을 제공하며, 글로벌 교차 리전 경로는 레지던시 제약이 없는 경우 최대 처리량을 위해 전 세계 어디서나 라우팅됩니다. 자세한 내용은 리전별 가용성 페이지를 참조하세요.

리전 리전 내 지리 [Global]
us-east-1 (버지니아 북부)
us-east-2 (오하이오)
us-west-1 (캘리포니아 북부)
us-west-2 (오레곤)
eu-central-1 (프랑크푸르트)
eu-north-1 (스톡홀름)
eu-south-1 (밀라노)
eu-south-2 (스페인)
eu-west-1 (아일랜드)
eu-west-3 (파리)
ap-northeast-1 (도쿄)
il-central-1 (텔아비브)
ap-east-2 (오사카)
ap-northeast-2 (서울)
ap-northeast-3 (오사카)
ap-south-1 (뭄바이)
ap-south-2 (하이데라바드)
ap-southeast-1 (싱가포르)
ap-southeast-2 (시드니)
ap-southeast-3 (자카르타)
ap-southeast-4 (멜버른)
ap-southeast-5 (말레이시아)
ap-southeast-7 (태국)
me-central-1 (UAE)

지리 추론 세부 정보

지역: 미국

지리 추론 ID: us.anthropic.claude-sonnet-4-20250514-v1:0

소스 리전 대상 리전
us-east-1(버지니아 북부)us-east-1(버지니아 북부), us-east-2(오하이오), us-west-2(오레곤)
us-east-2(오하이오)us-east-1(버지니아 북부), us-east-2(오하이오), us-west-2(오레곤)
us-west-1(캘리포니아 북부)us-east-1(버지니아 북부), us-east-2(오하이오), us-west-1(캘리포니아 북부), us-west-2(오레곤)
us-west-2(오리건)us-east-1(버지니아 북부), us-east-2(오하이오), us-west-2(오레곤)

지역: EU

지리 추론 ID: eu.anthropic.claude-sonnet-4-20250514-v1:0

소스 리전 대상 리전
eu-central-1(프랑크푸르트)eu-central-1(프랑크푸르트), eu-north-1(스톡홀름), eu-south-1(밀라노), eu-south-2(스페인), eu-west-1(아일랜드), eu-west-3(파리)
eu-north-1(스톡홀름)eu-central-1(프랑크푸르트), eu-north-1(스톡홀름), eu-south-1(밀라노), eu-south-2(스페인), eu-west-1(아일랜드), eu-west-3(파리)
eu-south-1(밀라노)eu-central-1(프랑크푸르트), eu-north-1(스톡홀름), eu-south-1(밀라노), eu-south-2(스페인), eu-west-1(아일랜드), eu-west-3(파리)
eu-south-2(스페인)eu-central-1(프랑크푸르트), eu-north-1(스톡홀름), eu-south-1(밀라노), eu-south-2(스페인), eu-west-1(아일랜드), eu-west-3(파리)
eu-west-1(아일랜드)eu-central-1(프랑크푸르트), eu-north-1(스톡홀름), eu-south-1(밀라노), eu-south-2(스페인), eu-west-1(아일랜드), eu-west-3(파리)
eu-west-3(파리)eu-central-1(프랑크푸르트), eu-north-1(스톡홀름), eu-south-1(밀라노), eu-south-2(스페인), eu-west-1(아일랜드), eu-west-3(파리)
il-central-1(텔아비브)eu-central-1(프랑크푸르트), eu-north-1(스톡홀름), eu-south-1(밀라노), eu-south-2(스페인), eu-west-1(아일랜드), eu-west-3(파리), il-central-1(텔아비브)

지리: APAC

지리 추론 ID: apac.anthropic.claude-sonnet-4-20250514-v1:0

소스 리전 대상 리전
ap-northeast-1(도쿄)ap-northeast-1(도쿄), ap-northeast-2(서울), ap-northeast-3(오사카), ap-south-1(뭄바이), ap-south-2(하이데라바드), ap-southeast-1(싱가포르), ap-southeast-2(시드니), ap-southeast-4(멜버른)
ap-northeast-2(서울)ap-northeast-1(도쿄), ap-northeast-2(서울), ap-northeast-3(오사카), ap-south-1(뭄바이), ap-south-2(하이데라바드), ap-southeast-1(싱가포르), ap-southeast-2(시드니), ap-southeast-4(멜버른)
ap-northeast-3(오사카)ap-northeast-1(도쿄), ap-northeast-2(서울), ap-northeast-3(오사카), ap-south-1(뭄바이), ap-south-2(하이데라바드), ap-southeast-1(싱가포르), ap-southeast-2(시드니), ap-southeast-4(멜버른)
ap-south-1(뭄바이)ap-northeast-1(도쿄), ap-northeast-2(서울), ap-northeast-3(오사카), ap-south-1(뭄바이), ap-south-2(하이데라바드), ap-southeast-1(싱가포르), ap-southeast-2(시드니), ap-southeast-4(멜버른)
ap-south-2(하이데라바드)ap-northeast-1(도쿄), ap-northeast-2(서울), ap-northeast-3(오사카), ap-south-1(뭄바이), ap-south-2(하이데라바드), ap-southeast-1(싱가포르), ap-southeast-2(시드니), ap-southeast-4(멜버른)
ap-southeast-1(싱가포르)ap-northeast-1(도쿄), ap-northeast-2(서울), ap-northeast-3(오사카), ap-south-1(뭄바이), ap-south-2(하이데라바드), ap-southeast-1(싱가포르), ap-southeast-2(시드니), ap-southeast-4(멜버른)
ap-southeast-2(시드니)ap-northeast-1(도쿄), ap-northeast-2(서울), ap-northeast-3(오사카), ap-south-1(뭄바이), ap-south-2(하이데라바드), ap-southeast-1(싱가포르), ap-southeast-2(시드니), ap-southeast-4(멜버른)

글로벌 추론 세부 정보

글로벌 추론 ID 아메리카 EMEA 아시아 태평양
global.anthropic.claude-sonnet-4-20250514-v1:0
  • us-east-1(버지니아 북부)

  • us-east-2(오하이오)

  • us-west-2(오리건)

  • eu-west-1(아일랜드)

  • ap-northeast-1(도쿄)

할당량과 제한

AWS 계정에는 서비스 성능을 유지하고 Amazon Bedrock을 적절하게 사용하기 위한 기본 할당량이 있습니다. 계정에 할당된 기본 할당량은 리전 요인, 결제 기록, 사기 사용 및/또는 할당량 증가 요청 승인에 따라 업데이트될 수 있습니다. 자세한 내용은 Amazon Bedrock의 할당량 설명서를 참조하고 모델의 제한을 참조하세요.

샘플 코드

1단계 - AWS 계정: AWS 계정이 이미 있는 경우이 단계를 건너뜁니다. AWS를 처음 사용하는 경우 AWS 계정에 가입합니다.

2단계 - API 키: Amazon Bedrock 콘솔로 이동하여 장기 API 키를 생성합니다.

3단계 - SDK 가져오기:이 시작 안내서를 사용하려면 Python이 이미 설치되어 있어야 합니다. 그런 다음 사용 중인 APIs에 따라 관련 소프트웨어를 설치합니다.

pip install boto3

4단계 - 환경 변수 설정: 인증에 API 키를 사용하도록 환경을 구성합니다.

AWS_BEARER_TOKEN_BEDROCK="<provide your Bedrock API key>"

5단계 - 첫 번째 추론 요청 실행: 파일을 로 저장 bedrock-first-request.py

Invoke API
import json import boto3 client = boto3.client('bedrock-runtime', region_name='us-east-1') response = client.invoke_model( modelId='anthropic.claude-sonnet-4-20250514-v1:0', body=json.dumps({ 'anthropic_version': 'bedrock-2023-05-31', 'messages': [{ 'role': 'user', 'content': 'Can you explain the features of Amazon Bedrock?'}], 'max_tokens': 1024 }) ) print(json.loads(response['body'].read()))
Converse API
import boto3 client = boto3.client('bedrock-runtime', region_name='us-east-1') response = client.converse( modelId='anthropic.claude-sonnet-4-20250514-v1:0', messages=[ { 'role': 'user', 'content': [{'text': 'Can you explain the features of Amazon Bedrock?'}] } ] ) print(response)