View a markdown version of this page

Grok 4.3 - Amazon Bedrock

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

Grok 4.3

Icon showing the xAI logo. xAI - Grok 4.3

모델 세부 정보

Grok 4.3은 항상 작동하고 구성 가능한 추론 작업(없음, 낮음, 중간, 높음)을 제공하는 추론 우선 모델입니다. 추론은 선택 사항보다는 항상 활성화되므로 사고를 건너뛸 수 있는 모델보다 다단계 에이전트 루프에서 더 일관되게 작동합니다. 또한 다단계 에이전트를 구축하기 위한 강력한 도구 사용 및 지침 준수 기능과 대용량 추론을 비용 효율적으로 유지하는 데 도움이 되는 토큰 효율성을 제공합니다. Grok 4.3은 계약 검토, 판례 조사, 신용 계약 분석, 금융 문서 Q&A와 같은 엔터프라이즈 워크로드에 특히 적합하며 대화형 AI, 검색, 채팅 및 멀티턴 워크플로 전반에서 일관되고 고품질의 결과를 제공합니다. Grok 4.3은 가격 성능을 위해 설계된 Amazon Bedrock의 새로운 추론 엔진인 Mantle에서 실행되며 도구 호출, 구조화된 출력 및 응답 스트리밍을 지원합니다.

  • 모델 출시 날짜: 2026년 6월 15일

  • 모델 EOL 날짜: 해당 사항 없음

  • 최종 사용자 라이선스 계약 및 이용 약관: 보기

  • 모델 수명 주기: 활성

  • 컨텍스트 창: 1M0만 개의 토큰

  • 추론: 지원됨(구성 가능: 낮음, 중간, 높음)

입력 모달리티 출력 모달리티 지원되는 APIs 지원되는 엔드포인트
Red circle with white X icon indicating error, cancel, or close action. 오디오Red circle with white X icon indicating error, cancel, or close action. 임베딩Green circle with white checkmark icon. Chat CompletionsRed circle with white X icon indicating error, cancel, or close action. bedrock-runtime
Green circle with white checkmark icon. 이미지Red circle with white X icon indicating error, cancel, or close action. 이미지Green circle with white checkmark icon. ResponsesGreen circle with white checkmark icon. bedrock-mantle
Red circle with white X icon indicating error, cancel, or close action. 음성Red circle with white X icon indicating error, cancel, or close action. 음성Red circle with white X icon indicating error, cancel, or close action. Invoke
Green circle with white checkmark icon. 텍스트Green circle with white checkmark icon. 텍스트Red circle with white X icon indicating error, cancel, or close action. Converse
Red circle with white X icon indicating error, cancel, or close action. 비디오Red circle with white X icon indicating error, cancel, or close action. 비디오
참고

이 모델은 bedrock-mantle 엔드포인트의 openai/v1/responses 경로에서 사용할 수 있습니다. 이는 응답 엔드포인트에서 다른 모델이 사용하는 v1/responses 경로와 다릅니다.

기능 및 기능

Bedrock 기능

bedrock-mantle 엔드포인트를 사용하여 지원되는 기능

지원됨 지원되지 않음

가격 책정

요금은 Amazon Bedrock 요금 페이지를 참조하세요.

프로그래밍 방식 액세스

다음 모델 IDs 및 엔드포인트 URLs 사용하여이 모델에 프로그래밍 방식으로 액세스합니다. 사용 가능한 APIs 및 엔드포인트에 대한 자세한 내용은 APIs 지원되는 엔드포인트를 참조하세요.

Endpoint 모델 ID 리전 내 엔드포인트 URL 지리 추론 ID 글로벌 추론 ID
bedrock-mantle xai.grok-4.3 https://bedrock-mantle.{region}.api.aws/openai/v1 지원되지 않음 지원되지 않음

예를 들어 리전이 us-west-2(오레곤)인 경우 bedrock-mantle 엔드포인트 URL은 "https://bedrock-mantle.us-west-2.api.aws/openai/v1"이 됩니다.

서비스 티어

Amazon Bedrock은 워크로드 요구 사항에 맞는 여러 서비스 계층을 제공합니다. 표준은 약정 없이 pay-per-token 액세스를 제공합니다. Priority는 시간 기반 약정으로 더 높은 처리량을 제공합니다. Flex는 유연하고 non-time-sensitive 워크로드에 대해 저렴한 액세스를 제공합니다. 예약은 예측 가능한 워크로드에 대한 기간 약정과 함께 전용 처리량을 제공합니다. 자세한 내용은 서비스 티어를 참조하세요.

표준 우선 순위 Flex 예약됨
Green circle with white checkmark icon. Green circle with white checkmark icon. Green circle with white checkmark icon. Red circle with white X icon indicating error, cancel, or close action.

리전별 가용성

리전별 가용성 한눈에 보기

Bedrock은 세 가지 추론 옵션을 제공합니다. 리전 내는 엄격한 규정 준수를 위해 단일 리전 내에 요청을 유지하고, 리전(미국, EU 등) 내 리전 간 지리적 교차 리전 경로는 데이터 레지던시를 준수하면서 더 높은 처리량을 제공하며, 글로벌 교차 리전 경로는 레지던시 제약이 없는 경우 최대 처리량을 위해 전 세계 어디서나 이루어집니다. 자세한 내용은 모델별 리전별 가용성 페이지를 참조하세요.

리전 리전 내 지리 [Global]
us-west-2 (오레곤)Green circle with white checkmark icon.Red circle with white X icon indicating error, cancel, or close action.Red circle with white X icon indicating error, cancel, or close action.
us-east-1 (버지니아 북부)Green circle with white checkmark icon.Red circle with white X icon indicating error, cancel, or close action.Red circle with white X icon indicating error, cancel, or close action.
us-east-2 (오하이오)Green circle with white checkmark icon.Red circle with white X icon indicating error, cancel, or close action.Red circle with white X icon indicating error, cancel, or close action.

할당량과 제한

AWS 계정에는 서비스 성능을 유지하고 Amazon Bedrock을 적절하게 사용하기 위한 기본 할당량이 있습니다. 계정에 할당된 기본 할당량은 리전 요인, 결제 기록, 사기 사용 및/또는 할당량 증가 요청 승인에 따라 업데이트될 수 있습니다. 자세한 내용은 Amazon Bedrock의 할당량 설명서를 참조하고 모델의 제한을 참조하세요.

bedrock-mantle 엔드포인트에서 온디맨드 처리량을 사용하는 경우 사용 가능한 처리량은 시간이 지남에 따라 확장됩니다. 할당량 내의 모든 요청이 수요가 많은 기간 동안 성공한다는 보장은 없으므로 점진적으로 확장하는 것이 중요합니다. 이 모델의 경우 기본 제한은 Service Quotas를 통해 직접 표시되지 않으므로 가이드로 램프를 따르는 것이 좋습니다.

샘플 코드

1단계 - AWS 계정: AWS 계정이 이미 있는 경우이 단계를 건너뜁니다. AWS를 처음 사용하는 경우 AWS 계정에 가입합니다.

2단계 - API 키: Amazon Bedrock 콘솔로 이동하여 장기 API 키를 생성합니다.

3단계 - SDK 가져오기:이 시작 안내서를 사용하려면 Python이 이미 설치되어 있어야 합니다. 그런 다음 사용 중인 APIs에 따라 관련 소프트웨어를 설치합니다.

Chat Completions API
pip install openai
Responses API
pip install openai

4단계 - 환경 변수 설정: 인증에 API 키를 사용하도록 환경을 구성합니다.

Chat Completions API
OPENAI_API_KEY="<provide your Bedrock API key>" OPENAI_BASE_URL="https://bedrock-mantle.us-west-2.api.aws/openai/v1"
Responses API
OPENAI_API_KEY="<provide your Bedrock API key>" OPENAI_BASE_URL="https://bedrock-mantle.us-west-2.api.aws/openai/v1"

5단계 - 첫 번째 추론 요청 실행: 파일을 로 저장 bedrock-first-request.py

Chat Completions API
from openai import OpenAI client = OpenAI() response = client.chat.completions.create( model="xai.grok-4.3", messages=[ {"role": "user", "content": "Can you explain the features of Amazon Bedrock?"} ] ) print(response)
Responses API
from openai import OpenAI client = OpenAI() response = client.responses.create( model="xai.grok-4.3", input="Can you explain the features of Amazon Bedrock?" ) print(response)

사용 고려 사항 및 제한 사항

  • 추론 노력 - 추론은 기본적으로 항상 활성화됩니다. (이론 비활성화), {"effort": "none"} ("low"기본값), "medium"또는 reasoning 파라미터를 통해 작업을 구성할 수 있습니다"high". 추론 콘텐츠는 암호화되며 include: ["reasoning.encrypted_content"] 응답 API 요청을 전달하여 반환할 수 있습니다. 암호화된 콘텐츠를 후속 턴으로 다시 전송하여 멀티턴 대화에 대한 추론 컨텍스트를 제공할 수 있습니다. Chat Completions API는 추론 토큰을 반환하지 않습니다.

    response = client.responses.create( model="xai.grok-4.3", reasoning={"effort": "high"}, include=["reasoning.encrypted_content"], input="Explain quantum entanglement simply." ) print(response.output_text)
  • 기본 파라미터 - Grok 4.3은 표준 OpenAI API 사양과 다른 기본값을 사용합니다. temperature 기본값은 0.7 (가 아님1), top_p 기본값은 0.95 (가 아님1), max_completion_tokens 기본값은 입니다131072. 애플리케이션에 다른 동작이 필요한 경우 이러한 값을 명시적으로 조정합니다.