View a markdown version of this page

Grupo 4.3 - Amazon Bedrock

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Grupo 4.3

Ícone mostrando o logotipo da XAi. AxI — Parte 4.3

Detalhes do modelo

O Grok 4.3 é um modelo que prioriza o raciocínio e oferece um esforço de raciocínio sempre ativo e configurável (nenhum, baixo, médio, alto). Como o raciocínio é sempre ativo em vez de opcional, ele se comporta de forma mais consistente em ciclos de agentes de várias etapas do que em modelos que podem ignorar o pensamento. Ele também oferece um forte uso de ferramentas e recursos de acompanhamento de instruções para criar agentes de várias etapas, além de eficiência de tokens para ajudar a manter a inferência de alto volume econômica. O Grok 4.3 é especialmente adequado para cargas de trabalho corporativas, como revisão de contratos, pesquisa de jurisprudência, análise de contratos de crédito e perguntas e respostas de documentos financeiros, ao mesmo tempo em que fornece resultados consistentes e de alta qualidade em inteligência artificial conversacional, pesquisa, bate-papo e fluxos de trabalho de vários turnos. O Grok 4.3 é executado no Mantle, um novo mecanismo de inferência no Amazon Bedrock projetado para oferecer desempenho de preço, com suporte para chamada de ferramentas, saída estruturada e streaming de respostas.

  • Data de lançamento do modelo: 15 de junho de 2026

  • Data de EOL do modelo: N/A

  • Contratos de licença de usuário final e termos de uso: Exibir

  • Ciclo de vida do modelo: Ativo

  • Janela de contexto: 1 milhão de tokens

  • Raciocínio: Suportado (configurável: baixo, médio, alto)

Modalidades de entrada Modalidades de saída APIs suportadas Endpoints suportados
Red circle with white X icon indicating error, cancel, or close action.ÁudioRed circle with white X icon indicating error, cancel, or close action.IncorporaçãoGreen circle with white checkmark icon. Chat CompletionsRed circle with white X icon indicating error, cancel, or close action. bedrock-runtime
Green circle with white checkmark icon.ImagemRed circle with white X icon indicating error, cancel, or close action.ImagemGreen circle with white checkmark icon. ResponsesGreen circle with white checkmark icon. bedrock-mantle
Red circle with white X icon indicating error, cancel, or close action.DiscursoRed circle with white X icon indicating error, cancel, or close action.DiscursoRed circle with white X icon indicating error, cancel, or close action. Invoke
Green circle with white checkmark icon.TextoGreen circle with white checkmark icon.TextoRed circle with white X icon indicating error, cancel, or close action. Converse
Red circle with white X icon indicating error, cancel, or close action.VídeoRed circle with white X icon indicating error, cancel, or close action.Vídeo
nota

Esse modelo está disponível no openai/v1/responses caminho do bedrock-mantle endpoint. Isso é diferente do v1/responses caminho usado por outros modelos no endpoint de respostas.

Capacidades e recursos

Características do Bedrock

Recursos compatíveis com o bedrock-mantle endpoint

Suportado Não suportado

Preços

Para obter os preços, consulte a página de preços do Amazon Bedrock.

Acesso programático

Use os seguintes IDs de modelo e URLs de endpoint para acessar esse modelo programaticamente. Para obter mais informações sobre as APIs e os endpoints disponíveis, consulte APIs suportadas e Endpoints suportados.

Endpoint ID do modelo In-Region URL do endpoint ID de inferência geográfica ID de inferência global
bedrock-mantle xai.grok-4.3 https://bedrock-mantle.{region}.api.aws/openai/v1 Sem compatibilidade Sem compatibilidade

Por exemplo, se a região for us-west-2 (Oregon), o URL do endpoint bedrock-mantle será "“. https://bedrock-mantle.us-west-2.api.aws/openai/v1

Níveis de serviço

O Amazon Bedrock oferece vários níveis de serviço para atender às suas necessidades de carga de trabalho. O Standard fornece acesso pago por token sem compromisso. O Priority oferece maior produtividade com um compromisso baseado em tempo. O Flex fornece acesso de baixo custo para cargas de trabalho flexíveis e não urgentes. O Reserved fornece taxa de transferência dedicada com um compromisso de longo prazo para cargas de trabalho previsíveis. Para obter mais informações, consulte níveis de serviço.

Padrão Priority Flexionar Reservado
Green circle with white checkmark icon. Green circle with white checkmark icon. Green circle with white checkmark icon. Red circle with white X icon indicating error, cancel, or close action.

Disponibilidade regional

Visão geral da disponibilidade regional

O Bedrock oferece três opções de inferência: In-Regionmantém as solicitações em uma única região para conformidade estrita, Cross-Region rotas geográficas entre regiões dentro de uma geografia (EUA, UE etc.) para maior produtividade, respeitando a residência dos dados, e Cross-Region rotas globais em qualquer lugar do mundo para obter a máxima produtividade quando não há restrições de residência. Consulte a Disponibilidade regional por modelos página para obter mais detalhes.

Região In-Region Geo Global
us-west-2(Oregon)Green circle with white checkmark icon.Red circle with white X icon indicating error, cancel, or close action.Red circle with white X icon indicating error, cancel, or close action.
us-east-1(Norte da Virgínia)Green circle with white checkmark icon.Red circle with white X icon indicating error, cancel, or close action.Red circle with white X icon indicating error, cancel, or close action.
us-east-2(Ohio)Green circle with white checkmark icon.Red circle with white X icon indicating error, cancel, or close action.Red circle with white X icon indicating error, cancel, or close action.

Cotas e limites

Sua conta da AWS tem cotas padrão para manter o desempenho do serviço e garantir o uso adequado do Amazon Bedrock. As cotas padrão atribuídas a uma conta podem ser atualizadas dependendo de fatores regionais, histórico de pagamentos, uso fraudulento e and/or aprovação de uma solicitação de aumento de cota. Para obter mais detalhes, consulte a Cotas do Amazon Bedrock documentação e veja os limites do modelo.

Ao consumir a taxa de transferência sob demanda no bedrock-mantle endpoint, a taxa de transferência disponível aumenta com o tempo. Nem todas as solicitações dentro de sua cota têm a garantia de sucesso durante períodos de alta demanda, portanto, aumentar gradualmente é importante. Para esse modelo, os limites padrão não são apresentados diretamente por meio de Quotas de Serviço, por isso recomendamos seguir a rampa como guia.

Código de exemplo

Etapa 1 - Conta da AWS: se você já tem uma conta da AWS, pule esta etapa. Se você é novo na AWS, cadastre-se em uma conta da AWS.

Etapa 2 - Chave de API: acesse o console do Amazon Bedrock e gere uma chave de API de longo prazo.

Etapa 3 - Obtenha o SDK: para usar este guia de introdução, você deve ter o Python já instalado. Em seguida, instale o software relevante, dependendo das APIs que você está usando.

Chat Completions API
pip install openai
Responses API
pip install openai

Etapa 4 - Definir variáveis de ambiente: configure seu ambiente para usar a chave de API para autenticação.

Chat Completions API
OPENAI_API_KEY="<provide your Bedrock API key>" OPENAI_BASE_URL="https://bedrock-mantle.us-west-2.api.aws/openai/v1"
Responses API
OPENAI_API_KEY="<provide your Bedrock API key>" OPENAI_BASE_URL="https://bedrock-mantle.us-west-2.api.aws/openai/v1"

Etapa 5 - Execute sua primeira solicitação de inferência: salve o arquivo como bedrock-first-request.py

Chat Completions API
from openai import OpenAI client = OpenAI() response = client.chat.completions.create( model="xai.grok-4.3", messages=[ {"role": "user", "content": "Can you explain the features of Amazon Bedrock?"} ] ) print(response)
Responses API
from openai import OpenAI client = OpenAI() response = client.responses.create( model="xai.grok-4.3", input="Can you explain the features of Amazon Bedrock?" ) print(response)

Considerações e limitações de uso

  • Esforço de raciocínio — O raciocínio está sempre ativo por padrão. Você pode configurar o esforço por meio do reasoning parâmetro: {"effort": "none"} (desativa o raciocínio), "low" (padrão) ou. "medium" "high" O conteúdo do raciocínio é criptografado e pode ser retornado include: ["reasoning.encrypted_content"] transmitindo a solicitação da API de respostas. Você pode enviar o conteúdo criptografado de volta em turnos subsequentes para fornecer um contexto de raciocínio para conversas em vários turnos. A API Chat Completions não retorna tokens de raciocínio.

    response = client.responses.create( model="xai.grok-4.3", reasoning={"effort": "high"}, include=["reasoning.encrypted_content"], input="Explain quantum entanglement simply." ) print(response.output_text)
  • Parâmetros padrão — O Grok 4.3 usa padrões que diferem da especificação padrão da API OpenAI: o padrão é 0.7 (não1), o temperature padrão é (não) e o top_p padrão é. 0.95 1 max_completion_tokens 131072 Ajuste esses valores explicitamente se seu aplicativo exigir um comportamento diferente.