As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.
Grupo 4.3
AxI — Parte 4.3
Detalhes do modelo
O Grok 4.3 é um modelo que prioriza o raciocínio e oferece um esforço de raciocínio sempre ativo e configurável (nenhum, baixo, médio, alto). Como o raciocínio é sempre ativo em vez de opcional, ele se comporta de forma mais consistente em ciclos de agentes de várias etapas do que em modelos que podem ignorar o pensamento. Ele também oferece um forte uso de ferramentas e recursos de acompanhamento de instruções para criar agentes de várias etapas, além de eficiência de tokens para ajudar a manter a inferência de alto volume econômica. O Grok 4.3 é especialmente adequado para cargas de trabalho corporativas, como revisão de contratos, pesquisa de jurisprudência, análise de contratos de crédito e perguntas e respostas de documentos financeiros, ao mesmo tempo em que fornece resultados consistentes e de alta qualidade em inteligência artificial conversacional, pesquisa, bate-papo e fluxos de trabalho de vários turnos. O Grok 4.3 é executado no Mantle, um novo mecanismo de inferência no Amazon Bedrock projetado para oferecer desempenho de preço, com suporte para chamada de ferramentas, saída estruturada e streaming de respostas.
Data de lançamento do modelo: 15 de junho de 2026
Data de EOL do modelo: N/A
Contratos de licença de usuário final e termos de uso: Exibir
Ciclo de vida do modelo: Ativo
Janela de contexto: 1 milhão de tokens
Raciocínio: Suportado (configurável: baixo, médio, alto)
| Modalidades de entrada | Modalidades de saída | APIs suportadas | Endpoints suportados |
|---|---|---|---|
Chat Completions | bedrock-runtime | ||
Responses | bedrock-mantle | ||
Invoke | |||
Converse | |||
nota
Esse modelo está disponível no openai/v1/responses caminho do bedrock-mantle endpoint. Isso é diferente do v1/responses caminho usado por outros modelos no endpoint de respostas.
Capacidades e recursos
Características do Bedrock
Recursos compatíveis com o bedrock-mantle endpoint
| Suportado | Não suportado |
|---|---|
|
— |
Preços
Para obter os preços, consulte a página de preços do Amazon Bedrock
Acesso programático
Use os seguintes IDs de modelo e URLs de endpoint para acessar esse modelo programaticamente. Para obter mais informações sobre as APIs e os endpoints disponíveis, consulte APIs suportadas e Endpoints suportados.
| Endpoint | ID do modelo | In-Region URL do endpoint | ID de inferência geográfica | ID de inferência global |
|---|---|---|---|---|
bedrock-mantle |
xai.grok-4.3 |
https://bedrock-mantle.{region}.api.aws/openai/v1 |
Sem compatibilidade | Sem compatibilidade |
Por exemplo, se a região for us-west-2 (Oregon), o URL do endpoint bedrock-mantle será "“. https://bedrock-mantle.us-west-2.api.aws/openai/v1
Níveis de serviço
O Amazon Bedrock oferece vários níveis de serviço para atender às suas necessidades de carga de trabalho. O Standard fornece acesso pago por token sem compromisso. O Priority oferece maior produtividade com um compromisso baseado em tempo. O Flex fornece acesso de baixo custo para cargas de trabalho flexíveis e não urgentes. O Reserved fornece taxa de transferência dedicada com um compromisso de longo prazo para cargas de trabalho previsíveis. Para obter mais informações, consulte níveis de serviço.
| Padrão | Priority | Flexionar | Reservado |
|---|---|---|---|
Disponibilidade regional
Visão geral da disponibilidade regional
O Bedrock oferece três opções de inferência: In-Regionmantém as solicitações em uma única região para conformidade estrita, Cross-Region rotas geográficas entre regiões dentro de uma geografia (EUA, UE etc.) para maior produtividade, respeitando a residência dos dados, e Cross-Region rotas globais em qualquer lugar do mundo para obter a máxima produtividade quando não há restrições de residência. Consulte a Disponibilidade regional por modelos página para obter mais detalhes.
| Região | In-Region | Geo | Global |
|---|---|---|---|
us-west-2(Oregon) | |||
us-east-1(Norte da Virgínia) | |||
us-east-2(Ohio) |
Cotas e limites
Sua conta da AWS tem cotas padrão para manter o desempenho do serviço e garantir o uso adequado do Amazon Bedrock. As cotas padrão atribuídas a uma conta podem ser atualizadas dependendo de fatores regionais, histórico de pagamentos, uso fraudulento e and/or aprovação de uma solicitação de aumento de cota. Para obter mais detalhes, consulte a Cotas do Amazon Bedrock documentação e veja os limites do modelo.
Ao consumir a taxa de transferência sob demanda no bedrock-mantle endpoint, a taxa de transferência disponível aumenta com o tempo. Nem todas as solicitações dentro de sua cota têm a garantia de sucesso durante períodos de alta demanda, portanto, aumentar gradualmente é importante. Para esse modelo, os limites padrão não são apresentados diretamente por meio de Quotas de Serviço, por isso recomendamos seguir a rampa como guia.
Código de exemplo
Etapa 1 - Conta da AWS: se você já tem uma conta da AWS, pule esta etapa. Se você é novo na AWS, cadastre-se em uma conta da AWS
Etapa 2 - Chave de API: acesse o console do Amazon Bedrock
Etapa 3 - Obtenha o SDK: para usar este guia de introdução, você deve ter o Python já instalado. Em seguida, instale o software relevante, dependendo das APIs que você está usando.
Etapa 4 - Definir variáveis de ambiente: configure seu ambiente para usar a chave de API para autenticação.
Etapa 5 - Execute sua primeira solicitação de inferência: salve o arquivo como bedrock-first-request.py
Considerações e limitações de uso
Esforço de raciocínio — O raciocínio está sempre ativo por padrão. Você pode configurar o esforço por meio do
reasoningparâmetro:{"effort": "none"}(desativa o raciocínio),"low"(padrão) ou."medium""high"O conteúdo do raciocínio é criptografado e pode ser retornadoinclude: ["reasoning.encrypted_content"]transmitindo a solicitação da API de respostas. Você pode enviar o conteúdo criptografado de volta em turnos subsequentes para fornecer um contexto de raciocínio para conversas em vários turnos. A API Chat Completions não retorna tokens de raciocínio.response = client.responses.create( model="xai.grok-4.3", reasoning={"effort": "high"}, include=["reasoning.encrypted_content"], input="Explain quantum entanglement simply." ) print(response.output_text)Parâmetros padrão — O Grok 4.3 usa padrões que diferem da especificação padrão da API OpenAI: o padrão é
0.7(não1), otemperaturepadrão é (não) e otop_ppadrão é.0.951max_completion_tokens131072Ajuste esses valores explicitamente se seu aplicativo exigir um comportamento diferente.