View a markdown version of this page

Claude Haiku 4.5 - Amazon Bedrock

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Claude Haiku 4.5

Ícone quadrado arredondado laranja com design giratório de carregamento radial branco. Antrópico — Claude Haiku 4.5

Detalhes do modelo

O Claude Haiku 4.5 é o modelo leve da Anthropic, otimizado para velocidade e eficiência, com forte codificação e desempenho do agente. Para obter mais informações sobre desenvolvimento e desempenho de modelos, consulte o model/service cartão.

  • Data de lançamento do modelo: 16 de outubro de 2025

  • Data de EOL do modelo: Não antes de /2026 10/1

  • Contratos de licença de usuário final e termos de uso: Exibir

  • Ciclo de vida do modelo: Ativo

  • Janela de contexto: 200 mil tokens

  • Tokens de saída máximos: 64K

  • Raciocínio: Compatível

  • Limite de conhecimento: fevereiro de 2025

  • ID do produto do Marketplace: prod-xdkflymybwmvi

Modalidades de entrada Modalidades de saída APIs suportadas Endpoints suportados
ÁudioIncorporação Responses bedrock-runtime
ImagemImagem Chat Completions bedrock-mantle
DiscursoDiscurso Invoke
TextoTexto Converse
VídeoVídeo Messages

Capacidades e recursos

Características do Bedrock

Recursos compatíveis com o bedrock-mantle endpoint

Recursos compatíveis com o bedrock-runtime endpoint

Cache imediato

Para obter mais informações, consulte Prompt caching para uma inferência mais rápida do modelo.

Suporte para cache imediato Número mínimo de tokens por ponto de verificação de cache Máximo de pontos de verificação de cache por solicitação TTL suportado Campos que aceitam pontos de verificação de cache imediatos
Sim 4.096 4 5 minutos, 1 hora system, messages, e tools

Preços

Para obter os preços, consulte a página de preços do Amazon Bedrock.

Acesso programático

Use os seguintes IDs de modelo e URLs de endpoint para acessar esse modelo programaticamente. Para obter mais informações sobre as APIs e os endpoints disponíveis, consulte APIs suportadas e Endpoints suportados.

Endpoint ID do modelo In-Region URL do endpoint ID de inferência geográfica ID de inferência global
bedrock-runtime anthropic.claude-haiku-4-5-20251001-v1:0 https://bedrock-runtime.{region}.amazonaws.com

us.anthropic.claude-haiku-4-5-20251001-v1:0

eu.anthropic.claude-haiku-4-5-20251001-v1:0

au.anthropic.claude-haiku-4-5-20251001-v1:0

jp.anthropic.claude-haiku-4-5-20251001-v1:0

global.anthropic.claude-haiku-4-5-20251001-v1:0
bedrock-mantle anthropic.claude-haiku-4-5 https://bedrock-mantle.{region}.api.aws/anthropic/v1/messages N/A N/A

Por exemplo, se a região for us-east-1 (Norte da Virgínia), a URL do endpoint bedrock-runtime será "" e para bedrock-mantle será https://bedrock-runtime.us-east-1.amazonaws.com "“. https://bedrock-mantle.us-east-1.api.aws/anthropic/v1/messages

Níveis de serviço

O Amazon Bedrock oferece vários níveis de serviço para atender às suas necessidades de carga de trabalho. O Standard fornece acesso pago por token sem compromisso. O Priority oferece maior produtividade com um compromisso baseado em tempo. O Flex fornece acesso de baixo custo para cargas de trabalho flexíveis e não urgentes. O Reserved fornece taxa de transferência dedicada com um compromisso de longo prazo para cargas de trabalho previsíveis. Para obter mais informações, consulte níveis de serviço.

Padrão Priority Flexionar Reservado

Disponibilidade regional

Visão geral da disponibilidade regional

O Bedrock oferece três opções de inferência: In-Regionmantém as solicitações em uma única região para conformidade estrita, Cross-Region rotas geográficas entre regiões dentro de uma geografia (EUA, UE etc.) para maior produtividade, respeitando a residência dos dados, e Cross-Region rotas globais em qualquer lugar do mundo para obter a máxima produtividade quando não há restrições de residência. Consulte a Disponibilidade regional página para obter mais detalhes.

Região In-Region Geo Global
us-east-1(Norte da Virgínia)
us-east-2(Ohio)
us-west-1(Norte da Califórnia)
us-west-2(Oregon)
ca-central-1(Canadá)
ca-west-1(Calgary)
eu-central-1(Frankfurt)
eu-central-2(Zurique)
eu-north-1(Estocolmo)
eu-south-1(Milão)
eu-south-2(Espanha)
eu-west-1(Irlanda)
eu-west-2(Londres)
eu-west-3(Paris)
ap-east-2(Taipei)
ap-northeast-1(Tóquio)
ap-northeast-2(Seul)
ap-northeast-3(Osaka)
ap-south-1(Mumbai)
ap-south-2(Hyderabad)
ap-southeast-1(Cingapura)
ap-southeast-2(Sidney)
ap-southeast-3(Jacarta)
ap-southeast-4(Melbourne)
ap-southeast-5(Malásia)
ap-southeast-6(Nova Zelândia)
ap-southeast-7(Tailândia)
il-central-1(Telavive)
me-central-1(EMIRADOS ÁRABES UNIDOS)
me-south-1(Bahrein)
af-south-1(Cidade do Cabo)
sa-east-1(São Paulo)
mx-central-1(México)

Detalhes da inferência geográfica

Geo: EUA

ID de inferência geográfica: us.anthropic.claude-haiku-4-5-20251001-v1:0

Região de origem Regiões de destino
us-east-1 (N. Virginia)us-east-1 (Norte da Virgínia), us-east-2 (Ohio), us-west-2 (Oregon)
us-east-2 (Ohio)us-east-1 (Norte da Virgínia), us-east-2 (Ohio), us-west-2 (Oregon)
us-west-1 (Norte da Califórnia)us-east-1 (Norte da Virgínia), us-east-2 (Ohio), us-west-1 (Norte da Califórnia), us-west-2 (Oregon)
us-west-2 (Oregon)us-east-1 (Norte da Virgínia), us-east-2 (Ohio), us-west-2 (Oregon)
ca-central-1 (Canadá)ca-central-1 (Canadá), us-east-1 (Norte da Virgínia), us-east-2 (Ohio), us-west-2 (Oregon)

Geo: UE

ID de inferência geográfica: eu.anthropic.claude-haiku-4-5-20251001-v1:0

Região de origem Regiões de destino
eu-central-1 (Frankfurt)eu-central-1 (Frankfurt), eu-north-1 (Estocolmo), eu-south-1 (Milão), eu-south-2 (Espanha), eu-west-1 (Irlanda), eu-west-3 (Paris)
eu-central-2 (Zurique)eu-central-1 (Frankfurt), eu-central-2 (Zurique), eu-north-1 (Estocolmo), eu-south-1 (Milão), eu-south-2 (Espanha), eu-west-1 (Irlanda), eu-west-3 -west-3 (Paris)
eu-north-1 (Estocolmo)eu-central-1 (Frankfurt), eu-north-1 (Estocolmo), eu-south-1 (Milão), eu-south-2 (Espanha), eu-west-1 (Irlanda), eu-west-3 (Paris)
eu-south-1 (Milão)eu-central-1 (Frankfurt), eu-north-1 (Estocolmo), eu-south-1 (Milão), eu-south-2 (Espanha), eu-west-1 (Irlanda), eu-west-3 (Paris)
eu-south-2 (Espanha)eu-central-1 (Frankfurt), eu-north-1 (Estocolmo), eu-south-1 (Milão), eu-south-2 (Espanha), eu-west-1 (Irlanda), eu-west-3 (Paris)
eu-west-1 (Irlanda)eu-central-1 (Frankfurt), eu-north-1 (Estocolmo), eu-south-1 (Milão), eu-south-2 (Espanha), eu-west-1 (Irlanda), eu-west-3 (Paris)
eu-west-2 (Londres)eu-central-1 (Frankfurt), eu-north-1 (Estocolmo), eu-south-1 (Milão), eu-south-2 (Espanha), eu-west-1 (Irlanda), eu-west-2 (Londres), eu-west-1 (Irlanda), eu-west-2 (Londres), eu-west-3 (Paris)
eu-west-3 (Paris)eu-central-1 (Frankfurt), eu-north-1 (Estocolmo), eu-south-1 (Milão), eu-south-2 (Espanha), eu-west-1 (Irlanda), eu-west-3 (Paris)

Geolocalização: AU

ID de inferência geográfica: au.anthropic.claude-haiku-4-5-20251001-v1:0

Região de origem Regiões de destino
ap-southeast-2 (Sydney)ap-southeast-2 (Sydney), ap-southeast-4 (Melbourne)
ap-southeast-4 (Melbourne)ap-southeast-2 (Sydney), ap-southeast-4 (Melbourne)
ap-southeast-6 (Nova Zelândia)ap-southeast-2 (Sydney), ap-southeast-4 (Melbourne), ap-southeast-6 (Nova Zelândia)

Geografia: JP

ID de inferência geográfica: jp.anthropic.claude-haiku-4-5-20251001-v1:0

Região de origem Regiões de destino
ap-northeast-1 (Tóquio)ap-northeast-1 (Tóquio), ap-northeast-3 (Osaka)
ap-northeast-3 (Osaca)ap-northeast-1 (Tóquio), ap-northeast-3 (Osaka)

Detalhes da inferência global

ID de inferência global Américas EMEA Ásia-Pacífico
global.anthropic.claude-haiku-4-5-20251001-v 1:0
  • us-east-1 (N. Virginia)

  • us-east-2 (Ohio)

  • us-west-1 (Norte da Califórnia)

  • us-west-2 (Oregon)

  • ca-central-1 (Canadá)

  • ca-west-1 (Calgary)

  • sa-east-1 (São Paulo)

  • mx-central-1 (México)

  • eu-central-1 (Frankfurt)

  • eu-central-2 (Zurique)

  • eu-north-1 (Estocolmo)

  • eu-south-1 (Milão)

  • eu-south-2 (Espanha)

  • eu-west-1 (Irlanda)

  • eu-west-2 (Londres)

  • eu-west-3 (Paris)

  • il-central-1 (Tel Aviv)

  • me-central-1 (Emirados Árabes Unidos)

  • me-south-1 (Bahrein)

  • af-south-1 (Cidade do Cabo)

  • ap-east-2 (Taipei)

  • ap-northeast-1 (Tóquio)

  • ap-northeast-2 (Seul)

  • ap-northeast-3 (Osaca)

  • ap-south-1 (Mumbai)

  • ap-south-2 (Hyderabad)

  • ap-southeast-1 (Singapura)

  • ap-southeast-2 (Sydney)

  • ap-southeast-3 (Jacarta)

  • ap-southeast-4 (Melbourne)

  • ap-southeast-5 (Malásia)

  • ap-southeast-6 (Nova Zelândia)

  • ap-southeast-7 (Tailândia)

Cotas e limites

Sua conta da AWS tem cotas padrão para manter o desempenho do serviço e garantir o uso adequado do Amazon Bedrock. As cotas padrão atribuídas a uma conta podem ser atualizadas dependendo de fatores regionais, histórico de pagamentos, uso fraudulento e and/or aprovação de uma solicitação de aumento de cota. Para obter mais detalhes, consulte a Cotas do Amazon Bedrock documentação e veja os limites do modelo.

Código de exemplo

Etapa 1 - Conta da AWS: se você já tem uma conta da AWS, pule esta etapa. Se você é novo na AWS, cadastre-se em uma conta da AWS.

Etapa 2 - Chave de API: acesse o console do Amazon Bedrock e gere uma chave de API de longo prazo.

Etapa 3 - Obtenha o SDK: para usar este guia de introdução, você deve ter o Python já instalado. Em seguida, instale o software relevante, dependendo das APIs que você está usando.

Messages API
pip install -U "anthropic[bedrock]"
Invoke/Converse API
pip install boto3

Etapa 4 - Definir variáveis de ambiente: configure seu ambiente para usar a chave de API para autenticação.

Messages API
AWS_BEARER_TOKEN_BEDROCK="<provide your Bedrock API key>"
Invoke/Converse API
AWS_BEARER_TOKEN_BEDROCK="<provide your Bedrock API key>"

Etapa 5 - Execute sua primeira solicitação de inferência: salve o arquivo como bedrock-first-request.py

Messages API
from anthropic import AnthropicBedrockMantle client = AnthropicBedrockMantle(aws_region="us-east-1") message = client.messages.create( model="anthropic.claude-haiku-4-5", max_tokens=1024, messages=[{"role": "user", "content": "Can you explain the features of Amazon Bedrock?"}], ) print(message.content[0].text)
Invoke API
import json import boto3 client = boto3.client('bedrock-runtime', region_name='us-east-1') response = client.invoke_model( modelId='anthropic.claude-haiku-4-5-20251001-v1:0', body=json.dumps({ 'anthropic_version': 'bedrock-2023-05-31', 'messages': [{ 'role': 'user', 'content': 'Can you explain the features of Amazon Bedrock?'}], 'max_tokens': 1024 }) ) print(json.loads(response['body'].read()))
Converse API
import boto3 client = boto3.client('bedrock-runtime', region_name='us-east-1') response = client.converse( modelId='anthropic.claude-haiku-4-5-20251001-v1:0', messages=[ { 'role': 'user', 'content': [{'text': 'Can you explain the features of Amazon Bedrock?'}] } ] ) print(response)