As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.
Inferência usando a API de mensagens antrópicas
A API Anthropic Messages fornece acesso nativo aos modelos Claude usando o formato de solicitação e resposta do Anthropic. Você pode usar a API de mensagens nos bedrock-runtime terminais bedrock-mantle e nos terminais, oferecendo flexibilidade para escolher o estilo de autenticação e integração adequado ao seu aplicativo.
| Endpoint | URL base | Caso de uso |
|---|---|---|
bedrock-mantle |
https://bedrock-mantle.{region}.api.aws/anthropic/v1/messages |
Recomendado para novas aplicações. Suporta autenticação de chave de API e. Espaços de trabalho () Anthropic-compatible |
bedrock-runtime |
https://bedrock-runtime.{region}.amazonaws.com |
Use com integrações de AWS SDK e registro de invocações existentes. |
Regiões aceitas
A API de mensagens está disponível no bedrock-mantle endpoint em todas as regiões compatíveis bedrock-mantle (consulteRegiões e endpoints compatíveis). No bedrock-runtime endpoint, ele está disponível em todas as regiões em que os modelos Claude estão disponíveis. Para mais detalhes, consulte Disponibilidade regional.
Pré-requisitos
Antes de usar a API de mensagens, verifique se você tem o seguinte:
-
Acesso ao modelo — Solicite acesso aos modelos Claude no console Amazon Bedrock. Consulte Solicitar acesso aos modelos.
-
Autenticação — Depende do endpoint:
-
bedrock-mantle— Use uma chave de API Amazon Bedrock (consulteChaves de API) ou credenciais AWS SigV4. -
bedrock-runtime— Use as credenciais AWS SigV4 por meio do AWS SDK (boto3, etc.).
-
-
Cabeçalho da versão antrópica — Todas as solicitações exigem uma versão de API:
-
bedrock-mantle: definidoanthropic-version: 2023-06-01como um cabeçalho HTTP. -
bedrock-runtime: definido"anthropic_version": "bedrock-2023-05-31"no corpo da solicitação.
-
Solicitação básica
Para enviar uma mensagem básica para um modelo Claude, escolha a guia do seu método preferido e siga as etapas:
Transmita respostas
Para receber tokens de resposta incrementalmente à medida que são gerados, escolha a guia do seu método preferido e siga as etapas:
Recursos compatíveis
A API de mensagens oferece suporte aos seguintes recursos avançados com os modelos Claude:
-
Solicitações do sistema — Defina o comportamento do modelo com um
systemparâmetro. -
Multi-turn conversas — Passe alternância
usereassistantmensagens. -
Uso da ferramenta — Defina as ferramentas que o modelo pode chamar. Consulte Use uma ferramenta para concluir uma resposta do modelo do Amazon Bedrock.
-
Visão — Envie imagens na
contentmatriz junto com o texto. -
Pensamento estendido — Permita o raciocínio em cadeia de pensamento. Consulte Melhorar as respostas do modelo com o raciocínio de modelo.
-
Cache imediato — Armazene em cache o contexto usado com frequência para reduzir a latência e o custo.
Para ver o formato completo de solicitação e resposta da API de mensagens, incluindo todos os parâmetros e recursos, consulteAnthropic Claude API Messages do da.
Contar fichas
Para contar o número de tokens de entrada que uma solicitação consumiria antes de enviá-la para inferência, use o count_tokens caminho antrópico no bedrock-mantle endpoint. Esse é o único caminho de contagem de tokens compatível com modelos Claude que não estão disponíveis em um Region-specific endpoint, incluindo modelos Claude que são iniciados somente bedrock-runtime com inferência entre regiões (CRIS). Para obter detalhes e um exemplo, consulte Conte os tokens usando o ponto final Bedrock-mantle.