Demande et réponse

Le corps de la demande est transmis dans le body champ d'une demande à InvokeModelou InvokeModelWithResponseStream.

Note

Des restrictions s'appliquent aux opérations suivantes : InvokeModelInvokeModelWithResponseStream,Converse, etConverseStream. Consultez les restrictions relatives aux API pour plus de détails.

Avertissement

Claude Sonnet 4.5et la Claude Haiku 4.5 prise en charge de la spécification du top_p paramètre temperature ou, mais pas des deux. Cela ne s’applique pas aux modèles plus anciens.

Request

Anthropic Claude comporte les paramètres d’inférence suivants pour un appel d’inférence de messages.


{
    "anthropic_version": "bedrock-2023-05-31", 
    "anthropic_beta": ["computer-use-2024-10-22"] 
    "max_tokens": int,
    "system": string | [{"type": "text", "text": string}],    
    "messages": [
        {
            "role": string,
            "content": [
                { "type": "image", "source": { "type": "base64", "media_type": "image/jpeg", "data": "content image bytes" } },
                { "type": "text", "text": "content text" }
      ]
        }
    ],
    "temperature": float,
    "top_p": float,
    "top_k": int,
    "tools": [
        {
                "type": "custom",
                "name": string,
                "description": string,
                "input_schema": json
            
        },
        { 
            "type": "computer_20241022",  
            "name": "computer", 
            "display_height_px": int,
            "display_width_px": int,
            "display_number": 0 int
        },
        { 
            "type": "bash_20241022", 
            "name": "bash"
        },
        { 
            "type": "text_editor_20241022",
            "name": "str_replace_editor"
        }
        
    ],
    "tool_choice": {
        "type" :  string,
        "name" : string,
    },
    

 
    "stop_sequences": [string]
}

Les paramètres suivants sont obligatoires.

anthropic_version : (obligatoire) la version anthropique. La valeur doit être bedrock-2023-05-31.
max_tokens : (obligatoire) le nombre maximum de jetons à générer avant l’arrêt.

Notez que les modèles Anthropic Claude peuvent arrêter de générer des jetons avant d’atteindre la valeur max_tokens. Les différents modèles Anthropic Claude ont des valeurs maximales différentes pour ce paramètre. Pour plus d’informations, consultez Comparaison de modèles.

messages : (obligatoire) les messages d’entrée.

role : le rôle du tour de conversation. Les valeurs valides sont user et assistant.

Minimum	Maximum
0	2000

content : (obligatoire) le contenu de la conversation prend la forme d’un tableau d’objets. Chaque objet contient un champ type dans lequel vous pouvez spécifier l’une des valeurs suivantes :
- text : si vous spécifiez ce type, vous devez inclure un champ texte et spécifier l’invite de texte comme valeur. Si un autre objet du tableau est une image, cette invite de texte s’applique aux images.
- image : si vous spécifiez ce type, vous devez inclure un champ source qui correspond à un objet avec les champs suivants :
  - type : (obligatoire) type de codage de l’image. Vous pouvez spécifier base64.
  - media_type : (obligatoire) type de l’image. Vous pouvez spécifier les formats d’image suivants :
    
    image/jpeg
    
    image/png
    
    image/webp
    
    image/gif
  - data : (obligatoire) octets de l’image codés en Base64 pour l’image. La taille maximale est de 3,75 Mo. La hauteur et la largeur maximales d’une image sont de 8 000 pixels.

Les paramètres suivants sont facultatifs.

system : (facultatif) invite du système pour la demande. Vous pouvez fournir l'invite système sous forme de chaîne ou de tableau de blocs de contenu (par exemple,[{"type": "text", "text": "your prompt"}]).

Une invite système est un moyen de fournir du contexte et des instructions Anthropic Claude, par exemple en spécifiant un objectif ou un rôle particulier. Pour plus d’informations, consultez System prompts dans la documentation Anthropic.

Note
Vous pouvez utiliser les invites du système avec Anthropic Claude version 2.1 ou supérieure.

anthropic_beta : (facultatif) le paramètre bêta anthropique est une liste de chaînes d’en-têtes bêta utilisés pour indiquer l’adhésion à un ensemble particulier de fonctionnalités bêta.

Note

La variante contextuelle d'un million de jetons Claude Sonnet 4 est disponible dans certaines AWS régions en tant que « service bêta » tel que défini dans les conditions AWS de service. Il est soumis à votre accord AWS et aux conditions de AWS service, ainsi qu'au modèle EULA applicable. Consultez la page Tarification d’Amazon Bedrock pour plus d’informations sur les tarifs applicables aux demandes contextuelles plus longues. Pour les demandes dépassant 200 000 jetons d'entrée, le taux de contexte long s'applique à l'ensemble de la demande, et pas seulement aux jetons supérieurs au seuil. Des quotas de service distincts s'appliquent (pour plus d'informations, voir Quotas de service dans le AWS Management Console).

Les en-têtes bêta disponibles sont les suivants :

Caractéristique bêta	En-tête bêta	Remarques
Utilisation d’ordinateur	`computer-use-2025-01-24`	Compatible avecClaude 3.7 Sonnet.
Utilisation d’outil	`token-efficient-tools-2025-02-19`	Compatible avec Claude 3.7 Sonnet et Claude 4+.
Réflexion entrelacée	`Interleaved-thinking-2025-05-14`	Compatible avec les modèles Claude 4+.
Permet de générer jusqu’à 128 000 jetons	`output-128k-2025-02-19`	Compatible avecClaude 3.7 Sonnet.
Mode développeur pour une réflexion brute sur les modèles Claude 4+	`dev-full-thinking-2025-05-14`	Compatible avec les modèles Claude 4+ uniquement. Contactez l’équipe de votre compte pour accéder à cette version bêta.
1 million de jetons	`context-1m-2025-08-07`	Compatible avec Claude Sonnet 4Claude Sonnet 4.6, etClaude Opus 4.6.
Gestion du contexte	`context-management-2025-06-27`	Compatible avec Claude Sonnet 4.5 et Claude Haiku 4.5.
Effort	`effort-2025-11-24`	Compatible avec Claude Opus 4.5
Outil de recherche d'outils	`tool-search-tool-2025-10-19`	Compatible avec Claude Opus 4.5
Exemples d'utilisation d'outils	`tool-examples-2025-10-29`	Compatible avec Claude Opus 4.5

stop_sequences : (facultatif) séquences de texte personnalisées qui empêchent la génération du modèle. Les modèles Anthropic Claude s’arrêtent normalement lorsqu’ils ont naturellement terminé leur tour, dans ce cas, la valeur du champ de réponse stop_reason est end_turn. Si vous souhaitez que le modèle cesse de générer lorsqu’il rencontre des chaînes de texte personnalisées, vous pouvez utiliser le paramètre stop_sequences. Si le modèle rencontre l’une des chaînes de texte personnalisées, la valeur du champ de réponse stop_reason est stop_sequence et la valeur de stop_sequence contient la séquence d’arrêt correspondante.

Le nombre maximal d’entrées est de 8 191.

temperature : (facultatif) quantité de randomisation injectée dans la réponse.

Par défaut	Minimum	Maximum
1	0	1

top_p : (facultatif) utilisez l’échantillonnage du noyau.

Lors de l’échantillonnage du noyau, Anthropic Claude calcule la distribution cumulée de toutes les options pour chaque jeton suivant par ordre de probabilité décroissant et la coupe une fois qu’elle atteint une probabilité particulière spécifiée par top_p. Lorsque vous ajustez les paramètres d’échantillonnage, modifiez temperature ou top_p. Ne modifiez pas les deux en même temps.

Par défaut	Minimum	Maximum
0,999	0	1

top_k : (facultatif) échantillonnez uniquement les premières options K pour chaque jeton suivant.

Utilisez top_k pour supprimer les réponses à faible probabilité à longue queue.

Par défaut	Minimum	Maximum
Désactivé par défaut	0	500

tools : (facultatif) définitions des outils que le modèle peut utiliser.

Note

Nécessite un modèle Anthropic Claude 3.

Si vous incluez tools dans votre demande, le modèle peut renvoyer des blocs de contenu tool_use représentant l’utilisation de ces outils par le modèle. Vous pouvez ensuite exécuter ces outils à l’aide de l’entrée d’outil générée par le modèle, puis éventuellement renvoyer les résultats au modèle à l’aide de blocs de contenu tool_result.

Vous pouvez transmettre les types d’outils suivants :

Personnalisé

Définition d’un outil personnalisé.

(facultatif) type : type de l’outil. Si elle est définie, utilisez la valeur custom.
name : nom de l’outil.
description : (facultatif, mais fortement recommandé) description de l’outil.
input_schema : schéma JSON de l’outil.

Ordinateur

Définition de l’outil informatique que vous utilisez avec l’API d’utilisation d’ordinateur.

type : la valeur doit être computer_20241022.
name : la valeur doit être computer.

(Obligatoire) display_height_px : hauteur de l’écran contrôlée par le modèle, en pixels.

Par défaut	Minimum	Maximum
Aucune	1	Aucun maximum

(Obligatoire) display_width_px : largeur de l’écran contrôlée par le modèle, en pixels.

Par défaut	Minimum	Maximum
Aucune	1	Aucun maximum

(Facultatif) display_number : numéro d’affichage à contrôler (pertinent uniquement pour les environnements X11). Si cela est spécifié, un numéro d’affichage sera fourni à l’outil dans la définition de l’outil.

Par défaut	Minimum	Maximum
Aucune	0	N

bash

Définition de l’outil bash que vous utilisez avec l’API d’utilisation d’ordinateur.

(facultatif) type : la valeur doit être bash_20241022.
name : la valeur doit être l’outil bash.

éditeur de texte

Définition de l’éditeur de texte que vous utilisez avec l’API d’utilisation d’ordinateur.

(facultatif) type : la valeur doit être text_editor_20241022.
name : la valeur doit être l’outil str_replace_editor.

tool_choice : (facultatif) spécifie comment le modèle doit utiliser les outils fournis. Le modèle peut utiliser un outil spécifique, n’importe quel outil disponible, ou décider par lui-même.

Note
Nécessite un modèle Anthropic Claude 3.
- type : type d’outil choisi. Les valeurs possibles sont any (utiliser n’importe quel outil disponible), auto (le modèle décide) et tool (utiliser l’outil spécifié).
- name : (facultatif) nom de l’outil à utiliser. Obligatoire si vous le spécifiez tool dans le champ type.

Response

Le modèle Anthropic Claude renvoie les champs suivants pour un appel d’inférence de complétion de messages.


{
    "id": string,
    "model": string,
    "type" : "message",
    "role" : "assistant",
    "content": [
        {
            "type": string,
            "text": string,
            "image" :json,
            "id": string,
            "name":string,
            "input": json
        }
    ],
    "stop_reason": string,
    "stop_sequence": string,
    "usage": {
        "input_tokens": integer,
        "output_tokens": integer
    }
    
}

Exemples de réponses avec de nouvelles valeurs stop_reason :


// Example with refusal
{
    "stop_reason": "refusal",
    "content": [
        {
            "type": "text",
            "text": "I can't help with that request."
        }
    ]
}

// Example with tool_use
{
    "stop_reason": "tool_use",
    "content": [
        {
            "type": "tool_use",
            "id": "toolu_123",
            "name": "calculator",
            "input": {"expression": "2+2"}
        }
    ]
}

// Example with model_context_window_exceeded (Claude Sonnet 4.5)
{
    "stop_reason": "model_context_window_exceeded",
    "content": [
        {
            "type": "text",
            "text": "The response was truncated due to context window limits..."
        }
    ]
}

ID : identifiant unique de la réponse. Le format et la longueur de l’ID peuvent changer au fil du temps.
model : ID du modèle Anthropic Claude à l’origine de la demande.
stop_reason : raison pour laquelle Anthropic Claude a cessé de générer la réponse.
- end_turn : le modèle a atteint un point d’arrêt naturel
- max_tokens : le texte généré dépassait la valeur du champ d’entrée max_tokens ou le nombre maximum de jetons pris en charge par le modèle.
- stop_sequence : le modèle a généré l’une des séquences d’arrêt que vous avez spécifiées dans le champ d’entrée stop_sequences.
- refusal : Claude refuse de générer une réponse pour des raisons de sécurité
- tool_use : Claude appelle un outil et s’attend à ce que vous l’exécutiez
- model_context_window_exceeded : le modèle a arrêté la génération, car la limite de fenêtre contextuelle a été atteinte.
  - Nouveau avec Claude Sonnet 4.5
stop_sequence : séquence d’arrêt qui a mis fin à la génération.
type : type de réponse. La valeur est toujours message.
role : rôle conversationnel du message généré. La valeur est toujours assistant.
content : contenu généré par le modèle. Renvoyé sous forme de tableau. Il existe trois types de contenu :, text, tool_use et image.
- text : réponse textuelle.
  - type : type de contenu. Cette valeur est text.
  - text : si la valeur de type est du texte, contient le texte du contenu.
- tool use : demande du modèle d’utiliser un outil.
  - type : type de contenu. Cette valeur est tool_use.
  - id : ID de l’outil dont le modèle demande l’utilisation.
  - name : contient le nom de l’outil demandé.
  - input : paramètres d’entrée à transmettre à l’outil.
- Image : demande du modèle d’utiliser un outil.
  - type : type de contenu. Cette valeur est image.
  - source : contient l’image. Pour de plus amples informations, veuillez consulter Invites multimodales.
usage : conteneur contenant le nombre de jetons que vous avez fournis dans la demande et le nombre de jetons générés par le modèle dans la réponse.
- input_tokens : nombre de jetons d’entrée dans la demande.
- output_tokens : nombre de jetons générés par le modèle dans la réponse.
- stop_sequence : le modèle a généré l’une des séquences d’arrêt que vous avez spécifiées dans le champ d’entrée stop_sequences.

Paramètre d'effort (bêta)

Le effort paramètre est une alternative à l'idée de budgets symboliques pour Claude Opus 4,5. Ce paramètre indique dans Claude quelle mesure il doit dépenser les jetons pour obtenir le meilleur résultat, en ajustant l'utilisation des jetons en fonction de la réflexion, des appels aux outils et de la communication avec les utilisateurs. Il peut être utilisé avec ou sans mode de réflexion étendu.

Le paramètre d'effort peut être défini comme suit :

high(par défaut) : Claude dépense autant de jetons que nécessaire pour obtenir le meilleur résultat
medium— Utilisation équilibrée des jetons
low— Utilisation prudente des jetons

Pour utiliser cette fonctionnalité, vous devez transmettre l'en-tête bêtaeffort-2025-11-24.

Exemple de requête :


{
    "anthropic_version": "bedrock-2023-05-31",
    "anthropic_beta": [
        "effort-2025-11-24"
    ],
    "max_tokens": 4096,
    "output_config": {
        "effort": "medium"
    },
    "messages": [{
        "role": "user",
        "content": "Analyze this complex dataset and provide insights"
    }]
}

Avertissement JavaScript est désactivé ou n'est pas disponible dans votre navigateur.

Pour que vous puissiez utiliser la documentation AWS, Javascript doit être activé. Vous trouverez des instructions sur les pages d'aide de votre navigateur.

Conventions de rédaction

Sorties structurées

Exemples de code