Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.
Demande et réponse
Le corps de la demande est transmis dans le body champ d'une demande à InvokeModelou InvokeModelWithResponseStream.
Note
Des restrictions s'appliquent aux opérations suivantes : InvokeModelInvokeModelWithResponseStream,Converse, etConverseStream. Consultez les restrictions relatives aux API pour plus de détails.
Avertissement
Claude Sonnet 4.5et la Claude Haiku 4.5 prise en charge de la spécification du top_p paramètre temperature ou, mais pas des deux. Cela ne s’applique pas aux modèles plus anciens.
- Request
-
Anthropic Claude comporte les paramètres d’inférence suivants pour un appel d’inférence de messages.
{ "anthropic_version": "bedrock-2023-05-31", "anthropic_beta": ["computer-use-2024-10-22"] "max_tokens": int, "system": string, "messages": [ { "role": string, "content": [ { "type": "image", "source": { "type": "base64", "media_type": "image/jpeg", "data": "content image bytes" } }, { "type": "text", "text": "content text" } ] } ], "temperature": float, "top_p": float, "top_k": int, "tools": [ { "type": "custom", "name": string, "description": string, "input_schema": json }, { "type": "computer_20241022", "name": "computer", "display_height_px": int, "display_width_px": int, "display_number": 0 int }, { "type": "bash_20241022", "name": "bash" }, { "type": "text_editor_20241022", "name": "str_replace_editor" } ], "tool_choice": { "type" : string, "name" : string, }, "stop_sequences": [string] }Les paramètres suivants sont obligatoires.
-
anthropic_version : (obligatoire) la version anthropique. La valeur doit être
bedrock-2023-05-31. -
max_tokens : (obligatoire) le nombre maximum de jetons à générer avant l’arrêt.
Notez que les modèles Anthropic Claude peuvent arrêter de générer des jetons avant d’atteindre la valeur
max_tokens. Les différents modèles Anthropic Claude ont des valeurs maximales différentes pour ce paramètre. Pour plus d’informations, consultez Comparaison de modèles. -
messages : (obligatoire) les messages d’entrée.
-
role : le rôle du tour de conversation. Les valeurs valides sont
useretassistant.Minimum Maximum 0
2000
-
content : (obligatoire) le contenu de la conversation prend la forme d’un tableau d’objets. Chaque objet contient un champ type dans lequel vous pouvez spécifier l’une des valeurs suivantes :
-
text: si vous spécifiez ce type, vous devez inclure un champ texte et spécifier l’invite de texte comme valeur. Si un autre objet du tableau est une image, cette invite de texte s’applique aux images. -
image: si vous spécifiez ce type, vous devez inclure un champ source qui correspond à un objet avec les champs suivants :-
type : (obligatoire) type de codage de l’image. Vous pouvez spécifier
base64. -
media_type : (obligatoire) type de l’image. Vous pouvez spécifier les formats d’image suivants :
-
image/jpeg -
image/png -
image/webp -
image/gif
-
-
data : (obligatoire) octets de l’image codés en Base64 pour l’image. La taille maximale est de 3,75 Mo. La hauteur et la largeur maximales d’une image sont de 8 000 pixels.
-
-
-
Les paramètres suivants sont facultatifs.
-
system : (facultatif) invite du système pour la demande.
Une invite système est un moyen de fournir du contexte et des instructions Anthropic Claude, par exemple en spécifiant un objectif ou un rôle particulier. Pour plus d’informations, consultez System prompts
dans la documentation Anthropic. Note
Vous pouvez utiliser les invites du système avec Anthropic Claude version 2.1 ou supérieure.
-
anthropic_beta : (facultatif) le paramètre bêta anthropique est une liste de chaînes d’en-têtes bêta utilisés pour indiquer l’adhésion à un ensemble particulier de fonctionnalités bêta.
Note
La variante contextuelle d'un million de jetons Claude Sonnet 4 est disponible dans certaines AWS régions sous la forme d'un « service bêta » tel que défini dans les conditions AWS de service. Il est soumis à votre accord AWS et aux conditions de AWS service, ainsi qu'au modèle EULA applicable. Consultez la page Tarification d’Amazon Bedrock
pour plus d’informations sur les tarifs applicables aux demandes contextuelles plus longues. Des quotas de service distincts s'appliquent (pour plus d'informations, voir Quotas de service dans le AWS Management Console). Les en-têtes bêta disponibles sont les suivants :
Caractéristique bêta
En-tête bêta
Remarques
Utilisation d’ordinateur
computer-use-2025-01-24Compatible avec Claude 3.7 Sonnet
Utilisation d’outil
token-efficient-tools-2025-02-19Compatible avec Claude 3.7 Sonnet et Claude 4+.
Réflexion entrelacée
Interleaved-thinking-2025-05-14Compatible avec les modèles Claude 4+.
Permet de générer jusqu’à 128 000 jetons
output-128k-2025-02-19Compatible avec Claude 3.7 Sonnet
Mode développeur pour une réflexion brute sur les modèles Claude 4+
dev-full-thinking-2025-05-14Compatible avec les modèles Claude 4+ uniquement. Contactez l’équipe de votre compte pour accéder à cette version bêta.
1 million de jetons
context-1m-2025-08-07Compatible avec Claude Sonnet 4
Gestion du contexte
context-management-2025-06-27Compatible avec Claude Sonnet 4.5 et Claude Haiku 4.5.
Effort
effort-2025-11-24Compatible avec Claude Opus 4.5
Outil de recherche d'outils
tool-search-tool-2025-10-19Compatible avec Claude Opus 4.5
Exemples d'utilisation d'outils
tool-examples-2025-10-29Compatible avec Claude Opus 4.5
-
stop_sequences : (facultatif) séquences de texte personnalisées qui empêchent la génération du modèle. Les modèles Anthropic Claude s’arrêtent normalement lorsqu’ils ont naturellement terminé leur tour, dans ce cas, la valeur du champ de réponse
stop_reasonestend_turn. Si vous souhaitez que le modèle cesse de générer lorsqu’il rencontre des chaînes de texte personnalisées, vous pouvez utiliser le paramètrestop_sequences. Si le modèle rencontre l’une des chaînes de texte personnalisées, la valeur du champ de réponsestop_reasoneststop_sequenceet la valeur destop_sequencecontient la séquence d’arrêt correspondante.Le nombre maximal d’entrées est de 8 191.
-
temperature : (facultatif) quantité de randomisation injectée dans la réponse.
Par défaut Minimum Maximum 1
0
1
-
top_p : (facultatif) utilisez l’échantillonnage du noyau.
Lors de l’échantillonnage du noyau, Anthropic Claude calcule la distribution cumulée de toutes les options pour chaque jeton suivant par ordre de probabilité décroissant et la coupe une fois qu’elle atteint une probabilité particulière spécifiée par
top_p. Lorsque vous ajustez les paramètres d’échantillonnage, modifieztemperatureoutop_p. Ne modifiez pas les deux en même temps.Par défaut Minimum Maximum 0,999
0
1
-
top_k : (facultatif) échantillonnez uniquement les premières options K pour chaque jeton suivant.
Utilisez
top_kpour supprimer les réponses à faible probabilité à longue queue.Par défaut Minimum Maximum Désactivé par défaut
0
500
-
tools : (facultatif) définitions des outils que le modèle peut utiliser.
Note
Nécessite un modèle Anthropic Claude 3.
Si vous incluez
toolsdans votre demande, le modèle peut renvoyer des blocs de contenutool_usereprésentant l’utilisation de ces outils par le modèle. Vous pouvez ensuite exécuter ces outils à l’aide de l’entrée d’outil générée par le modèle, puis éventuellement renvoyer les résultats au modèle à l’aide de blocs de contenutool_result.Vous pouvez transmettre les types d’outils suivants :
Personnalisé
Définition d’un outil personnalisé.
-
(facultatif) type : type de l’outil. Si elle est définie, utilisez la valeur
custom. -
name : nom de l’outil.
-
description : (facultatif, mais fortement recommandé) description de l’outil.
-
input_schema : schéma JSON de l’outil.
Ordinateur
Définition de l’outil informatique que vous utilisez avec l’API d’utilisation d’ordinateur.
-
type : la valeur doit être
computer_20241022. -
name : la valeur doit être
computer. -
(Obligatoire) display_height_px : hauteur de l’écran contrôlée par le modèle, en pixels.
Par défaut Minimum Maximum Aucune
1
Aucun maximum
-
(Obligatoire) display_width_px : largeur de l’écran contrôlée par le modèle, en pixels.
Par défaut Minimum Maximum Aucune
1
Aucun maximum
-
(Facultatif) display_number : numéro d’affichage à contrôler (pertinent uniquement pour les environnements X11). Si cela est spécifié, un numéro d’affichage sera fourni à l’outil dans la définition de l’outil.
Par défaut Minimum Maximum Aucune
0
N
bash
Définition de l’outil bash que vous utilisez avec l’API d’utilisation d’ordinateur.
-
(facultatif) type : la valeur doit être
bash_20241022. -
name : la valeur doit être l’outil
bash.
éditeur de texte
Définition de l’éditeur de texte que vous utilisez avec l’API d’utilisation d’ordinateur.
-
(facultatif) type : la valeur doit être
text_editor_20241022. -
name : la valeur doit être l’outil
str_replace_editor.
-
-
tool_choice : (facultatif) spécifie comment le modèle doit utiliser les outils fournis. Le modèle peut utiliser un outil spécifique, n’importe quel outil disponible, ou décider par lui-même.
Note
Nécessite un modèle Anthropic Claude 3.
-
type : type d’outil choisi. Les valeurs possibles sont
any(utiliser n’importe quel outil disponible),auto(le modèle décide) ettool(utiliser l’outil spécifié).
-
name : (facultatif) nom de l’outil à utiliser. Obligatoire si vous le spécifiez
tooldans le champtype.
-
-
- Response
-
Le modèle Anthropic Claude renvoie les champs suivants pour un appel d’inférence de complétion de messages.
{ "id": string, "model": string, "type" : "message", "role" : "assistant", "content": [ { "type": string, "text": string, "image" :json, "id": string, "name":string, "input": json } ], "stop_reason": string, "stop_sequence": string, "usage": { "input_tokens": integer, "output_tokens": integer } }Exemples de réponses avec de nouvelles valeurs stop_reason :
// Example with refusal { "stop_reason": "refusal", "content": [ { "type": "text", "text": "I can't help with that request." } ] } // Example with tool_use { "stop_reason": "tool_use", "content": [ { "type": "tool_use", "id": "toolu_123", "name": "calculator", "input": {"expression": "2+2"} } ] } // Example with model_context_window_exceeded (Claude Sonnet 4.5) { "stop_reason": "model_context_window_exceeded", "content": [ { "type": "text", "text": "The response was truncated due to context window limits..." } ] }-
ID : identifiant unique de la réponse. Le format et la longueur de l’ID peuvent changer au fil du temps.
-
model : ID du modèle Anthropic Claude à l’origine de la demande.
-
stop_reason : raison pour laquelle Anthropic Claude a cessé de générer la réponse.
-
end_turn : le modèle a atteint un point d’arrêt naturel
-
max_tokens : le texte généré dépassait la valeur du champ d’entrée
max_tokensou le nombre maximum de jetons pris en charge par le modèle. -
stop_sequence : le modèle a généré l’une des séquences d’arrêt que vous avez spécifiées dans le champ d’entrée
stop_sequences. -
refusal : Claude refuse de générer une réponse pour des raisons de sécurité
-
tool_use : Claude appelle un outil et s’attend à ce que vous l’exécutiez
-
model_context_window_exceeded : le modèle a arrêté la génération, car la limite de fenêtre contextuelle a été atteinte.
-
Nouveau avec Claude Sonnet 4.5
-
-
-
stop_sequence : séquence d’arrêt qui a mis fin à la génération.
-
type : type de réponse. La valeur est toujours
message. -
role : rôle conversationnel du message généré. La valeur est toujours
assistant. -
content : contenu généré par le modèle. Renvoyé sous forme de tableau. Il existe trois types de contenu :, text, tool_use et image.
-
text : réponse textuelle.
-
type : type de contenu. Cette valeur est
text. -
text : si la valeur de
typeest du texte, contient le texte du contenu.
-
-
tool use : demande du modèle d’utiliser un outil.
-
type : type de contenu. Cette valeur est
tool_use. -
id : ID de l’outil dont le modèle demande l’utilisation.
-
name : contient le nom de l’outil demandé.
-
input : paramètres d’entrée à transmettre à l’outil.
-
-
Image : demande du modèle d’utiliser un outil.
-
type : type de contenu. Cette valeur est
image. -
source : contient l’image. Pour de plus amples informations, veuillez consulter Invites multimodales.
-
-
-
usage : conteneur contenant le nombre de jetons que vous avez fournis dans la demande et le nombre de jetons générés par le modèle dans la réponse.
-
input_tokens : nombre de jetons d’entrée dans la demande.
-
output_tokens : nombre de jetons générés par le modèle dans la réponse.
-
stop_sequence : le modèle a généré l’une des séquences d’arrêt que vous avez spécifiées dans le champ d’entrée
stop_sequences.
-
-
Paramètre d'effort (bêta)
Le effort paramètre est une alternative à l'idée de budgets symboliques pour Claude Opus 4,5. Ce paramètre indique dans Claude quelle mesure il doit dépenser les jetons pour obtenir le meilleur résultat, en ajustant l'utilisation des jetons en fonction de la réflexion, des appels aux outils et de la communication avec les utilisateurs. Il peut être utilisé avec ou sans mode de réflexion étendu.
Le paramètre d'effort peut être défini comme suit :
-
high(par défaut) : Claude dépense autant de jetons que nécessaire pour obtenir le meilleur résultat -
medium— Utilisation équilibrée des jetons -
low— Utilisation prudente des jetons
Pour utiliser cette fonctionnalité, vous devez transmettre l'en-tête bêtaeffort-2025-11-24.
Exemple de requête :
{ "anthropic_version": "bedrock-2023-05-31", "anthropic_beta": [ "effort-2025-11-24" ], "max_tokens": 4096, "output_config": { "effort": "medium" }, "messages": [{ "role": "user", "content": "Analyze this complex dataset and provide insights" }] }