Utilisation de Converse API Converse Exemple d'API

Inférence à l'aide de l'API Converse

L'API Converse est disponible uniquement sur le bedrock-runtime terminal.

Vous pouvez utiliser l’API Amazon Bedrock Converse pour créer des applications conversationnelles qui envoient et reçoivent des messages depuis et vers un modèle Amazon Bedrock. Par exemple, vous pouvez créer un bot de discussion qui entretient une conversation à plusieurs reprises et utilise une personnalisation du personnage ou du ton adaptée à vos besoins, par exemple un assistant de support technique utile.

Pour utiliser l'ConverseAPI, vous devez utiliser les opérations Converse ou ConverseStream(pour les réponses en streaming) pour envoyer des messages à un modèle. Il est possible d'utiliser les opérations d'inférence de base existantes (InvokeModelou InvokeModelWithResponseStream) pour les applications de conversation. Cependant, nous vous recommandons d’utiliser l’API Converse, car elle fournit une API cohérente, qui fonctionne avec tous les modèles Amazon Bedrock qui prennent en charge les messages. Cela signifie que vous pouvez écrire du code une seule fois et l’utiliser avec différents modèles. Si un modèle possède des paramètres d’inférence uniques, l’API Converse vous permet également de transmettre ces paramètres uniques dans une structure spécifique au modèle.

Vous pouvez utiliser l’API Converse pour implémenter l’utilisation d’outils et de barrières de protection dans vos applications.

Note

Avec les modèles Mistral AI et Meta, l’API Converse intègre vos entrées dans un modèle d’invite spécifique au modèle qui permet les conversations.
Des restrictions s'appliquent aux opérations suivantes : InvokeModelInvokeModelWithResponseStream,Converse, etConverseStream. Consultez les restrictions relatives aux API pour plus de détails.

Voici des exemples de code :

Exemples Python pour cette rubrique : Converse Exemple d'API
Différents langages et modèles : Exemples de code pour Amazon Bedrock Runtime utilisantAWSKits SDK
Didacticiel Java : Guide du développeur Java sur la nouvelle API Converse de Bedrock
JavaScript tutoriel — Un guide du développeur sur la nouvelle Converse API de Bedrock

Utilisation de Converse API

Pour utiliser l’API Converse, vous devez appeler les opérations Converse ou ConverseStream pour envoyer des messages à un modèle. Pour appeler Converse, vous devez disposer de l’autorisation sur l’opération bedrock:InvokeModel. Pour appeler ConverseStream, vous devez disposer de l’autorisation sur l’opération bedrock:InvokeModelWithResponseStream.

Demande

Lorsque vous envoyez une demande Converse à un point de terminaison d’exécution Amazon Bedrock, vous pouvez inclure les champs suivants :

modelId : paramètre obligatoire dans l’en-tête qui vous permet de spécifier la ressource à utiliser pour l’inférence.
Les champs suivants vous permettent de personnaliser l’invite :
- messages : à utiliser pour spécifier le contenu et le rôle des invites.
- system : à utiliser pour spécifier les invites du système, qui définissent les instructions ou le contexte du modèle.
- inferenceConfig : à utiliser pour spécifier les paramètres d’inférence communs à tous les modèles. Les paramètres d’inférence influencent la génération de la réponse.
- supplémentaire ModelRequestFields — À utiliser pour spécifier des paramètres d'inférence spécifiques au modèle avec lequel vous exécutez l'inférence.
- promptVariables : (si vous utilisez une invite de la gestion des invites) utilisez ce champ pour définir les variables de l’invite à renseigner et les valeurs avec lesquelles les remplir.
Les champs suivants vous permettent de personnaliser le mode de renvoi de la réponse :
- guardrailConfig : utilisez ce champ pour inclure une barrière de protection à appliquer à l’ensemble de l’invite.
- toolConfig : utilisez ce champ pour inclure un outil permettant à un modèle de générer des réponses.
- supplémentaire ModelResponseFieldPaths — Utilisez ce champ pour spécifier les champs à renvoyer sous forme d'objet pointeur JSON.
- ServiceTier — Utilisez ce champ pour spécifier le niveau de service pour une demande particulière
requestMetadata : utilisez ce champ pour inclure des métadonnées qui peuvent être filtrées lors de l’utilisation des journaux d’invocation.

Note

Les restrictions suivantes s’appliquent lorsque vous utilisez une invite de la gestion des invites avec Converse ou ConverseStream :

Vous ne pouvez pas inclure les champs additionalModelRequestFields, inferenceConfig, system ni toolConfig.
Si vous incluez le champ messages, les messages sont ajoutés après les messages définis dans l’invite.
Si vous incluez le champ guardrailConfig, la barrière de protection est appliquée à l’ensemble de l’invite. Si vous incluez guardContent des blocs dans le ContentBlockchamp, le garde-corps ne sera appliqué qu'à ces blocs.

Développez une section pour en savoir plus sur un champ dans le corps de la demande Converse :

messages

Le champ messages est un tableau d’objets Message, dont chacun définit un message entre l’utilisateur et le modèle. Un objet Message contient les champs suivants :

rôle : définit si le message provient de user (l’invite envoyée au modèle) ou de assistant (la réponse du modèle).
contenu : définit le contenu de l’invite.

Note
Amazon Bedrock ne stocke aucun texte, image ou document que vous fournissez sous forme de contenu. Les données ne sont utilisées que pour générer la réponse.

Vous pouvez conserver le contexte de la conversation en incluant tous les messages de la conversation dans les demandes Converse suivantes et en utilisant le champ role pour spécifier si le message provient de l’utilisateur ou du modèle.

Le content champ correspond à un ensemble d'ContentBlockobjets. Dans chacun d'eux ContentBlock, vous pouvez spécifier l'un des champs suivants (pour voir quels modèles supportent quels blocs, consultez les modèles en un coup d'œil) :

text

Le champ text correspond à une chaîne spécifiant l’invite. Le text champ est interprété parallèlement aux autres champs qui y sont spécifiés ContentBlock.

L'image suivante montre un objet Message avec un content tableau contenant uniquement du texte ContentBlock:


{
    "role": "user",
    "content": [
        {
            "text": "string"
        }
    ]
}

image

Le image champ correspond à un ImageBlock. Passez les octets bruts, codés en Base64, pour une image dans le champ bytes. Si vous utilisez un AWS SDK, vous n'avez pas besoin de coder les octets en base64.

Si vous excluez le champ text, le modèle décrit l’image.

Voici un exemple d'objet Message avec un content tableau contenant uniquement une image ContentBlock:


{
    "role": "user",
    "content": [
        {
            "image": {
                "format": "png",
                "source": {
                    "bytes": "image in bytes"
                }
            }
        }
    ]
}

Vous pouvez également spécifier un URI Amazon S3 au lieu de transmettre les octets directement dans le corps de la demande. Voici un exemple d’objet Message avec un tableau de contenu contenant la source transmise via un URI Amazon S3.


{
    "role": "user",
    "content": [
        {
            "image": {
                "format": "png",
                "source": {
                    "s3Location": {
                        "uri": "s3://amzn-s3-demo-bucket/myImage",
                        "bucketOwner": "111122223333"
                    }
                }
            }
        }
    ]
}

document

Le document champ correspond à un DocumentBlock. Si vous incluez un DocumentBlock, vérifiez que votre demande est conforme aux restrictions suivantes :

Dans le champ content de l’objet Message, vous devez également inclure un champ text contenant une invite liée au document.
Transmettez les octets bruts, codés en Base64, pour le document dans le champ bytes. Si vous utilisez un kit AWS SDK, vous n’avez pas besoin de coder les octets du document en Base64.
Le champ name peut contenir uniquement les caractères suivants :
- Caractères alphanumériques
- Caractères d’espacement (pas plus d’un par ligne)
- Traits d’union
- Parenthèses
- Crochets
Note
Le champ name est vulnérable aux injections d’invite, car le modèle risque de l’interpréter par inadvertance comme des instructions. Nous vous recommandons donc de spécifier un nom neutre.

Lorsque vous utilisez un document, vous pouvez activer la balise citations, qui fournira des citations spécifiques au document en réponse à l’appel d’API. Consultez l'DocumentBlockAPI pour plus de détails.

Voici un exemple d'objet Message avec un content tableau contenant uniquement un document ContentBlocket le texte d'accompagnement obligatoire ContentBlock.


{
    "role": "user",
    "content": [
        {
            "text": "string"
        },
        {
            "document": {
                "format": "pdf",
                "name": "MyDocument",
                "source": {
                    "bytes": "document in bytes"
                }
            }
        }
    ]
}


{
    "role": "user",
    "content": [
        {
            "text": "string"
        },
        {
            "document": {
                "format": "pdf",
                "name": "MyDocument",
                "source": {
                    "s3Location": {
                      "uri": "s3://amzn-s3-demo-bucket/myDocument",
                      "bucketOwner": "111122223333"
                    }
                }
            }
        }
    ]
}

video

Le video champ correspond à un VideoBlockobjet. Transmettez les octets bruts dans le champ bytes, codés en Base64. Si vous utilisez le AWS SDK, vous n'avez pas besoin de coder les octets en base64.

Si vous n’incluez pas le champ text, le modèle décrira la vidéo.

Voici un exemple d'objet Message avec un content tableau contenant uniquement une vidéo ContentBlock.


{
    "role": "user",
    "content": [
        {
            "video": {
                "format": "mp4",
                "source": {
                    "bytes": "video in bytes"
                }
            }
        }
    ]
}


{
    "role": "user",
    "content": [
        {
            "video": {
                "format": "mp4",
                "source": {
                    "s3Location": {
                        "uri": "s3://amzn-s3-demo-bucket/myVideo",
                        "bucketOwner": "111122223333"
                    }
                }
            }
        }
    ]
}

Note

Le rôle assumé doit avoir l’autorisation s3:GetObject sur l’URI Amazon S3. Le champ bucketOwner est facultatif mais doit être spécifié si le compte à l’origine de la demande ne possède pas le compartiment dans lequel se trouve l’URI Amazon S3. Pour de plus amples informations, veuillez consulter Configuration de l’accès aux compartiments Amazon S3.

cachePoint

Vous pouvez ajouter des points de contrôle du cache sous forme de bloc dans un message accompagné d'une invite en utilisant des cachePoint champs pour utiliser la mise en cache des invites. La mise en cache des invites est une fonctionnalité qui vous permet de commencer à mettre en cache le contexte des conversations afin de réaliser des économies de coûts et de latence. Pour de plus amples informations, veuillez consulter Mise en cache des invites pour une inférence de modèle plus rapide.

Voici un exemple d'objet Message avec un content tableau contenant un document ContentBlocket le texte d'accompagnement requis ContentBlock, ainsi qu'un CachePoint qui ajoute le contenu du document et du texte au cache.


{
    "role": "user",
    "content": [
        {
            "text": "string"
        },
        {
            "document": {
                "format": "pdf",
                "name": "string",
                "source": {
                    "bytes": "document in bytes"
                }
            }
        },
        {
            "cachePoint": {
                "type": "default"
            }
        }
    ]
}

guardContent

Le guardContent champ correspond à un GuardrailConverseContentBlockobjet. Vous pouvez utiliser ce champ pour cibler une entrée à évaluer par la barrière de protection définie dans le champ guardrailConfig. Si vous ne spécifiez pas ce champ, la barrière de protection évalue tous les messages du corps de la demande. Vous pouvez transmettre les types de contenu suivants dans un GuardBlock :

text — Voici un exemple d'objet Message avec un content tableau contenant uniquement du texte GuardrailConverseContentBlock:
```
{
    "role": "user",
    "content": [
        {
            "text": "Tell me what stocks to buy.",
            "qualifiers": [
                "guard_content"
            ]
        }
    ]
}
```
Vous définissez le texte à évaluer et incluez tous les qualificatifs à utiliser pour étayer le l’ancrage contextuel.

image — Ce qui suit montre un objet Message avec un content tableau contenant uniquement une image GuardrailConverseContentBlock:


{
    "role": "user",
    "content": [
        {
            "format": "png",
            "source": {
                "bytes": "image in bytes"
            }
        }
    ]
}

Vous spécifiez le format de l’image et définissez l’image en octets.

Pour plus d’informations sur les barrières de protection, consultez Détection et filtrage des contenus préjudiciables à l’aide des barrières de protection Amazon Bedrock.

reasoningContent

Le reasoningContent champ correspond à un ReasoningContentBlock. Ce bloc contient du contenu concernant le raisonnement qui a été appliqué par le modèle pour générer la réponse dans le ContentBlock d’accompagnement.

Ce qui suit montre un objet Message avec un tableau content contenant uniquement un ReasoningContentBlock et un ContentBlock de texte d’accompagnement.


{
    "role": "user",
    "content": [
        {
            "text": "string"
        },
        {
            "reasoningContent": {
                "reasoningText": {
                    "text": "string",
                    "signature": "string"
                }
                "redactedContent": "base64-encoded binary data object"
            }
        }
    ]
}

Le ReasoningContentBlock contient le raisonnement utilisé pour générer le contenu d’accompagnement dans le champ reasoningText, en plus de tout contenu du raisonnement qui a été crypté par le fournisseur du modèle pour des raisons de confiance et de sécurité dans le champ redactedContent.

Dans le champ reasoningText, les champs text décrivent le raisonnement. Le champ signature est un hachage de tous les messages de la conversation et constitue une protection contre toute modification du raisonnement utilisé par le modèle. Vous devez inclure la signature et tous les messages précédents dans les demandes Converse suivantes. Si l’un des messages est modifié, la réponse génère une erreur.

toolUse

Contient des informations sur un outil destiné au modèle à utiliser. Pour de plus amples informations, veuillez consulter Utilisation d’un outil pour compléter une réponse au modèle Amazon Bedrock.

toolResult

Contient des informations sur le résultat obtenu par le modèle utilisant un outil. Pour de plus amples informations, veuillez consulter Utilisation d’un outil pour compléter une réponse au modèle Amazon Bedrock.

Dans l’exemple messages suivant, l’utilisateur demande une liste de trois chansons pop, et le modèle génère une liste de chansons.


[
    {
        "role": "user",
        "content": [
            {
                "text": "Create a list of 3 pop songs."
            }
        ]
    },
    {
        "role": "assistant",
        "content": [
            {
                "text": "Here is a list of 3 pop songs by artists from the United Kingdom:\n\n1. \"As It Was\" by Harry Styles\n2. \"Easy On Me\" by Adele\n3. \"Unholy\" by Sam Smith and Kim Petras"
            }
        ]
    }
]

system

Une invite système est un type d’invite qui fournit des instructions ou un contexte au modèle concernant la tâche qu’il doit effectuer ou le personnage qu’il doit adopter au cours de la conversation. Vous pouvez spécifier une liste d'invites système pour la demande dans le champ system (SystemContentBlock), comme illustré dans l'exemple suivant.


[
    {
        "text": "You are an app that creates play lists for a radio station that plays rock and pop music. Only return song names and the artist. "
    }
]

inferenceConfig

L'ConverseAPI prend en charge un ensemble de base de paramètres d'inférence que vous définissez dans le inferenceConfig champ (InferenceConfiguration). Le jeu de base des paramètres d’inférence est le suivant :

maxTokens : le nombre maximum de jetons à autoriser dans la réponse générée.
stopSequences : liste de séquences d’arrêt. Une séquence d’arrêt est une séquence de caractères qui empêche le modèle de générer la réponse.
Température : probabilité que le modèle sélectionne des options à probabilité plus élevée tout en générant une réponse.
topP : pourcentage de candidats les plus probables pris en compte par le modèle pour le jeton suivant.

Pour de plus amples informations, veuillez consulter Génération de réponse d’influence à l’aide de paramètres d’inférence.

L’exemple JSON suivant définit le paramètre d’inférence temperature.


{"temperature": 0.5}

supplémentaire ModelRequestFields

Si le modèle que vous utilisez possède des paramètres d’inférence supplémentaires, vous pouvez définir ces paramètres en les spécifiant au format JSON dans le champ additionalModelRequestFields. L’exemple JSON suivant montre comment définir top_k, qui est disponible dans les modèles Anthropic Claude, mais qui n’est pas un paramètre d’inférence de base dans l’API de messages.


{"top_k": 200}

promptVariables

Si vous spécifiez une invite de Prompt Management dans le modelId comme ressource sur laquelle exécuter l’inférence, utilisez ce champ pour renseigner les variables d’invite avec des valeurs réelles. Le champ promptVariables correspond à un objet JSON dont les clés correspondent aux variables définies dans les invites et aux valeurs par lesquelles les variables doivent être remplacées.

Par exemple, supposons que vous ayez une invite indiquant Make me a {{genre}} playlist consisting of the following number of songs: {{number}}. L’ID de l’invite est PROMPT12345 et sa version est 1. Vous pouvez envoyer la demande Converse suivante pour remplacer les variables :


POST /model/arn:aws:bedrock:us-east-1:111122223333:prompt/PROMPT12345:1/converse HTTP/1.1
Content-type: application/json

{
   "promptVariables": { 
      "genre": {
         "text": "pop"
      },
      "number": {
         "text": "3"
      }
   }
}

guardrailConfig

Vous pouvez appliquer une barrière de protection que vous avez créée avec les barrières de protection Amazon Bedrock en incluant ce champ. Pour appliquer le garde-corps à un message spécifique de la conversation, incluez le message dans un. GuardrailConverseContentBlock Si vous n’incluez aucun GuardrailConverseContentBlock dans le corps de la demande, la barrière de protection est appliquée à tous les messages du champ messages. Pour obtenir un exemple, consultez Incluez un garde-corps avec le Converse API.

toolConfig

Ce champ vous permet de définir un outil que le modèle doit utiliser pour l’aider à générer une réponse. Pour de plus amples informations, veuillez consulter Utilisation d’un outil pour compléter une réponse au modèle Amazon Bedrock.

supplémentaire ModelResponseFieldPaths

Chaque modèle pris en charge par Amazon Bedrock possède sa propre forme de réponse native avec des champs spécifiques au fournisseur (par exemple, Anthropic Claude renvoie un stop_sequence champ, Cohere renvoieis_finished, etc.). Pour obtenir une réponse uniforme entre les modèles, conversez et ConverseStreamsupprimez la plupart des champs natifs du modèle par défaut et renvoyez une enveloppe normalisée avecoutput,, stopReason et. usage metrics

Si votre application a besoin d'un ou de plusieurs de ces champs natifs du modèle, listez leurs chemins de pointeur JSON dans. additionalModelResponseFieldPaths Inversez ConverseStreampuis incluez ces champs dans le additionalModelResponseFields champ de la réponse.

L'exemple suivant demande à Converse de renvoyer Anthropic Claude également stop_sequence le champ, qui contient la valeur de la séquence d'arrêt qui a mis fin à la génération :


[ "/stop_sequence" ]

Chaque chemin est un pointeur JSON (RFC 6901) vers la réponse native du modèle. Les pointeurs vides ou mal formés renvoient une erreur. 400 Si un pointeur est valide mais que le chemin demandé n'existe pas dans la réponse du modèle, il est ignoré en silence.

Note

Ce champ contrôle les champs de réponse natifs du modèle qui apparaissent dans Converse. Il ne contrôle pas le formatage de la sortie de texte. Certains modèlesDeepSeek-R1, en particulier les modèles de raisonnement tels que les modèles Claude 3.7 Sonnet de réflexion étendue et les modèles de Amazon Nova raisonnement, peuvent inclure un contenu de raisonnement ou des jetons spécifiques au modèle dans leur sortie de texte. Pour savoir comment utiliser le contenu du raisonnement, voirAmélioration des réponses des modèles grâce au raisonnement modélisé.

requestMetadata

Le requestMetadata champ correspond à un objet JSON composé de balises clé-valeur enregistrées avec la demande dans les journaux d'appel de votre modèle. Vous pouvez utiliser les métadonnées des demandes pour filtrer et agréger les journaux par équipe, application, environnement ou toute autre dimension qui varie selon les appels.

La même fonctionnalité est disponible sur InvokeModelet InvokeModelWithResponseStreamvia l'en-tête X-Amzn-Bedrock-Request-Metadata HTTP. Pour plus de détails sur les API prises en charge, les limites et la façon dont les métadonnées des demandes apparaissent dans les journaux d'invocation, consultezPer-request balisage des métadonnées.

Niveau de service

Ce champ est mappé à un objet JSON. Vous pouvez spécifier le niveau de service pour une demande particulière.

L'exemple suivant illustre la serviceTier structure :


"serviceTier": {
  "type": "reserved" | "priority" | "default" | "flex"
}

Pour obtenir des informations détaillées sur les niveaux de service, notamment les caractéristiques de tarification et de performance, consultezNiveaux de service pour optimiser les performances et les coûts.

Vous pouvez également éventuellement ajouter des points de contrôle du cache aux champs system ou tools pour utiliser la mise en cache des invites, selon le modèle que vous utilisez. Pour de plus amples informations, veuillez consulter Mise en cache des invites pour une inférence de modèle plus rapide.

Réponse

La réponse que vous obtenez de l’API Converse dépend de l’opération que vous appelez, Converse ou ConverseStream.

Réponse inverse

Dans le formulaire de réponseConverse, le output champ (ConverseOutput) contient le message (Message) généré par le modèle. Le contenu du message se trouve dans le champ content (ContentBlock) et le rôle (userouassistant) auquel le message correspond se trouve dans le role champ.

Si vous avez utilisé la mise en cache des invites, alors dans le champ d’utilisation, cacheReadInputTokens et cacheWriteInputTokens vous indiquent combien de jetons au total ont été lus depuis le cache et écrits dans le cache, respectivement.

Si vous avez utilisé des niveaux de service, le champ de réponse vous service tier indiquera quel niveau de service a été utilisé pour la demande.

Le metrics champ (ConverseMetrics) inclut les métriques de l'appel. Pour déterminer pourquoi le modèle a cessé de générer du contenu, vérifiez le champ stopReason. Vous pouvez obtenir des informations sur les jetons transmis au modèle dans la demande et sur les jetons générés dans la réponse en cochant le usage champ (TokenUsage). Si vous avez spécifié des champs de réponse supplémentaires dans la demande, l’API les renvoie au format JSON dans le champ additionalModelResponseFields.

L’exemple suivant montre la réponse de Converse lorsque vous avez répondu à l’invite décrite dans Demande.


{
    "output": {
        "message": {
            "role": "assistant",
            "content": [
                {
                    "text": "Here is a list of 3 pop songs by artists from the United Kingdom:\n\n1. \"Wannabe\" by Spice Girls\n2. \"Bitter Sweet Symphony\" by The Verve \n3. \"Don't Look Back in Anger\" by Oasis"
                }
            ]
        }
    },
    "stopReason": "end_turn",
    "usage": {
        "inputTokens": 125,
        "outputTokens": 60,
        "totalTokens": 185
    },
    "metrics": {
        "latencyMs": 1175
    }
}

ConverseStream réponse

Si vous appelez ConverseStream pour diffuser la réponse d’un modèle, le flux est renvoyé dans le champ de réponse stream. Le flux émet les événements suivants. Le schéma ci-dessous montre l'ordre dans lequel les événements sont reçus ; les événements des blocs de contenu se répètent une fois par bloc de contenu, regroupés parcontentBlockIndex.

messageStart                          (once per response)
    |
    v
+-- for each content block (indexed by contentBlockIndex) --+
|                                                           |
|   contentBlockStart    (tool use only)                    |
|   contentBlockDelta    (one or more; text / reasoning /   |
|                         tool use partial JSON)            |
|   contentBlockStop                                        |
|                                                           |
+-----------------------------------------------------------+
    |
    v
messageStop                           (once per response;
    |                                  carries stopReason)
    v
metadata                              (once per response;
                                       usage + metrics)

messageStart(MessageStartEvent). L'événement de début d'un message. Inclut le rôle du message.
contentBlockStart(ContentBlockStartEvent). Un événement de démarrage d'un bloc de contenu. Utilisation d’outils uniquement.
contentBlockDelta(ContentBlockDeltaEvent). Un événement delta du bloc de contenu. Essayez l’une des actions suivantes :
- text : texte partiel généré par le modèle.
- reasoningContent : raisonnement partiel effectué par le modèle pour générer la réponse. Vous devez envoyer le signature renvoyé, en plus de tous les messages précédents, dans les demandes Converse suivantes. Si l’un des messages est modifié, la réponse génère une erreur.
- toolUse : l’objet JSON d’entrée partielle destiné à l’utilisation de l’outil.
contentBlockStop(ContentBlockStopEvent). Un événement d'arrêt du blocage du contenu.
messageStop(MessageStopEvent). L'événement d'arrêt du message. Inclut la raison pour laquelle le modèle a cessé de générer une sortie.
metadata(ConverseStreamMetadataEvent). Métadonnées pour la demande. Les métadonnées incluent l'utilisation du jeton dans usage (TokenUsage) et les métriques de l'appel dans metrics (ConverseStreamMetadataEvent).

ConverseStream diffuse un bloc de contenu complet sous forme d'ContentBlockStartEventévénement, d'un ou de plusieurs ContentBlockDeltaEvent événements et d'un ContentBlockStopEvent événement. Utilisez le champ contentBlockIndex comme index pour corréler les événements qui constituent un bloc de contenu.

Voici un exemple de réponse partielle renvoyée par ConverseStream.


{'messageStart': {'role': 'assistant'}}
{'contentBlockDelta': {'delta': {'text': ''}, 'contentBlockIndex': 0}}
{'contentBlockDelta': {'delta': {'text': ' Title'}, 'contentBlockIndex': 0}}
{'contentBlockDelta': {'delta': {'text': ':'}, 'contentBlockIndex': 0}}
.
.
.
{'contentBlockDelta': {'delta': {'text': ' The'}, 'contentBlockIndex': 0}}
{'messageStop': {'stopReason': 'max_tokens'}}
{'metadata': {'usage': {'inputTokens': 47, 'outputTokens': 20, 'totalTokens': 67}, 'metrics': {'latencyMs': 100.0}}}

Converse Exemple d'API

Le tableau suivant montre des exemples d’utilisation des opérations Converse et ConverseStream.

Text

Cet exemple montre comment appeler l’opération Converse avec le modèle Anthropic Claude 3 Sonnet. L’exemple montre comment envoyer le texte d’entrée, les paramètres d’inférence et les paramètres supplémentaires propres au modèle. Le code lance une conversation en demandant au modèle de créer une liste de chansons. Il poursuit ensuite la conversation en demandant que les chansons soient d’artistes du Royaume Uni.


# Copyright Amazon.com, Inc. or its affiliates. All Rights Reserved.
# SPDX-License-Identifier: Apache-2.0
"""
Shows how to use the <noloc>Converse</noloc> API with Anthropic Claude 3 Sonnet (on demand).
"""

import logging
import boto3

from botocore.exceptions import ClientError


logger = logging.getLogger(__name__)
logging.basicConfig(level=logging.INFO)


def generate_conversation(bedrock_client,
                          model_id,
                          system_prompts,
                          messages):
    """
    Sends messages to a model.
    Args:
        bedrock_client: The Boto3 Bedrock runtime client.
        model_id (str): The model ID to use.
        system_prompts (JSON) : The system prompts for the model to use.
        messages (JSON) : The messages to send to the model.

    Returns:
        response (JSON): The conversation that the model generated.

    """

    logger.info("Generating message with model %s", model_id)

    # Inference parameters to use.
    temperature = 0.5
    top_k = 200

    # Base inference parameters to use.
    inference_config = {"temperature": temperature}
    # Additional inference parameters to use.
    additional_model_fields = {"top_k": top_k}

    # Send the message.
    response = bedrock_client.converse(
        modelId=model_id,
        messages=messages,
        system=system_prompts,
        inferenceConfig=inference_config,
        additionalModelRequestFields=additional_model_fields
    )

    # Log token usage.
    token_usage = response['usage']
    logger.info("Input tokens: %s", token_usage['inputTokens'])
    logger.info("Output tokens: %s", token_usage['outputTokens'])
    logger.info("Total tokens: %s", token_usage['totalTokens'])
    logger.info("Stop reason: %s", response['stopReason'])

    return response

def main():
    """
    Entrypoint for Anthropic Claude 3 Sonnet example.
    """

    logging.basicConfig(level=logging.INFO,
                        format="%(levelname)s: %(message)s")

    model_id = "anthropic.claude-3-sonnet-20240229-v1:0"

    # Setup the system prompts and messages to send to the model.
    system_prompts = [{"text": "You are an app that creates playlists for a radio station that plays rock and pop music. Only return song names and the artist."}]
    message_1 = {
        "role": "user",
        "content": [{"text": "Create a list of 3 pop songs."}]
    }
    message_2 = {
        "role": "user",
        "content": [{"text": "Make sure the songs are by artists from the United Kingdom."}]
    }
    messages = []

    try:

        bedrock_client = boto3.client(service_name='bedrock-runtime')

        # Start the conversation with the 1st message.
        messages.append(message_1)
        response = generate_conversation(
            bedrock_client, model_id, system_prompts, messages)

        # Add the response message to the conversation.
        output_message = response['output']['message']
        messages.append(output_message)

        # Continue the conversation with the 2nd message.
        messages.append(message_2)
        response = generate_conversation(
            bedrock_client, model_id, system_prompts, messages)

        output_message = response['output']['message']
        messages.append(output_message)

        # Show the complete conversation.
        for message in messages:
            print(f"Role: {message['role']}")
            for content in message['content']:
                print(f"Text: {content['text']}")
            print()

    except ClientError as err:
        message = err.response['Error']['Message']
        logger.error("A client error occurred: %s", message)
        print(f"A client error occured: {message}")

    else:
        print(
            f"Finished generating text with model {model_id}.")


if __name__ == "__main__":
    main()

Image

Cet exemple montre comment envoyer une image dans le cadre d’un message et demande au modèle de décrire l’image. L’exemple utilise l’opération Converse et le modèle AnthropicClaude 3 Sonnet.


# Copyright Amazon.com, Inc. or its affiliates. All Rights Reserved.
# SPDX-License-Identifier: Apache-2.0
"""
Shows how to send an image with the <noloc>Converse</noloc> API with an accompanying text prompt to Anthropic Claude 3 Sonnet (on demand).
"""

import logging
import boto3


from botocore.exceptions import ClientError


logger = logging.getLogger(__name__)
logging.basicConfig(level=logging.INFO)


def generate_conversation(bedrock_client,
                          model_id,
                          input_text,
                          input_image):
    """
    Sends a message to a model.
    Args:
        bedrock_client: The Boto3 Bedrock runtime client.
        model_id (str): The model ID to use.
        input text : The text prompt accompanying the image.
        input_image : The path to the input image.

    Returns:
        response (JSON): The conversation that the model generated.

    """

    logger.info("Generating message with model %s", model_id)

    # Get image extension and read in image as bytes
    image_ext = input_image.split(".")[-1]
    with open(input_image, "rb") as f:
        image = f.read()

    message = {
        "role": "user",
        "content": [
            {
                "text": input_text
            },
            {
                "image": {
                    "format": image_ext,
                    "source": {
                        "bytes": image
                    }
                }
            }
        ]
    }

    messages = [message]

    # Send the message.
    response = bedrock_client.converse(
        modelId=model_id,
        messages=messages
    )

    return response


def main():
    """
    Entrypoint for Anthropic Claude 3 Sonnet example.
    """

    logging.basicConfig(level=logging.INFO,
                        format="%(levelname)s: %(message)s")

    model_id = "anthropic.claude-3-sonnet-20240229-v1:0"
    input_text = "What's in this image?"
    input_image = "path/to/image"

    try:

        bedrock_client = boto3.client(service_name="bedrock-runtime")

        response = generate_conversation(
            bedrock_client, model_id, input_text, input_image)

        output_message = response['output']['message']

        print(f"Role: {output_message['role']}")

        for content in output_message['content']:
            print(f"Text: {content['text']}")

        token_usage = response['usage']
        print(f"Input tokens:  {token_usage['inputTokens']}")
        print(f"Output tokens:  {token_usage['outputTokens']}")
        print(f"Total tokens:  {token_usage['totalTokens']}")
        print(f"Stop reason: {response['stopReason']}")

    except ClientError as err:
        message = err.response['Error']['Message']
        logger.error("A client error occurred: %s", message)
        print(f"A client error occured: {message}")

    else:
        print(
            f"Finished generating text with model {model_id}.")


if __name__ == "__main__":
    main()

Document

Cet exemple montre comment envoyer un document dans le cadre d’un message et demande au modèle de décrire le contenu du document. L’exemple utilise l’opération Converse et le modèle AnthropicClaude 3 Sonnet.


# Copyright Amazon.com, Inc. or its affiliates. All Rights Reserved.
# SPDX-License-Identifier: Apache-2.0
"""
Shows how to send an document as part of a message to Anthropic Claude 3 Sonnet (on demand).
"""

import logging
import boto3


from botocore.exceptions import ClientError


logger = logging.getLogger(__name__)
logging.basicConfig(level=logging.INFO)


def generate_message(bedrock_client,
                     model_id,
                     input_text,
                     input_document_path):
    """
    Sends a message to a model.
    Args:
        bedrock_client: The Boto3 Bedrock runtime client.
        model_id (str): The model ID to use.
        input text : The input message.
        input_document_path : The path to the input document.

    Returns:
        response (JSON): The conversation that the model generated.

    """

    logger.info("Generating message with model %s", model_id)

    # Get format from path and read the path
    input_document_format = input_document_path.split(".")[-1]
    with open(input_document_path, 'rb') as input_document_file:
        input_document = input_document_file.read()

    # Message to send.
    message = {
        "role": "user",
        "content": [
            {
                "text": input_text
            },
            {
                "document": {
                    "name": "MyDocument",
                    "format": input_document_format,
                    "source": {
                        "bytes": input_document
                    }
                }
            }
        ]
    }

    messages = [message]

    # Send the message.
    response = bedrock_client.converse(
        modelId=model_id,
        messages=messages
    )

    return response


def main():
    """
    Entrypoint for Anthropic Claude 3 Sonnet example.
    """

    logging.basicConfig(level=logging.INFO,
                        format="%(levelname)s: %(message)s")

    model_id = "anthropic.claude-3-sonnet-20240229-v1:0"
    input_text = "What's in this document?"
    input_document_path = "path/to/document"

    try:

        bedrock_client = boto3.client(service_name="bedrock-runtime")


        response = generate_message(
            bedrock_client, model_id, input_text, input_document_path)

        output_message = response['output']['message']

        print(f"Role: {output_message['role']}")

        for content in output_message['content']:
            print(f"Text: {content['text']}")

        token_usage = response['usage']
        print(f"Input tokens:  {token_usage['inputTokens']}")
        print(f"Output tokens:  {token_usage['outputTokens']}")
        print(f"Total tokens:  {token_usage['totalTokens']}")
        print(f"Stop reason: {response['stopReason']}")

    except ClientError as err:
        message = err.response['Error']['Message']
        logger.error("A client error occurred: %s", message)
        print(f"A client error occured: {message}")

    else:
        print(
            f"Finished generating text with model {model_id}.")


if __name__ == "__main__":
    main()

Streaming

Cet exemple montre comment appeler l’opération ConverseStream avec le modèle Anthropic Claude 3 Sonnet. L’exemple montre comment envoyer le texte d’entrée, les paramètres d’inférence et les paramètres supplémentaires propres au modèle.


# Copyright Amazon.com, Inc. or its affiliates. All Rights Reserved.
# SPDX-License-Identifier: Apache-2.0
"""
Shows how to use the <noloc>Converse</noloc> API to stream a response from Anthropic Claude 3 Sonnet (on demand).
"""

import logging
import boto3


from botocore.exceptions import ClientError


logger = logging.getLogger(__name__)
logging.basicConfig(level=logging.INFO)


def stream_conversation(bedrock_client,
                    model_id,
                    messages,
                    system_prompts,
                    inference_config,
                    additional_model_fields):
    """
    Sends messages to a model and streams the response.
    Args:
        bedrock_client: The Boto3 Bedrock runtime client.
        model_id (str): The model ID to use.
        messages (JSON) : The messages to send.
        system_prompts (JSON) : The system prompts to send.
        inference_config (JSON) : The inference configuration to use.
        additional_model_fields (JSON) : Additional model fields to use.

    Returns:
        Nothing.

    """

    logger.info("Streaming messages with model %s", model_id)

    response = bedrock_client.converse_stream(
        modelId=model_id,
        messages=messages,
        system=system_prompts,
        inferenceConfig=inference_config,
        additionalModelRequestFields=additional_model_fields
    )

    stream = response.get('stream')
    if stream:
        for event in stream:

            if 'messageStart' in event:
                print(f"\nRole: {event['messageStart']['role']}")

            if 'contentBlockDelta' in event:
                print(event['contentBlockDelta']['delta']['text'], end="")

            if 'messageStop' in event:
                print(f"\nStop reason: {event['messageStop']['stopReason']}")

            if 'metadata' in event:
                metadata = event['metadata']
                if 'usage' in metadata:
                    print("\nToken usage")
                    print(f"Input tokens: {metadata['usage']['inputTokens']}")
                    print(
                        f":Output tokens: {metadata['usage']['outputTokens']}")
                    print(f":Total tokens: {metadata['usage']['totalTokens']}")
                if 'metrics' in event['metadata']:
                    print(
                        f"Latency: {metadata['metrics']['latencyMs']} milliseconds")


def main():
    """
    Entrypoint for streaming message API response example.
    """

    logging.basicConfig(level=logging.INFO,
                        format="%(levelname)s: %(message)s")

    model_id = "anthropic.claude-3-sonnet-20240229-v1:0"
    system_prompt = """You are an app that creates playlists for a radio station
      that plays rock and pop music. Only return song names and the artist."""

    # Message to send to the model.
    input_text = "Create a list of 3 pop songs."

    message = {
        "role": "user",
        "content": [{"text": input_text}]
    }
    messages = [message]
    
    # System prompts.
    system_prompts = [{"text" : system_prompt}]

    # inference parameters to use.
    temperature = 0.5
    top_k = 200
    # Base inference parameters.
    inference_config = {
        "temperature": temperature
    }
    # Additional model inference parameters.
    additional_model_fields = {"top_k": top_k}

    try:
        bedrock_client = boto3.client(service_name='bedrock-runtime')

        stream_conversation(bedrock_client, model_id, messages,
                        system_prompts, inference_config, additional_model_fields)

    except ClientError as err:
        message = err.response['Error']['Message']
        logger.error("A client error occurred: %s", message)
        print("A client error occured: " +
              format(message))

    else:
        print(
            f"Finished streaming messages with model {model_id}.")


if __name__ == "__main__":
    main()

Video

Cet exemple montre comment envoyer une vidéo dans le cadre d’un message et demande au modèle de décrire la vidéo. L’exemple utilise l’opération Converse et le modèle Amazon Nova Pro.


# Copyright Amazon.com, Inc. or its affiliates. All Rights Reserved.
# SPDX-License-Identifier: Apache-2.0
"""
Shows how to send a video with the <noloc>Converse</noloc> API to Amazon Nova Pro (on demand).
"""

import logging
import boto3


from botocore.exceptions import ClientError


logger = logging.getLogger(__name__)
logging.basicConfig(level=logging.INFO)


def generate_conversation(bedrock_client,
                          model_id,
                          input_text,
                          input_video):
    """
    Sends a message to a model.
    Args:
        bedrock_client: The Boto3 Bedrock runtime client.
        model_id (str): The model ID to use.
        input text : The input message.
        input_video : The input video.

    Returns:
        response (JSON): The conversation that the model generated.

    """

    logger.info("Generating message with model %s", model_id)

    # Message to send.

    with open(input_video, "rb") as f:
        video = f.read()

    message = {
        "role": "user",
        "content": [
            {
                "text": input_text
            },
            {
                    "video": {
                        "format": 'mp4',
                        "source": {
                            "bytes": video
                        }
                    }
            }
        ]
    }

    messages = [message]

    # Send the message.
    response = bedrock_client.converse(
        modelId=model_id,
        messages=messages
    )

    return response


def main():
    """
    Entrypoint for Amazon Nova Pro example.
    """

    logging.basicConfig(level=logging.INFO,
                        format="%(levelname)s: %(message)s")

    model_id = "amazon.nova-pro-v1:0"
    input_text = "What's in this video?"
    input_video = "path/to/video"

    try:

        bedrock_client = boto3.client(service_name="bedrock-runtime")

        response = generate_conversation(
            bedrock_client, model_id, input_text, input_video)

        output_message = response['output']['message']

        print(f"Role: {output_message['role']}")

        for content in output_message['content']:
            print(f"Text: {content['text']}")

        token_usage = response['usage']
        print(f"Input tokens:  {token_usage['inputTokens']}")
        print(f"Output tokens:  {token_usage['outputTokens']}")
        print(f"Total tokens:  {token_usage['totalTokens']}")
        print(f"Stop reason: {response['stopReason']}")

    except ClientError as err:
        message = err.response['Error']['Message']
        logger.error("A client error occurred: %s", message)
        print(f"A client error occured: {message}")

    else:
        print(
            f"Finished generating text with model {model_id}.")


if __name__ == "__main__":
    main()

Avertissement JavaScript est désactivé ou n'est pas disponible dans votre navigateur.

Pour que vous puissiez utiliser la documentation AWS, Javascript doit être activé. Vous trouverez des instructions sur les pages d'aide de votre navigateur.

Conventions de rédaction

Invoquer l'API

Paramètres d'inférence