Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.
Qu’est-ce que l’ingénierie de requête ?
L’ingénierie de requête désigne la pratique consistant à créer et à optimiser des invites d’entrée en sélectionnant les mots, les expressions, les phrases, les signes de ponctuation et les caractères de séparation appropriés, afin d’utiliser efficacement les LLM pour une grande variété d’applications. En d’autres termes, l’ingénierie de requête est l’art de communiquer avec un LLM. Les invites de haute qualité conditionnent le LLM pour qu’il génère les réponses souhaitées ou les plus adaptées. Les consignes détaillées fournies dans ce document sont applicables à tous les LLM dans Amazon Bedrock.
L’approche d’ingénierie de requête la plus efficace pour votre cas d’utilisation dépend à la fois de la tâche et des données. Voici les tâches courantes prises en charge par les LLM dans Amazon Bedrock :
-
Classification : l’invite inclut une question avec plusieurs choix de réponse possibles, et le modèle doit répondre avec le choix approprié. L’analyse du sentiment est un exemple de cas d’utilisation de la classification : l’entrée est un passage de texte, et le modèle doit classer le sentiment du texte (positif ou négatif, inoffensif ou toxique, par exemple).
-
Question-réponse, sans contexte : le modèle doit répondre à la question avec ses connaissances internes, sans contexte ni document.
-
Question-réponse, avec contexte : l’utilisateur fournit un texte d’entrée avec une question, et le modèle doit y répondre en fonction des informations fournies dans le texte d’entrée.
-
Résumé : l’invite est un passage de texte, et le modèle doit répondre par un passage plus court qui capture les points principaux de l’entrée.
-
Génération de texte ouvert : à l’envoi d’une invite, le modèle doit répondre par un passage de texte original correspondant à la description. Cela comprend également la génération de textes créatifs tels que des histoires, des poèmes ou des scénarios de films.
-
Génération de code : le modèle doit générer du code en fonction des spécifications de l’utilisateur. Par exemple, une invite peut demander la génération de code Python ou texte en SQL.
-
Mathématiques : l’entrée décrit un problème qui nécessite un raisonnement mathématique à un certain niveau, qui peut être numérique, logique, géométrique ou autre.
-
Raisonnement ou pensée logique : le modèle doit faire une série de déductions logiques.
-
Extraction d’entités : l’extraction d’entités peut extraire des entités en fonction d’une question d’entrée fournie. Vous pouvez extraire des entités spécifiques du texte ou de l’entrée en fonction de votre invite.
-
Raisonnement fondé sur la chaîne de pensée : expliquez étape par étape comment une réponse est dérivée en fonction de votre invite.