Qu’est-ce que l’ingénierie de requête ?

L’ingénierie de requête désigne la pratique consistant à créer et à optimiser des invites d’entrée en sélectionnant les mots, les expressions, les phrases, les signes de ponctuation et les caractères de séparation appropriés, afin d’utiliser efficacement les LLM pour une grande variété d’applications. En d'autres termes, l'ingénierie rapide est l'art de communiquer avec un LLM. High-quality les invites conditionnent le LLM pour générer les réponses souhaitées ou meilleures. Les consignes détaillées fournies dans ce document sont applicables à tous les LLM dans Amazon Bedrock.

L’approche d’ingénierie de requête la plus efficace pour votre cas d’utilisation dépend à la fois de la tâche et des données. Voici les tâches courantes prises en charge par les LLM dans Amazon Bedrock :

Classification : l’invite inclut une question avec plusieurs choix de réponse possibles, et le modèle doit répondre avec le choix approprié. L’analyse du sentiment est un exemple de cas d’utilisation de la classification : l’entrée est un passage de texte, et le modèle doit classer le sentiment du texte (positif ou négatif, inoffensif ou toxique, par exemple).
Question-answer, sans contexte : le modèle doit répondre à la question avec ses connaissances internes, sans contexte ni document.
Question-answer, avec contexte : l'utilisateur fournit un texte d'entrée avec une question, et le modèle doit répondre à la question en fonction des informations fournies dans le texte d'entrée.
Résumé : l’invite est un passage de texte, et le modèle doit répondre par un passage plus court qui capture les points principaux de l’entrée.
Open-ended génération de texte : Lorsqu'une invite est envoyée, le modèle doit répondre par un passage de texte original correspondant à la description. Cela comprend également la génération de textes créatifs tels que des histoires, des poèmes ou des scénarios de films.
Génération de code : le modèle doit générer du code en fonction des spécifications de l’utilisateur. Par exemple, une invite peut demander la génération de code Python ou texte en SQL.
Mathématiques : l’entrée décrit un problème qui nécessite un raisonnement mathématique à un certain niveau, qui peut être numérique, logique, géométrique ou autre.
Raisonnement ou pensée logique : le modèle doit faire une série de déductions logiques.
Extraction d’entités : l’extraction d’entités peut extraire des entités en fonction d’une question d’entrée fournie. Vous pouvez extraire des entités spécifiques du texte ou de l’entrée en fonction de votre invite.
Chain-of-thought raisonnement : expliquez étape par étape comment une réponse est dérivée en fonction de votre invite.

Avertissement JavaScript est désactivé ou n'est pas disponible dans votre navigateur.

Pour que vous puissiez utiliser la documentation AWS, Javascript doit être activé. Vous trouverez des instructions sur les pages d'aide de votre navigateur.

Conventions de rédaction

Concepts d’ingénierie de requête

Routage intelligent des invites