Que sont les contrôles de raisonnement automatisés dans Amazon Bedrock Guardrails ? - Amazon Bedrock

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Que sont les contrôles de raisonnement automatisés dans Amazon Bedrock Guardrails ?

À quoi servent les contrôles de raisonnement automatisés

L'un des principaux défis des grands modèles linguistiques (LLMs) est de garantir l'exactitude de leurs réponses. Sans validation, cela LLMs peut produire des hallucinations ou des informations inexactes qui minent la confiance. Les contrôles de raisonnement automatisés dans Amazon Bedrock Guardrails aident à résoudre ce problème en utilisant des techniques mathématiques pour valider le contenu en langage naturel par rapport aux politiques que vous définissez.

Contrairement aux composants de garde-corps traditionnels qui bloquent ou filtrent le contenu en fonction de la correspondance de modèles, les contrôles de raisonnement automatisés utilisent une logique formelle pour fournir des informations structurées expliquant pourquoi une réponse est correcte ou incorrecte. Ces commentaires peuvent être utilisés pour orienter un LLM vers la génération de contenu dont il est prouvé qu'il est conforme à votre politique. Plus précisément, les contrôles de raisonnement automatisés peuvent :

  • Détectez les déclarations factuelles incorrectes dans les réponses LLM en prouvant mathématiquement que le contenu généré contredit vos règles de politique.

  • Soulignez les hypothèses non énoncées dans lesquelles une réponse est conforme à votre politique mais ne répond pas à toutes les règles pertinentes, indiquant ainsi que la réponse peut être incomplète.

  • Fournissez des explications mathématiquement vérifiables expliquant pourquoi les déclarations exactes sont correctes, en citant les règles de politique spécifiques et les assignations de variables qui étayent la conclusion.

Ces fonctionnalités différencient les contrôles de raisonnement automatisés des autres composants d'Amazon Bedrock Guardrails. Les filtres de contenu et les politiques thématiques agissent comme des barrières binaires : ils bloquent ou autorisent le contenu. Les contrôles de raisonnement automatisés agissent comme une couche de vérification qui fournit des informations détaillées et exploitables que vous pouvez utiliser pour améliorer les réponses de manière programmatique.

Quand utiliser les contrôles de raisonnement automatisés

Les contrôles de raisonnement automatisés sont particulièrement utiles lorsque vous devez démontrer le fondement factuel de la réponse d'un LLM. Envisagez de les utiliser lorsque votre application implique :

  • Les secteurs réglementés tels que les soins de santé, les ressources humaines et les services financiers, où des informations incorrectes peuvent avoir des conséquences juridiques ou de conformité.

  • Des ensembles de règles complexes tels que les approbations de prêts hypothécaires, les lois de zonage, l'éligibilité aux assurances ou les avantages sociaux, dans lesquels plusieurs conditions interagissent pour déterminer un résultat.

  • Scénarios de conformité qui nécessitent des réponses d'IA auditables avec des preuves mathématiquement vérifiables que la réponse est conforme à vos politiques.

  • Applications destinées aux clients dans lesquelles des conseils incorrects peuvent saper la confiance, telles que les chatbots qui répondent aux questions sur les politiques de l'entreprise, l'éligibilité des produits ou les conditions de service.

Ce que les contrôles de raisonnement automatisés ne font pas

Pour définir les bonnes attentes, tenez compte des limites suivantes :

  • Aucune protection contre l'injection rapide. Les contrôles de raisonnement automatisés valident exactement ce que vous leur envoyez. Si un contenu malveillant ou manipulé est fourni en entrée, la validation est effectuée sur ce contenu tel quel. Pour détecter et bloquer les attaques par injection d’invite, utilisez des filtres de contenu en combinaison avec les vérifications du raisonnement automatisé.

  • Aucune détection hors sujet. Automated Reasoning analyse uniquement le texte pertinent par rapport à la politique. Il ignore le contenu non lié et ne peut pas vous dire si une réponse est hors sujet. Pour détecter les réponses hors sujet, utilisez des politiques thématiques.

  • Aucune prise en charge du streaming. Les contrôles de raisonnement automatisés ne prennent pas en charge le streaming APIs. Vous devez valider les réponses complètes.

  • En anglais uniquement. Les contrôles de raisonnement automatisés ne sont actuellement disponibles qu'en anglais (États-Unis).

  • Le champ d'application est limité à votre police d'assurance. Un VALID résultat garantit la validité uniquement pour les parties de l'entrée capturées par le biais de variables de politique. Les déclarations qui n'entrent pas dans le champ des variables de votre politique ne sont pas validées. Par exemple, « Je peux soumettre mes devoirs en retard parce que j'ai une fausse note du médecin » peut être considérée comme valide si la politique ne contient aucune variable permettant de déterminer si la note du médecin est fausse.

Les contrôles de raisonnement automatisés complètent les autres fonctionnalités d'Amazon Bedrock Guardrails, telles que les filtres de contenu et les politiques thématiques. Pour une protection optimale, utilisez-les ensemble. Pour plus d’informations, consultez Composants des barrières de protection.

End-to-end aperçu du flux de travail

L'utilisation des contrôles de raisonnement automatisés comporte quatre phases : créer une politique, la tester, la déployer dans un garde-corps et l'intégrer dans votre application.

Source Document ──► Extracted Policy ──► Testing ──► Deployment ──► Integration (rules) (formal logic) (verify) (guardrail) (validate responses and act on feedback)
  1. Créez une politique. Téléchargez un document source contenant les règles que vous souhaitez appliquer. Le raisonnement automatisé extrait des règles logiques formelles et un schéma de variables de votre document. Un rapport de fidélité est automatiquement généré pour mesurer la précision avec laquelle la politique extraite représente vos documents sources, avec des scores de couverture et de précision et des fondements détaillés qui relient chaque règle et variable aux déclarations spécifiques de votre contenu source. Passez en revue la politique extraite et le rapport de fidélité pour vous assurer que la politique reflète correctement vos règles. Pour de plus amples informations, veuillez consulter Création de votre politique de raisonnement automatisé.

  2. Testez et affinez. Les tests permettent de s'assurer que votre politique peut valider avec précision le contenu généré, même lorsque vous apportez des modifications à la politique elle-même. Créez des tests qui imitent les questions que vos utilisateurs poseront et les réponses que votre LLM pourrait générer. Les contrôles de raisonnement automatisés utilisent des modèles fondamentaux pour traduire le langage naturel en logique. Utilisez des scénarios générés pour valider l'exactitude des règles et des tests QnA pour valider la précision de la traduction du langage naturel en logique. Affinez votre politique en fonction des résultats des tests. Pour de plus amples informations, veuillez consulter Test d’une politique de raisonnement automatisé.

  3. Déployez. Enregistrez une version immuable de votre politique testée et attachez-la à un garde-corps. Vous pouvez automatiser le déploiement à l'aide de CloudFormation pipelines CI/CD. Pour de plus amples informations, veuillez consulter Déploiement de votre politique de raisonnement automatisé dans votre application.

  4. Intégrer. Au moment de l'exécution, les résultats du raisonnement automatisé sont renvoyés via APIs une configuration Amazon Bedrock Guardrails :Converse, InvokeModelInvokeAgent, etRetrieveAndGenerate, ainsi que l'API autonome. ApplyGuardrail Examinez les résultats pour décider s'il convient de fournir la réponse, de la réécrire en fonction des commentaires ou de demander des éclaircissements à l'utilisateur. Les contrôles de raisonnement automatisés fonctionnent uniquement en mode détection : ils renvoient des résultats et des commentaires au lieu de bloquer le contenu. Pour plus d'informations sur la façon d'intégrer les contrôles de raisonnement automatisés dans votre application, consultezIntégrez des contrôles de raisonnement automatisés dans votre application. Pour plus d'informations sur les autorisations requises pour activer les contrôles de raisonnement automatisés, consultezAutorisations pour les politiques de raisonnement automatisé avec ApplyGuardrail.

Disponibilité et support linguistique

Les contrôles de raisonnement automatisés dans Amazon Bedrock Guardrails sont généralement disponibles dans les régions suivantes :

  • USA Est (Virginie du Nord)

  • USA Ouest (Oregon)

  • USA Est (Ohio)

  • UE (Francfort)

  • UE (Paris)

  • UE (Irlande)

Les contrôles de raisonnement automatisés ne sont actuellement disponibles qu'en anglais (États-Unis).

Limites et considérations

Avant de mettre en œuvre des contrôles de raisonnement automatisés, soyez conscient des limites techniques suivantes :

  • Complexité du document. Les documents sources doivent être bien structurés avec des règles claires et sans ambiguïté. Les documents très complexes comportant des conditions imbriquées ou des instructions contradictoires peuvent ne pas être correctement extraits dans la logique formelle. La taille des documents d'entrée est limitée à 5 Mo et 50 000 caractères. Vous pouvez diviser des documents plus volumineux et fusionner chaque section dans votre politique. Les images et les tableaux contenus dans les documents ont également un impact sur le nombre de caractères de saisie.

  • Temps de traitement Automated Reasoning vérifie que la validation ajoute de la latence aux réponses de votre application. Prévoyez un délai de traitement supplémentaire, en particulier pour les politiques complexes comportant de nombreuses variables. Le nombre de variables d'une politique contribue directement à l'augmentation de la latence de validation.

  • Champ d'application de la politique Pour créer des politiques plus faciles à gérer, chaque politique doit se concentrer sur un domaine spécifique (par exemple, les ressources humaines, les finances, le droit) plutôt que d'essayer de couvrir plusieurs domaines indépendants dans une seule politique.

  • Limites de variables et de règles. Les politiques comportant un nombre excessif de variables ou des interactions entre règles trop complexes peuvent atteindre les limites de traitement ou renvoyer des résultats TOO_COMPLEX. Consultez la documentation relative aux limites d'Amazon Bedrock et. Référence des résultats de validation

  • Dépendance au langage naturel. La précision de la validation dépend de la capacité du langage naturel des instructions des utilisateurs et des réponses du modèle à être traduit en variables logiques formelles de votre politique. Les contrôles de raisonnement automatisés utilisent des modèles fondamentaux pour traduire le langage naturel en représentations logiques. Les descriptions variables influencent la qualité de cette traduction.

  • Arithmétique non linéaire. Les contrôles de raisonnement automatisés peuvent expirer ou renvoyer TOO_COMPLEX si les contraintes impliquent un raisonnement arithmétique non linéaire (par exemple, des nombres irrationnels ou des exposants).

Tarification

Les vérifications du raisonnement automatisé dans les barrières de protection Amazon Bedrock sont facturées en fonction du nombre de demandes de validation traitées. Pour obtenir des informations sur la tarification actuelle, consultez la page Tarification Amazon Bedrock.

Des frais sont facturés pour chaque demande de validation, quel que soit le résultat (par exemple, VALID, INVALID, TRANSLATION_AMBIGUOUS). Afin d’optimiser les coûts :

  • Utilisez des seuils de confiance appropriés pour trouver un équilibre entre la précision et les exigences de traitement.

  • Envisagez de mettre en cache les résultats de validation pour des requêtes identiques ou similaires lorsque cela est approprié pour votre cas d'utilisation.

  • Surveillez les modèles d'utilisation et ajustez les politiques afin de réduire les demandes de validation inutiles.

Inférence entre régions pour les opérations de la stratégie

Le raisonnement automatisé utilise l’inférence entre régions pour optimiser les performances et la disponibilité des opérations de création et de test de la stratégie. Des opérations d’API spécifiques répartissent automatiquement le traitement entre les régions AWS situées à l’intérieur de votre zone géographique afin de garantir une prestation de services fiable.

Les opérations d’API de raisonnement automatisé suivantes utilisent l’inférence entre régions :

  • StartAutomatedReasoningPolicyBuildWorkflow— Invoqué lors de la création et de la compilation des politiques à partir de documents sources.

  • StartAutomatedReasoningPolicyTestWorkflow— Invoqué lors des procédures de validation et de test des politiques.

Ces opérations invoquent de grands modèles de langage pour extraire des règles logiques formelles des documents sources et traduire les constructions de langage naturel en représentations logiques structurées. Pour garantir des performances et une disponibilité optimales, le traitement des demandes est réparti selon le routage géographique suivant :

  • Régions des États-Unis : les demandes d’API provenant de USA Est (Virginie du Nord), USA Ouest (Oregon) ou USA Est (Ohio) peuvent être traitées dans n’importe quelle région des États-Unis prise en charge.

  • Régions de l’Union européenne : les demandes d’API provenant de UE (Francfort), UE (Paris) ou UE (Irlande) peuvent être traitées dans n’importe quelle région de l’UE prise en charge.

Important

Les données des clients restent dans la limite géographique d’origine (États-Unis ou Union européenne) et sont traitées conformément aux engagements d’AWS en matière de résidence des données. L’inférence entre régions achemine les demandes exclusivement au sein de la même région géographique afin d’optimiser les performances et la disponibilité des services.

L’inférence entre régions fonctionne de manière transparente sans nécessiter de configuration client. Les fonctionnalités de l’API restent cohérentes quelle que soit la région spécifique qui traite la demande.