Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.
Configuration des filtres de contenu pour barrières de protection Amazon Bedrock
Avec les barrières de protection Amazon Bedrock, vous pouvez configurer des filtres de contenu pour bloquer les invites et les réponses du modèle en langage naturel pour le texte et les images contenant du contenu préjudiciable. Par exemple, un site d’e-commerce peut concevoir son assistant en ligne de manière à éviter d’utiliser un langage et/ou des images inappropriés.
Niveaux de classification et de blocage des filtres
Le filtrage est effectué sur la base d’une classification de confiance des entrées utilisateur et des réponses FM dans chacune des six catégories. Toutes les entrées utilisateur et les réponses FM sont classées selon quatre niveaux d’intensité : NONE, LOW, MEDIUM et HIGH. Par exemple, si une déclaration est classée comme haineuse avec une confiance HIGH, il est fort probable que cette déclaration représente un contenu haineux. Une seule déclaration peut être classée dans plusieurs catégories avec différents niveaux de confiance. Par exemple, une seule déclaration peut être classée dans les catégories suivantes : Haine avec confiance HIGH, Insultes avec confiance LOW, Sexuel avec confiance NONE et Violence avec confiance MEDIUM.
Intensité du filtre
Vous pouvez configurer l’intensité des filtres pour chacune des catégories de filtres de contenu. L’intensité du filtre détermine la sensibilité du filtrage des contenus préjudiciables. À mesure que l’intensité du filtre augmente, la probabilité de filtrer le contenu préjudiciable augmente et la probabilité de voir du contenu préjudiciable dans votre application diminue.
Vous disposez de quatre niveaux d’intensité du filtre
-
Aucune : aucun filtre de contenu n’est appliqué. Toutes les entrées utilisateur et les sorties générées par le modèle de fondation sont autorisées.
-
Faible : l’intensité du filtre est faible. Le contenu classé comme préjudiciable avec confiance
HIGHsera filtré. Le contenu classé comme préjudiciable avec confianceNONE,LOWouMEDIUMsera autorisé. -
Moyenne : le contenu classé comme préjudiciable avec confiance
HIGHetMEDIUMsera filtré. Le contenu classé comme préjudiciable avec confianceNONEouLOWsera autorisé. -
Élevée : il s’agit de la configuration de filtrage la plus stricte. Le contenu classé comme préjudiciable avec confiance
HIGH,MEDIUMetLOWsera filtré. Le contenu jugé inoffensif sera autorisé.
| Intensité du filtre | Confiance du contenu bloqué | Confiance du contenu autorisée |
|---|---|---|
| Aucune | Pas de filtrage | Aucune, faible, moyenne, élevée |
| Faible | Élevée | Aucune, faible, moyenne |
| Moyenne | Moyenne, élevée | Aucune, faible |
| Élevée | Élevée, moyenne, faible | Aucune |