So filtern Sie die Klassifizierungs- und Blockierungsstufen Filterstärke

So konfigurieren Sie Inhaltsfilter für Integritätsschutz für Amazon Bedrock

Mit Integritätsschutz für Amazon Bedrock können Sie Inhaltsfilter so konfigurieren, dass Modell-Prompts und Antworten in natürlicher Sprache für Text und Bilder mit schädlichen Inhalten blockiert werden. Beispielsweise kann eine E-Commerce-Website ihren Online-Assistenten so gestalten, dass keine unpassende Sprache und/oder Bilder verwendet werden.

So filtern Sie die Klassifizierungs- und Blockierungsstufen

Die Filterung erfolgt auf Grundlage der Vertrauensklassifizierung von Benutzereingaben und FM-Antworten in allen sechs Kategorien. Alle Benutzereingaben und FM-Antworten werden nach vier Stärkestufen klassifiziert: NONE, LOW, MEDIUM und HIGH. Wenn eine Aussage beispielsweise mit einem Vertrauenswert von HIGH als Hass eingestuft wird, ist die Wahrscheinlichkeit hoch, dass diese Aussage entsprechende Inhalte enthält. Eine einzelne Aussage kann in mehrere Kategorien mit unterschiedlichen Vertrauenswerten eingestuft werden. Beispielsweise kann eine einzelne Aussage mit dem Vertrauenswert HIGH als Hass, mit einem Vertrauenswert von LOW als beleidigend, mit einem Vertrauenswert von NONE als Sexualität und einem Wert von MEDIUM als Gewalt eingestuft werden.

Filterstärke

Sie können die Filterstärke für jede einzelne Inhaltsfilterkategorie konfigurieren. Die Filterstärke bestimmt, mit welcher Empfindlichkeit schädliche Inhalte gefiltert werden sollen. Mit zunehmender Filterstärke steigt die Wahrscheinlichkeit, dass schädliche Inhalte gefiltert werden, und die Wahrscheinlichkeit sinkt, dass schädliche Inhalte in Ihrer Anwendung angezeigt werden.

Es stehen vier Filterstärkestufen zur Verfügung

Keine – Es werden keine Inhaltsfilter angewendet. Alle Benutzereingaben und FM-generated -ausgaben sind zulässig.
Niedrig – Die Filterstärke ist gering. Inhalte, die mit dem Konfidenzniveau HIGH als schädlich eingestuft wurden, werden herausgefiltert. Inhalte, die mit dem Konfidenzniveau NONE, LOW oder MEDIUM als schädlich eingestuft wurden, werden zugelassen.
Mittel – Inhalte, die mit dem Konfidenzniveau HIGH und MEDIUM als schädlich eingestuft wurden, werden herausgefiltert. Inhalte, die mit dem Konfidenzniveau NONE oder LOW als schädlich eingestuft wurden, werden zugelassen.
Hoch – Dies ist die strengste Filterkonfiguration. Inhalte, die mit dem Konfidenzniveau HIGH, MEDIUM und LOW als schädlich eingestuft wurden, werden herausgefiltert. Als harmlos eingestufte Inhalte werden zugelassen.

Filterstärke	Konfidenzniveau blockierter Inhalte	Konfidenzniveau zulässiger Inhalte
Keine	Keine Filterung	Keine, Niedrig, Mittel und Hoch
Niedrig	Hoch	Keine, Niedrig, Mittel
Mittel	Hoch, Mittel	Keine, Niedrig
Hoch	Hoch, Mittel, Niedrig	Keine

Warnung JavaScript ist in Ihrem Browser nicht verfügbar oder deaktiviert.

Zur Nutzung der AWS-Dokumentation muss JavaScript aktiviert sein. Weitere Informationen finden auf den Hilfe-Seiten Ihres Browsers.

Dokumentkonventionen

So erstellen Sie Ihren Integritätsschutz

Inhaltsfilter (Text)