So konfigurieren Sie Inhaltsfilter für Integritätsschutz für Amazon Bedrock - Amazon Bedrock

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

So konfigurieren Sie Inhaltsfilter für Integritätsschutz für Amazon Bedrock

Mit Integritätsschutz für Amazon Bedrock können Sie Inhaltsfilter so konfigurieren, dass Modell-Prompts und Antworten in natürlicher Sprache für Text und Bilder mit schädlichen Inhalten blockiert werden. Beispielsweise kann eine E-Commerce-Website ihren Online-Assistenten so gestalten, dass keine unpassende Sprache und/oder Bilder verwendet werden.

So filtern Sie die Klassifizierungs- und Blockierungsstufen

Die Filterung erfolgt auf Grundlage der Vertrauensklassifizierung von Benutzereingaben und FM-Antworten in allen sechs Kategorien. Alle Benutzereingaben und FM-Antworten werden nach vier Stärkestufen klassifiziert: NONE, LOW, MEDIUM und HIGH. Wenn eine Aussage beispielsweise mit einem Vertrauenswert von HIGH als Hass eingestuft wird, ist die Wahrscheinlichkeit hoch, dass diese Aussage entsprechende Inhalte enthält. Eine einzelne Aussage kann in mehrere Kategorien mit unterschiedlichen Vertrauenswerten eingestuft werden. Beispielsweise kann eine einzelne Aussage mit dem Vertrauenswert HIGH als Hass, mit einem Vertrauenswert von LOW als beleidigend, mit einem Vertrauenswert von NONE als Sexualität und einem Wert von MEDIUM als Gewalt eingestuft werden.

Filterstärke

Sie können die Filterstärke für jede einzelne Inhaltsfilterkategorie konfigurieren. Die Filterstärke bestimmt, mit welcher Empfindlichkeit schädliche Inhalte gefiltert werden sollen. Mit zunehmender Filterstärke steigt die Wahrscheinlichkeit, dass schädliche Inhalte gefiltert werden, und die Wahrscheinlichkeit sinkt, dass schädliche Inhalte in Ihrer Anwendung angezeigt werden.

Es stehen vier Filterstärkestufen zur Verfügung

  • Keine – Es werden keine Inhaltsfilter angewendet. Alle Benutzereingaben als auch die vom Basismodell generierten Ausgaben sind zulässig.

  • Niedrig – Die Filterstärke ist gering. Inhalte, die mit dem Konfidenzniveau HIGH als schädlich eingestuft wurden, werden herausgefiltert. Inhalte, die mit dem Konfidenzniveau NONE, LOW oder MEDIUM als schädlich eingestuft wurden, werden zugelassen.

  • Mittel – Inhalte, die mit dem Konfidenzniveau HIGH und MEDIUM als schädlich eingestuft wurden, werden herausgefiltert. Inhalte, die mit dem Konfidenzniveau NONE oder LOW als schädlich eingestuft wurden, werden zugelassen.

  • Hoch – Dies ist die strengste Filterkonfiguration. Inhalte, die mit dem Konfidenzniveau HIGH, MEDIUM und LOW als schädlich eingestuft wurden, werden herausgefiltert. Als harmlos eingestufte Inhalte werden zugelassen.

Filterstärke Konfidenzniveau blockierter Inhalte Konfidenzniveau zulässiger Inhalte
Keine Keine Filterung Keine, Niedrig, Mittel und Hoch
Niedrig Hoch Keine, Niedrig, Mittel
Mittel Hoch, Mittel Keine, Niedrig
Hoch Hoch, Mittel, Niedrig Keine