

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

# So konfigurieren Sie Inhaltsfilter für Integritätsschutz für Amazon Bedrock
<a name="guardrails-content-filters-overview"></a>

Mit Integritätsschutz für Amazon Bedrock können Sie Inhaltsfilter so konfigurieren, dass Modell-Prompts und Antworten in natürlicher Sprache für Text und Bilder mit schädlichen Inhalten blockiert werden. Beispielsweise kann eine E-Commerce-Website ihren Online-Assistenten so gestalten, dass keine unpassende Sprache und/oder Bilder verwendet werden.

## So filtern Sie die Klassifizierungs- und Blockierungsstufen
<a name="guardrails-filters-classification"></a>

Die Filterung erfolgt auf Grundlage der Vertrauensklassifizierung von Benutzereingaben und FM-Antworten in allen sechs Kategorien. Alle Benutzereingaben und FM-Antworten werden nach vier Stärkestufen klassifiziert: `NONE`, `LOW`, `MEDIUM` und `HIGH`. Wenn eine Aussage beispielsweise mit einem Vertrauenswert von `HIGH` als Hass eingestuft wird, ist die Wahrscheinlichkeit hoch, dass diese Aussage entsprechende Inhalte enthält. Eine einzelne Aussage kann in mehrere Kategorien mit unterschiedlichen Vertrauenswerten eingestuft werden. Beispielsweise kann eine einzelne Aussage mit dem Vertrauenswert `HIGH` als **Hass**, mit einem Vertrauenswert von `LOW` als **beleidigend**, mit einem Vertrauenswert von `NONE` als **Sexualität** und einem Wert von `MEDIUM` als **Gewalt** eingestuft werden.

## Filterstärke
<a name="guardrails-filters-strength"></a>

Sie können die Filterstärke für jede einzelne Inhaltsfilterkategorie konfigurieren. Die Filterstärke bestimmt, mit welcher Empfindlichkeit schädliche Inhalte gefiltert werden sollen. Mit zunehmender Filterstärke steigt die Wahrscheinlichkeit, dass schädliche Inhalte gefiltert werden, und die Wahrscheinlichkeit sinkt, dass schädliche Inhalte in Ihrer Anwendung angezeigt werden.

Es stehen vier Filterstärkestufen zur Verfügung
+ **Keine** – Es werden keine Inhaltsfilter angewendet. Alle Benutzereingaben und FM-generated -ausgaben sind zulässig.
+ **Niedrig** – Die Filterstärke ist gering. Inhalte, die mit dem Konfidenzniveau `HIGH` als schädlich eingestuft wurden, werden herausgefiltert. Inhalte, die mit dem Konfidenzniveau `NONE`, `LOW` oder `MEDIUM` als schädlich eingestuft wurden, werden zugelassen.
+ **Mittel** – Inhalte, die mit dem Konfidenzniveau `HIGH` und `MEDIUM` als schädlich eingestuft wurden, werden herausgefiltert. Inhalte, die mit dem Konfidenzniveau `NONE` oder `LOW` als schädlich eingestuft wurden, werden zugelassen.
+ **Hoch** – Dies ist die strengste Filterkonfiguration. Inhalte, die mit dem Konfidenzniveau `HIGH`, `MEDIUM` und `LOW` als schädlich eingestuft wurden, werden herausgefiltert. Als harmlos eingestufte Inhalte werden zugelassen.


| Filterstärke | Konfidenzniveau blockierter Inhalte | Konfidenzniveau zulässiger Inhalte | 
| --- | --- | --- | 
| Keine | Keine Filterung | Keine, Niedrig, Mittel und Hoch | 
| Niedrig | Hoch | Keine, Niedrig, Mittel | 
| Mittel | Hoch, Mittel | Keine, Niedrig | 
| Hoch | Hoch, Mittel, Niedrig | Keine | 