View a markdown version of this page

为 Amazon Bedrock 护栏配置内容筛选条件 - Amazon Bedrock

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

为 Amazon Bedrock 护栏配置内容筛选条件

利用 Amazon Bedrock 护栏,您可以配置内容筛选条件,来阻止在模型的提示和响应中,包含自然语言文本和图像中包含的有害内容。例如,电子商务网站可以设计其在线助手,用于防止使用不恰当的语言和/或图像。

筛选条件分类和阻止级别

筛选是根据用户输入和基础模型响应在六个类别中每一个类别中的置信度分类来完成的。所有用户输入和基础模型响应均按四个强度等级进行分类:NONELOWMEDIUMHIGH。例如,如果某一陈述被归类为置信度为 HIGH 的“仇恨”,则说明该陈述代表仇恨内容的可能性很高。单个陈述可以分为置信度各不相同的多个类别。例如,单个陈述可以归类为仇恨(置信度为 HIGH)、侮辱(置信度为 LOW)、色情(置信度为 NONE)和暴力(置信度为 MEDIUM)。

筛选强度

您可以为每个内容筛选条件类别配置筛选强度。筛选条件强度决定了筛选有害内容的灵敏度。随着筛选强度的提高,筛选掉有害内容的可能性就会增加,在应用程序中看到有害内容的可能性也会降低。

您有四个筛选强度等级

  • – 不应用任何内容筛选条件。允许所有用户输入和基础模型生成的输出。

  • – 筛选强度较低。归类为有害且置信度为 HIGH 的内容将被筛选掉。归类为有害且置信度为 NONELOWMEDIUM 的内容将被筛选掉。

  • – 归类为有害且置信度为 HIGHMEDIUM 的内容将被筛选掉。归类为有害且置信度为 NONELOW 的内容将被允许。

  • – 这表示最严格的筛选配置。归类为有害且置信度为 HIGHMEDIUMLOW 的内容将被筛选掉。被视为无害的内容将被允许。

筛选强度 阻止内容的置信度 允许内容的置信度
“无”筛选 无、低、中、高
无、低、中
中、高 无、低
高、中、低