本文為英文版的機器翻譯版本，如內容有任何歧義或不一致之處，概以英文版為準。

# 偵測有毒語音
<a name="toxicity"></a>

 有毒語音偵測目的是幫助管理點對點對話的社群媒體平台，例如線上遊戲和社群聊天平台。使用有毒的言語可能會嚴重不利於個人、同儕團體和社群。標記有害語言可以幫助組織維持對話和平，並維護安全和包容的線上環境，讓使用者可以自由創作、共享和參與。

 Amazon Transcribe 毒性偵測利用音訊和文字提示來識別和分類七個類別的語音型有毒內容，包括性騷擾、仇恨語音、威脅、濫用、褻瀆、侮辱和圖形。除了文字之外， Amazon Transcribe 有毒內容偵測還使用語音提示，例如音調和音高，模擬磨練語音中的有毒內容意圖。這是標準內容審核系統的改良版，該系統旨在僅關注特定術語，而無需考量意圖。

 Amazon Transcribe 會標記和分類有毒語音，將必須手動處理的資料量降至最低。讓內容管理員可以快速有效管理平台上的語言環境。

有毒的語言類別包括：
+ **褻瀆**：包含不禮貌、粗俗或冒犯性的單字、片語或縮寫的語言。
+ **仇恨言論**：因身份 (例如種族、民族、性別、宗教、性取向、能力和國籍) 而批評、侮辱、譴責或做出非人性化的言論。
+ **性暗示**：使用直接或間接引用身體部位、身體特徵或性別，表現出性興趣、活動或激起性欲的語言。
+ **侮辱**：包括貶低、羞辱、嘲笑、侮辱或貶低的言語。種類型的語言也被標記為霸凌。
+ **暴力或威脅**：包括試圖對個人或團體造成痛苦、傷害或敵意的威脅性言論。
+ **圖形**：使用視覺描述和令人不愉快的生動圖像式的語言。這種類型的語言通常故意拖長，以延長收件人的不適感。
+ **騷擾或辱罵**：目的式影響收件人心理健康的言論，包括貶低和客觀性的術語。這種語言也被標記為騷擾。

 有毒內容偵測會分析語音區段 (自然暫停間的語音)，並指定可信度分數給這些區段。可信度分數是介於 0 和 1 之間的值。可信度分數較高表示內容在相關類別中是有毒語音的可能性越高。您可以使用這些可信度分數，針對您的使用案例，設定適當的有毒內容偵測閾值。

**注意**  
 有毒內容偵測僅適用於美國英文 `(en-US)` 的批次轉錄。

 檢視 JSON 格式的[範例輸出](toxicity-using.md#toxicity-using-output.title)。