유해 언어 감지

유해 언어 감지는 P2P 대화가 필요한 소셜 미디어 플랫폼(예: 온라인 게임 플랫폼, 소셜 채팅 플랫폼)을 조정하는 데 도움이 되도록 고안되었습니다. 유해 언어의 사용은 개인, 동료 집단 및 커뮤니티에 심각한 해를 끼칠 수 있습니다. 유해한 언어에 플래그를 지정하면 조직에서 교양 있게 대화하고 사용자가 자유롭게 만들고 공유하고 참여할 수 있는 안전하고 포용적인 온라인 환경을 유지할 수 있습니다.

Amazon Transcribe 유해성 감지는 오디오 및 텍스트 기반 신호를 모두 활용하여 성적 괴롭힘, 증오 발언, 위협, 폭력, 비속어, 모욕, 그래픽 등 7가지 범주에서 음성 기반 유해 콘텐츠를 식별하고 분류합니다. Amazon Transcribe 유해성 감지는 텍스트 외에도 어조 및 음높이와 같은 음성 신호를 사용하여 말의 유해한 의도를 찾아냅니다. 이는 의도를 고려하지 않고 특정 용어에만 집중하도록 설계된 표준 콘텐츠 조정 시스템을 개선한 것입니다.

Amazon Transcribe 는 유해 음성에 플래그를 지정하고 분류하여 수동으로 처리해야 하는 데이터의 양을 최소화합니다. 이를 통해 콘텐츠 중재자는 플랫폼에서 담화를 빠르고 효율적으로 관리할 수 있습니다.

유해 언어 범주에는 다음이 포함됩니다.

욕설: 무례하거나 저속하거나 불쾌감을 주는 단어, 문구 또는 두문자어가 포함된 말.
혐오 표현: 정체성(예: 인종, 민족, 성별, 종교, 성적 취향, 능력, 출신 국가)을 근거로 개인이나 집단을 비판, 모욕, 비인간화하는 말
성적 표현: 신체 부위, 신체적 특징 또는 성별을 직간접적으로 언급하여 성적 관심, 활동 또는 흥분을 나타내는 말
모욕: 비하하거나, 굴욕하거나, 조롱하거나, 모욕하거나, 얕보는 표현이 포함된 말. 이러한 유형의 표현은 괴롭힘(bullying)으로도 분류됩니다.
폭력 또는 위협: 개인이나 집단에 대해 고통, 부상 또는 적대감을 주려는 위협이 포함된 말.
노골적인 표현: 시각적으로 묘사적이고 불쾌할 정도로 생생한 이미지를 사용하는 말 이러한 유형의 표현은 상대방의 불편함을 증폭시키기 위해 일부러 장황하게 말하는 경우가 많습니다.
괴롭힘 또는 학대: 상대방을 비하하고 객관화하는 표현을 포함하여 상대방의 심리적 안녕에 영향을 미치려는 의도를 가진 말 이러한 유형의 표현은 괴롭힘(harassment)으로도 분류됩니다.

유해성 감지는 음성 세그먼트(자연스러운 끊어읽기 사이의 음성)를 분석하고 이러한 세그먼트에 신뢰도 점수를 할당합니다. 신뢰도 점수는 0에서 1 사이의 값입니다. 신뢰도 점수가 높을수록 해당 콘텐츠가 관련 범주에서 유해 언어일 가능성이 커집니다. 이러한 신뢰도 점수를 사용하여 사용 사례에 적합한 유해성 감지 임계값을 설정할 수 있습니다.

참고

유해성 감지는 미국 영어(en-US)로 된 배치 트랜스크립션에서만 사용할 수 있습니다.

JSON 형식의 예시 출력을 볼 수 있습니다.

javascript가 브라우저에서 비활성화되거나 사용이 불가합니다.

AWS 설명서를 사용하려면 Javascript가 활성화되어야 합니다. 지침을 보려면 브라우저의 도움말 페이지를 참조하십시오.

문서 규칙

사용자 지정 어휘 필터 사용

유해 언어 감지 사용