Detección del habla tóxica

La detección del habla tóxica está diseñada para ayudar a moderar las plataformas de redes sociales que implican el diálogo entre pares, como los juegos en línea y las plataformas de chat social. El uso de habla tóxica puede ser muy perjudicial para las personas, los grupos de pares y las comunidades. Detectar el lenguaje dañino ayuda a las organizaciones a mantener conversaciones civilizadas y a mantener un entorno en línea seguro e inclusivo para que los usuarios puedan crear, compartir y participar libremente.

Amazon Transcribe Toxicity Detection aprovecha las señales de audio y texto para identificar y clasificar el contenido tóxico basado en la voz en siete categorías, que incluyen acoso sexual, incitación al odio, amenaza, abuso, blasfemia, insulto y gráfico. Además del texto, la detección de toxicidad de Amazon Transcribe utiliza señales del habla, como los tonos y la entonación, para centrarse en la intención tóxica del discurso. Esto supone una mejora con respecto a los sistemas de moderación de contenido estándar, que están diseñados para centrarse únicamente en términos específicos, sin tener en cuenta la intención.

Amazon Transcribe identifica y clasifica las expresiones tóxicas, lo que minimiza el volumen de datos que deben procesarse manualmente. Esto permite a los moderadores de contenido gestionar el discurso en sus plataformas de forma rápida y eficiente.

Las categorías de habla tóxica incluyen:

Blasfemia: discurso que contiene palabras, frases o acrónimos que son de mala educación, vulgares u ofensivos.
Incitación al odio: discurso que critica, insulta, denuncia o deshumaniza a una persona o grupo por su identidad, ya sea de raza, etnia, género, religión, orientación sexual, capacidad y origen nacional.
Sexual: discurso que indica interés, actividad o excitación sexual mediante referencias directas o indirectas a partes del cuerpo o rasgos físicos o al sexo.
Insultos: discurso que incluye lenguaje degradante, humillante, burlón, insultante o denigrante. Este tipo de lenguaje también se denomina intimidación.
Violencia o amenaza: discurso que incluye amenazas que tienen por objeto infligir dolor, lesión u hostilidad a una persona o grupo.
Gráfico: discurso que utiliza imágenes visualmente descriptivas, detalladas y desagradablemente vívidas. Este tipo de lenguaje suele ser intencionalmente detallado para aumentar la incomodidad del destinatario.
Acoso o abuso: discurso destinado a afectar al bienestar psicológico del destinatario, incluidos términos degradantes y deshumanizantes. Este tipo de lenguaje también se denomina acoso.

La detección de toxicidad analiza los segmentos del habla (el habla entre pausas naturales) y asigna puntuaciones de confianza a estos segmentos. Las puntuaciones de confianza son valores entre 0 y 1. Una puntuación de confianza más alta indica una mayor probabilidad de que el contenido sea de habla tóxica dentro de la categoría asociada. Puede utilizar estas puntuaciones de confianza para establecer el umbral de detección de toxicidad adecuado para su caso de uso.

nota

La detección de toxicidad sólo está disponible para las transcripciones por lotes en inglés estadounidense (en-US).

Vea el resultado de un ejemplo en formato JSON.

Aviso JavaScript está desactivado o no está disponible en su navegador.

Para utilizar la documentación de AWS, debe estar habilitado JavaScript. Para obtener más información, consulte las páginas de ayuda de su navegador.

Convenciones del documento

Uso de filtros de vocabulario personalizados

Uso de la detección del habla tóxica