Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.
Detección del habla tóxica
La detección del habla tóxica está diseñada para ayudar a moderar las plataformas de redes sociales que implican el diálogo entre pares, como los juegos en línea y las plataformas de chat social. El uso de habla tóxica puede ser muy perjudicial para las personas, los grupos de pares y las comunidades. Detectar el lenguaje dañino ayuda a las organizaciones a mantener conversaciones civilizadas y a mantener un entorno en línea seguro e inclusivo para que los usuarios puedan crear, compartir y participar libremente.
Amazon Transcribe Toxicity Detection aprovecha las señales de audio y texto para identificar y clasificar el contenido tóxico basado en la voz en siete categorías, que incluyen acoso sexual, incitación al odio, amenaza, abuso, blasfemia, insulto y gráfico. Además del texto, la detección de toxicidad de Amazon Transcribe utiliza señales del habla, como los tonos y la entonación, para centrarse en la intención tóxica del discurso. Esto supone una mejora con respecto a los sistemas de moderación de contenido estándar, que están diseñados para centrarse únicamente en términos específicos, sin tener en cuenta la intención.
Amazon Transcribe identifica y clasifica las expresiones tóxicas, lo que minimiza el volumen de datos que deben procesarse manualmente. Esto permite a los moderadores de contenido gestionar el discurso en sus plataformas de forma rápida y eficiente.
Las categorías de habla tóxica incluyen:
-
Blasfemia: discurso que contiene palabras, frases o acrónimos que son de mala educación, vulgares u ofensivos.
-
Incitación al odio: discurso que critica, insulta, denuncia o deshumaniza a una persona o grupo por su identidad, ya sea de raza, etnia, género, religión, orientación sexual, capacidad y origen nacional.
-
Sexual: discurso que indica interés, actividad o excitación sexual mediante referencias directas o indirectas a partes del cuerpo o rasgos físicos o al sexo.
-
Insultos: discurso que incluye lenguaje degradante, humillante, burlón, insultante o denigrante. Este tipo de lenguaje también se denomina intimidación.
-
Violencia o amenaza: discurso que incluye amenazas que tienen por objeto infligir dolor, lesión u hostilidad a una persona o grupo.
-
Gráfico: discurso que utiliza imágenes visualmente descriptivas, detalladas y desagradablemente vívidas. Este tipo de lenguaje suele ser intencionalmente detallado para aumentar la incomodidad del destinatario.
-
Acoso o abuso: discurso destinado a afectar al bienestar psicológico del destinatario, incluidos términos degradantes y deshumanizantes. Este tipo de lenguaje también se denomina acoso.
La detección de toxicidad analiza los segmentos del habla (el habla entre pausas naturales) y asigna puntuaciones de confianza a estos segmentos. Las puntuaciones de confianza son valores entre 0 y 1. Una puntuación de confianza más alta indica una mayor probabilidad de que el contenido sea de habla tóxica dentro de la categoría asociada. Puede utilizar estas puntuaciones de confianza para establecer el umbral de detección de toxicidad adecuado para su caso de uso.
nota
La detección de toxicidad sólo está disponible para las transcripciones por lotes en inglés estadounidense (en-US).
Vea el resultado de un ejemplo en formato JSON.