

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

# Funcionamiento
<a name="how-it-works"></a>

Amazon Comprehend utiliza un modelo previamente entrenado para recopilar **información** sobre un documento o un conjunto de documentos. Este modelo se entrena continuamente con una gran cantidad de texto, por lo que no es necesario que proporcione datos de entrenamiento. 

Puede usar Amazon Comprehend para crear sus propios **modelos personalizados** para la clasificación personalizada y para el reconocimiento de entidades a nivel personalizado. Puede utilizar [Volantes de inercia](flywheels.md) como una ayuda para gestionar los modelos personalizados. 

Amazon Comprehend proporciona el **modelado de temas** mediante un modelo integrado. El modelado de temas examina un corpus de documentos y los organiza en función de las palabras clave similares que contiene.

Amazon Comprehend ofrece **modos de procesamiento de documentos** síncronos y asíncronos. Utilice el modo síncrono para procesar un documento o un lote de hasta 25 documentos. Utilice un trabajo asíncrono para procesar una gran cantidad de documentos.

Amazon Comprehend trabaja con AWS Key Management Service (AWS KMS) para proporcionar un cifrado mejorado de sus datos. Para obtener más información, consulte [Cifrado de KMS en Amazon Comprehend](kms-in-comprehend.md).



**Topics**
+ [Información](concepts-insights.md)
+ [Amazon Comprehend Custom](concepts-custom.md)
+ [Modelado de temas](topic-modeling.md)
+ [Modos de procesamiento de documentos](concepts-processing-modes.md)

# Información
<a name="concepts-insights"></a>

Amazon Comprehend puede analizar un documento o conjunto de documentos para recopilar información sobre estos. Alguna de la información que Amazon Comprehend desarrolla sobre un documento incluye lo siguiente:
+ [Entidades](how-entities.md): Amazon Comprehend devuelve una lista de entidades identificadas en un documento, tales como personas, lugares y ubicaciones. 
+ [Events](how-events.md): Amazon Comprehend detecta tipos específicos de eventos y detalles relacionados. 
+ [Frases clave](how-key-phrases.md): Amazon Comprehend extrae las frases clave que aparecen en un documento. Por ejemplo, un documento sobre un partido de baloncesto puede incluir los nombres de los equipos, el nombre del estadio y el marcador final. 
+ [Información de identificación personal (PII)](pii.md): Amazon Comprehend analiza los documentos para detectar datos personales que identifiquen a una persona, tales como una dirección, un número de cuenta bancaria o un número de teléfono. 
+ [Idioma predominante](how-languages.md): Amazon Comprehend identifica el idioma predominante de un documento. Amazon Comprehend puede identificar 100 idiomas.
+ [Opinión](how-sentiment.md): Amazon Comprehend determina la opinión predominante de un documento. La opinión puede ser positiva, neutra, negativa o mixta. 
+ [Opiniones específicas](how-targeted-sentiment.md): Amazon Comprehend determina la opinión de entidades específicas que se mencionan en un documento. La opinión de cada una de las menciones puede ser positiva, neutra, negativa o mixta. 
+ [Análisis de sintaxis](how-syntax.md): Amazon Comprehend analiza cada palabra del documento y determina la parte del discurso para esa palabra. Por ejemplo, en la oración “Hoy está lloviendo en Seattle”, “hoy” se identifica como un adverbio, “está lloviendo” se identifica como un verbo y “Seattle” se identifica como un nombre propio. 

# Entidades
<a name="how-entities"></a>

Una *entidad* es una referencia textual al nombre exclusivo de un objeto del mundo real como, por ejemplo, las personas, los lugares y los artículos comerciales, así como a referencias precisas a unidades de medida como, por ejemplo, las fechas y las cantidades.

Por ejemplo, en el texto “John se mudó al 1313 de Mockingbird Lane en 2012”, “John” podría identificarse como un `PERSON`, “1313 Mockingbird Lane” podría identificarse como un `LOCATION` y “2012” podría identificarse como un `DATE`.

Cada entidad va acompañada de una puntuación que indica el nivel de confianza que Amazon Comprehend tiene por haber detectado correctamente a ese tipo de entidad. Puede filtrar las entidades con puntuaciones más bajas para reducir el riesgo de utilizar detecciones incorrectas.

En la siguiente tabla se enumeran los tipos de entidades. 


| Tipo | Description (Descripción) | 
| --- | --- | 
|  COMMERCIAL\$1ITEM  | Un producto de marca | 
|  DATE  | Una fecha completa (por ejemplo, 25/11/2017), un día (martes), un mes (mayo) o una hora (8:30 a. m.) | 
|  EVENT  | Un evento, como un festival, un concierto, una elección, etc. | 
|  UBICACIÓN  | Un lugar específico, como un país, una ciudad, un lago, un edificio, etc. | 
|  ORGANIZACIÓN  | Organizaciones grandes, como un gobierno, una empresa, una religión, un equipo deportivo, etc. | 
|  OTHER  | Entidades que no pertenecen a ninguna de las otras categorías. | 
|  INDIVIDUO  | Personas, grupos de personas, apodos, personajes ficticios | 
|  CANTIDAD  | Una cantidad cuantificada, como moneda, porcentajes, números, bytes, etc. | 
|  TITLE  | Un nombre oficial que se da a cualquier creación o trabajo creativo, tales como películas, libros, canciones, etc. | 

Las operaciones de detección de entidades pueden realizarse usando cualquiera de los idiomas principales compatibles con Amazon Comprehend. Esto incluye únicamente la detección predefinida de entidades (no la personalizada). Todos los documentos deben estar en el mismo idioma.

Puede utilizar cualquiera de las siguientes operaciones de API para detectar las entidades de un documento o de un conjunto de documentos.
+ [DetectEntities](https://docs.aws.amazon.com/comprehend/latest/APIReference/API_DetectEntities.html)
+  [BatchDetectEntities](https://docs.aws.amazon.com/comprehend/latest/APIReference/API_BatchDetectEntities.html)
+  [StartEntitiesDetectionJob](https://docs.aws.amazon.com/comprehend/latest/APIReference/API_StartEntitiesDetectionJob.html)

Las operaciones devuelven una lista de objetos [API Entity](https://docs.aws.amazon.com/comprehend/latest/APIReference/API_Entity.html), uno por cada entidad del documento. La operación `BatchDetectEntities` devuelve una lista de objetos `Entity`, una lista para cada documento del lote. La operación `StartEntitiesDetectionJob` inicia una tarea asíncrona que genera un archivo que contiene una lista de objetos `Entity` para cada documento de la tarea.

El siguiente ejemplo es la respuesta de la operación de `DetectEntities`.

```
{
    "Entities": [
        {
            "Text": "today",
            "Score": 0.97,
            "Type": "DATE",
            "BeginOffset": 14,
            "EndOffset": 19
        },
        {
            "Text": "Seattle",
            "Score": 0.95,
            "Type": "LOCATION",
            "BeginOffset": 23,
            "EndOffset": 30
        }
    ],
    "LanguageCode": "en"
}
```

# Events
<a name="how-events"></a>

**nota**  
Las funciones de modelado de temas, detección de eventos y clasificación rápida de seguridad de Amazon Comprehend dejarán de estar disponibles para los nuevos clientes a partir del 30 de abril de 2026. Si desea utilizar estas funciones con cuentas nuevas, hágalo antes de esta fecha. No es necesario realizar ninguna acción en el caso de las cuentas que hayan utilizado estas funciones en los últimos 12 meses. Para obtener más información, consulte [Cambio en la disponibilidad de las funciones de Amazon Comprehend](comprehend-availability-change.md).

Utilice la *detección de eventos* para analizar documentos de texto en busca de tipos específicos de eventos y sus entidades relacionadas. Amazon Comprehend admite la detección de eventos en grandes colecciones de documentos mediante trabajos de análisis asíncronos. Para obtener más información sobre eventos, incluidos ejemplos de trabajos de análisis de eventos, consulte [Anuncio del lanzamiento de Amazon Comprehend Events](https://aws.amazon.com/blogs/machine-learning/announcing-the-launch-of-amazon-comprehend-events/)

## Entidades
<a name="how-events-entities"></a>

Del texto introducido, Amazon Comprehend extrae una lista de entidades relacionadas con el evento detectado. Una *entidad* puede ser un objeto del mundo real, como una persona, un lugar o una ubicación; una entidad también puede ser un concepto, como una medida, una fecha o una cantidad. Cada aparición de una entidad se identifica mediante una *mención*, que es una referencia textual a la entidad en el texto de entrada. Para cada entidad única, todas las menciones se agrupan en una lista. Esta lista proporciona detalles de cada ubicación del texto de entrada en la que se encuentra la entidad. Amazon Comprehend detecta solo las entidades asociadas a los tipos de eventos compatibles.

Cada entidad asociada a un tipo de evento compatible hace una devolución con los siguientes detalles relacionados:
+ **Mentions**: detalles de cada aparición de la misma entidad en el texto de entrada.
  + **BeginOffset**: un desplazamiento de caracteres en el texto de entrada que muestra dónde comienza la mención (el primer carácter está en la posición 0). 
  + **EndOffset**: un desplazamiento de caracteres en el texto de entrada que muestra dónde termina la mención.
  + **Score**: el nivel de confianza que Amazon Comprehend tiene en la precisión del tipo de entidad.
  + **GroupScore**: El nivel de confianza de Amazon Comprehend de que la mención esté correctamente agrupada con otras menciones de la misma entidad.
  + **Text**: el texto de la entidad.
  + **Type**: el tipo de la entidad. Para ver todos los tipos de entidades compatibles, consulte [Tipos de entidad](#events-entity-types).

## Events
<a name="how-events-output"></a>

Amazon Comprehend realiza una devolución con la lista de eventos (de los tipos de eventos compatibles) que detecta en el texto de entrada. Cada evento realiza una devolución con los siguientes detalles relacionados:
+ **Type**: el tipo de evento. Para ver una lista de los tipos de eventos compatibles, consulte [Tipos de eventos](#events-types).
+ **Arguments**: lista de argumentos relacionados con el evento detectado. Un *argumento* consta de una entidad relacionada con el evento detectado. El papel del argumento describe la relación; por ejemplo, *quién* hizo *qué*, *dónde* y *cuándo*.
  + **EntityIndex**: un valor de índice que identifica una entidad de la lista de entidades que Amazon Comprehend devolvió para este análisis.
  + **Role**: el tipo de argumento, que describe cómo se relaciona la entidad de este argumento con el evento. Para ver todos los tipos de argumentos compatibles, consulte [Tipo de argumento](#events-argument-types).
  + **Score**: el nivel de confianza que Amazon Comprehend tiene en la precisión de la detección de roles.
+ **Triggers**: una lista de los desencadenadores del evento detectado. Un *desencadenador* es una sola palabra o frase que indica la ocurrencia del evento.
  + **BeginOffset**: un desplazamiento de caracteres en el texto de entrada que muestra dónde comienza el disparador (el primer carácter está en la posición 0).
  + **EndOffset**: un desplazamiento de caracteres en el texto de entrada que muestra dónde termina el activador.
  + **Score**: el nivel de confianza que Amazon Comprehend tiene en la precisión de la detección.
  + **Text**: el texto del desencadenador.
  + **GroupScore**: El nivel de confianza de Amazon Comprehend en que el desencadenante está agrupado correctamente con otros desencadenantes del mismo evento.
  + **Type**: el tipo de evento que indica este desencadenador.

## Formato de resultados de detección de eventos
<a name="how-events-results"></a>

Cuando finalice su trabajo de detección de eventos, Amazon Comprehend escribirá los resultados del análisis en la ubicación de salida de Amazon S3 que especificó al iniciar el trabajo.

Para cada evento detectado, el resultado proporciona detalles en el siguiente formato:

```
{
   "Entities": [
     {
       "Mentions": [
         {
           "BeginOffset": number,
           "EndOffset": number,
           "Score": number,
           "GroupScore": number,
           "Text": "string",
           "Type": "string"
         }, ...
       ]    
     }, ...
   ],
   "Events": [
     {
       "Type": "string",
       "Arguments": [
         {                   
           "EntityIndex": number,   
           "Role": "string",
           "Score": number
         }, ...
       ],
       "Triggers": [
         {
           "BeginOffset": number,
           "EndOffset": number,
           "Score": number,
           "Text": "string",
           "GroupScore": number,
           "Type": "string"
         }, ...
       ]
     }, ...
   ]
 }
```

## Tipos compatibles para entidades, eventos y argumentos
<a name="events-reference-types"></a>

### Tipos de entidad
<a name="events-entity-types"></a>


| Tipo | Description (Descripción) | 
| --- | --- | 
| FECHA | Cualquier referencia a una fecha u hora, ya sea específica o general. | 
| INSTALACIONES | Edificios, aeropuertos, autopistas, puentes y otras estructuras permanentes hechas por el hombre, así como mejoras inmobiliarias. | 
| UBICACIÓN | Ubicaciones físicas como calles, ciudades, estados, países, masas de agua o coordenadas geográficas. | 
| VALOR\$1MONETARIO | El valor de algo en dólares estadounidenses o en otra divisa. El valor puede ser específico o aproximado. | 
| ORGANIZACIÓN | Empresas y otros grupos de personas definidos por una estructura organizativa establecida. | 
| INDIVIDUO | Los nombres o apodos de personas, o personajes ficticios. | 
| TÍTULO\$1INDIVIDUO | Cualquier título que describa a una persona, que suele ser una categoría laboral (como CEO) u honorífico (como Sr.). | 
| CANTIDAD | Un número o valor y la unidad de medida. | 
| CÓDIGO\$1BURSÁTIL | Un símbolo bursátil, como AMZN, un número de identificación internacional de valores (ISIN), el Comité de Procedimientos Uniformes de Identificación de Valores (CUSIP) o la Lista Oficial Diaria de la Bolsa de Valores (SEDOL). | 

### Tipos de eventos
<a name="events-types"></a>


| Tipo | Description (Descripción) | 
| --- | --- | 
| BANCARROTA | Un procedimiento legal que involucra a una persona o empresa que no puede pagar las deudas pendientes. | 
| EMPLEO | Se produce cuando un empleado es contratado, despedido, jubilado o cambia de alguna otra forma de estado laboral.  | 
| ADQUISICIÓN\$1CORPORATIVA | Se produce cuando una empresa obtiene la posesión de la mayoría o la totalidad de las acciones o activos físicos de otra empresa para adquirir el control de esa empresa. | 
| INVERSIÓN\$1GENERAL | Se produce cuando una persona o empresa compra un activo con la perspectiva de generar ingresos o revalorización en el futuro. | 
| FUSIÓN\$1CORPORATIVA | Se produce cuando dos o más empresas se unen para crear una nueva entidad jurídica.  | 
| OPI | Oferta pública inicial (OPI) de acciones de una empresa privada al público en una nueva emisión de acciones. | 
| EMISIÓN\$1DERECHOS | Grupo de derechos que se ofrecen a los accionistas actuales para comprar acciones adicionales —conocidos como “certificados de suscripción”— en proporción a sus participaciones actuales. | 
| OFERTA\$1SECUNDARIA | Oferta de valores por parte de un accionista de una empresa.  | 
| OFERTA\$1ESTANTE | Disposición de la Comisión de Bolsa y Valores (SEC) que permite a un emisor registrar una nueva emisión de valores y vender partes de la emisión durante un período de tiempo sin volver a registrar el valor ni incurrir en sanciones. También se conoce como registro de estante. | 
| OFERTA\$1LICITACIÓN | Una oferta para comprar algunas o todas las acciones de los accionistas de una empresa. | 
| DIVISIÓN\$1ACCIONES | Se produce cuando el consejo de administración de una empresa aumenta el número de acciones en circulación emitiendo más acciones a los accionistas actuales. Este hecho también se aplica a las divisiones inversas de acciones. | 

### Tipo de argumento
<a name="events-argument-types"></a>


**Tipos de argumentos para QUIEBRA**  

| Tipo de argumento | Description (Descripción) | 
| --- | --- | 
| DECLARANTE | La persona o empresa que se declara en quiebra.  | 
| FECHA | La fecha u hora de la quiebra. | 
| LUGAR | Lugar o recinto donde (o más cerca del lugar) tuvo lugar la quiebra. | 


**Tipos de argumentos para EMPLEO**  

| Tipo | Description (Descripción) | 
| --- | --- | 
| EMPLEADO | La persona empleada por una empresa. | 
| CARGO\$1EMPLEADO | El cargo del empleado. | 
| EMPLEADOR | La persona o empresa que emplea al empleado. | 
| FECHA\$1INICIO | La fecha u hora de inicio del empleo. | 
| FECHA\$1FINALIZACIÓN | La fecha u hora de finalización del empleo. | 


**Tipos de argumentos para ADQUISICIÓN\$1CORPORATIVA e INVERSIÓN\$1GENERAL**  

| Tipo | Description (Descripción) | 
| --- | --- | 
| MONTO | El valor monetario asociado con la transacción. | 
| DESTINATARIO\$1INVERSIONES | La persona o empresa asociada a la inversión. | 
| INVERSOR | La persona o empresa que invierte en el activo. | 
| DATE | La fecha u hora de la adquisición o inversión. | 
| LUGAR | El lugar donde (o el lugar más cercano) tuvo lugar la adquisición o la inversión. | 


**Tipos de argumentos para FUSIÓN\$1CORPORATIVA**  

| Tipo | Description (Descripción) | 
| --- | --- | 
| DATE | La fecha u hora de la fusión. | 
| NUEVA\$1EMPRESA | La nueva entidad jurídica resultante de la fusión. | 
| PARTICIPANTE | La empresa implicada en la fusión. | 


**Tipos de argumentos para OPI, EMISIÓN\$1DERECHOS, OFERTA\$1SECUNDARIA, OFERTA\$1ESTANTE, OFERTA\$1LICITACIÓN**  

| Tipo | Description (Descripción) | 
| --- | --- | 
| FECHA\$1CADUCIDAD | La fecha u hora de caducidad de la oferta. | 
| INVERSOR | La persona o empresa que invierte en el activo. | 
| DESTINATARIO\$1OFERTA | La persona o empresa que recibe la oferta. | 
| IMPORTE\$1OFERTA | El valor monetario asociado con la oferta. | 
| FECHA\$1OFERTA | La fecha u hora de la oferta. | 
| OFERENTE | La persona o empresa que inicia la oferta. | 
| VALOR\$1TOTAL\$1OFERENTE | El valor monetario total asociado con la oferta. | 
| FECHA\$1REGISTRO | La fecha u hora de registro de la oferta. | 
| AGENTE\$1VENTA | La persona o empresa que facilita la venta de la oferta.  | 
| PRECIO\$1ACCIÓN | El valor monetario asociado con el precio de la acción. | 
| CANTIDAD\$1ACCIONES | El número de acciones asociadas a la oferta. | 
| ASEGURADORES | La empresa asociada a la suscripción de la oferta. | 


**Tipos de argumentos para DIVISIÓN\$1ACCIONES**  

| Tipo | Description (Descripción) | 
| --- | --- | 
| EMPRESA | La empresa que emite acciones de la división de acciones. | 
| DATE | La fecha u hora de la división de acciones. | 
| RATIO\$1DIVISIÓN | La relación entre el aumento del número de nuevas acciones en circulación y el número actual de acciones antes de la división de acciones.  | 

# Frases clave
<a name="how-key-phrases"></a>

Una *frase clave* es una cadena que contiene una frase nominal que describe una cosa en particular. Por lo general, consiste en un sustantivo y los modificadores que lo distinguen. Por ejemplo, “día” es un sustantivo; “un día hermoso” es una frase nominal que incluye un artículo (“un”) y un adjetivo (“hermoso”). Cada frase clave incluye una puntuación que indica el nivel de confianza que Amazon Comprehend tiene en cuanto a que la cadena es una frase nominal. Puede utilizar la puntuación para determinar si la detección tiene un nivel de confianza suficiente para su aplicación.

Las operaciones de detección de frases clave pueden realizarse en cualquiera de los principales idiomas compatibles con Amazon Comprehend. Todos los documentos deben estar en el mismo idioma.

Puede utilizar cualquiera de las siguientes operaciones de detección de frases clave de un documento o conjunto de documentos.
+ [DetectKeyPhrases](https://docs.aws.amazon.com/comprehend/latest/APIReference/API_DetectKeyPhrases.html)
+  [BatchDetectKeyPhrases](https://docs.aws.amazon.com/comprehend/latest/APIReference/API_BatchDetectKeyPhrases.html)
+  [StartKeyPhrasesDetectionJob](https://docs.aws.amazon.com/comprehend/latest/APIReference/API_StartKeyPhrasesDetectionJob.html)

Las operaciones devuelven una lista de [KeyPhrase](https://docs.aws.amazon.com/comprehend/latest/APIReference/API_KeyPhrase.html)objetos, uno para cada frase clave del documento. La operación `BatchDetectKeyPhrases` devuelve una lista de objetos `KeyPhrase`, uno para cada documento del lote.. La operación `StartKeyPhrasesDetectionJob` inicia una tarea asíncrona que genera un archivo que contiene una lista de objetos `KeyPhrase` para cada documento de la tarea.

El siguiente ejemplo es la respuesta de la operación de `DetectKeyPhrases`.

```
{
    "LanguageCode": "en",
    "KeyPhrases": [
        {
            "Text": "today",
            "Score": 0.89,
            "BeginOffset": 14,
            "EndOffset": 19
        },
        {
            "Text": "Seattle",
            "Score": 0.91,
            "BeginOffset": 23,
            "EndOffset": 30
        }
    ]
}
```

# Idioma predominante
<a name="how-languages"></a>

Puede utilizar Amazon Comprehend para examinar el texto y determinar el idioma predominante. Amazon Comprehend identifica el idioma usando los identificadores del RFC 5646 (si hay un identificador ISO 639-1 de dos letras, con una subetiqueta regional, si es necesario y lo usa). De lo contrario, utiliza el código ISO 639-2 de tres letras. 

Para obtener más información sobre RFC 5646, consulte [Etiquetas para identificar idiomas](https://tools.ietf.org/html/rfc5646) en el sitio web de *herramientas del IETF*.

La respuesta incluye una puntuación que indica el nivel de confianza que Amazon Comprehend tiene en cuanto a que un idioma específico es el idioma predominante del documento. Todas las puntuaciones son independientes de las demás. La puntuación no indica que un idioma constituya un porcentaje determinado del documento.

Si un documento largo (por ejemplo, un libro) contiene varios idiomas, puede dividir el documento en partes más pequeñas y ejecutar la operación `DetectDominantLanguage` en las partes individuales. A continuación, puede agregar los resultados para determinar el porcentaje de cada idioma presente en el documento más extenso.

La detección de idiomas de Amazon Comprehend tiene las siguientes limitaciones:
+ No admite la detección fonética del idioma. Por ejemplo, no detecta el “arigato” japonés ni el “nihao” chino.
+ Puede tener dificultades a la hora de distinguir combinaciones lingüísticas cercanas, como son el indonesio y el malayo, o el bosnio, el croata y el serbio.
+ Para obtener resultados óptimos, introduzca al menos 20 caracteres de texto.

Amazon Comprehend detecta los siguientes idiomas.


| Código | Idioma | 
| --- | --- | 
| af | Afrikáans | 
| am | Amárico | 
| ar | Árabe | 
| as | Asamés | 
| az | Azerbaiyano | 
| ba | Baskir | 
| be | Bielorruso | 
| bn | Bengalí | 
| bs | Bosnio | 
| bg | Búlgaro | 
| ca | Catalán | 
| ceb | Cebuano | 
| cs | Checo | 
| cv | Chuvasio | 
| cy | Galés | 
| da | Danés | 
| de | Alemán | 
| el | Griego | 
| en | Inglés | 
| eo | Esperanto | 
| et | Estonio | 
| eu | Euskera | 
| fa | Persa | 
| fi | Finés | 
| fr | Francés | 
| gd | Gaélico escocés | 
| ga | Irlandés | 
| gl | Gallego | 
| gu | Gujarati | 
| ht | Haitiano | 
| he | Hebreo | 
| ha | Hausa | 
| hi | Hindi | 
| hr | Croata | 
| hu | Húngaro | 
| hy | Armenio | 
| ilo | Ilocano | 
| id | Indonesio | 
| is | Islandés | 
| it | Italiano | 
| jv | Javanés | 
| ja | Japonés | 
| kn | Canarés | 
| ka | Georgiano | 
| kk | Kazajo | 
| km | Camboyano central | 
| ky | Kirguís | 
| ko | Coreano | 
| ku | Kurdo | 
| lo | Lao | 
| la | Latín | 
| lv | Letón | 
| lt | Lituano | 
| lb | Luxemburgués | 
| ml | Malayalam | 
| mt | Maltés | 
| mr | Marathi | 
| mk | Macedonio | 
| mg | Malgache | 
| mn | Mongol | 
| ms | Malayo | 
| my | Birmano | 
| ne | Nepalés | 
| new | Nevarí | 
| nl | Neerlandés | 
| no | Noruego | 
| or | Oriya | 
| om | Oromo | 
| pa | Panyabí | 
| pl | Polaco | 
| pt | Portugués | 
| ps | Pastún | 
| qu | Quechua | 
| ro | Rumano | 
| ru | Ruso | 
| sa | Sánscrito | 
| si | Cingalés | 
| sk | Eslovaco | 
| sl | Esloveno | 
| sd | Sindi | 
| so | Somalí | 
| es | Español | 
| sq | Albanés | 
| sr | Serbio | 
| su | Sondanés | 
| sw | Suajili | 
| sv | Sueco | 
| ta | Tamil | 
| tt | Tártaro | 
| te | Telugu | 
| tg | Tayiko | 
| tl | Tagalo | 
| th | Tailandés | 
| tk | Turcomano | 
| tr | Turco | 
| ug | Uigur | 
| uk | Ucraniano | 
| ur | Urdu | 
| uz | Uzbeko | 
| vi | Vietnamita | 
| yi | Yiddish | 
| yo | Yoruba | 
| zh | Chino simplificado | 
| zh-TW | Chino tradicional | 

Puede utilizar cualquiera de las siguientes operaciones para detectar el idioma predominante de un documento o conjunto de documentos.
+  [DetectDominantLanguage](https://docs.aws.amazon.com/comprehend/latest/APIReference/API_DetectDominantLanguage.html)
+  [BatchDetectDominantLanguage](https://docs.aws.amazon.com/comprehend/latest/APIReference/API_BatchDetectDominantLanguage.html)
+  [StartDominantLanguageDetectionJob](https://docs.aws.amazon.com/comprehend/latest/APIReference/API_StartDominantLanguageDetectionJob.html)

La `DetectDominantLanguage` operación devuelve un [DominantLanguage](https://docs.aws.amazon.com/comprehend/latest/APIReference/API_DominantLanguage.html)objeto. La operación `BatchDetectDominantLanguage` devuelve una lista de objetos `DominantLanguage`, uno para cada documento del lote.. La operación `StartDominantLanguageDetectionJob` inicia un trabajo asíncrono que genera un archivo que contiene una lista de objetos `DominantLanguage`, uno por cada documento de la tarea.

El siguiente ejemplo es la respuesta de la operación de `DetectDominantLanguage`.

```
{
    "Languages": [
        {
            "LanguageCode": "en",
            "Score": 0.9793661236763
        }
    ]
}
```

# Opiniones
<a name="how-sentiment"></a>

Utilice Amazon Comprehend para determinar las opiniones del contenido en los documentos de texto codificados en UTF-8. Por ejemplo, puede usar el análisis de opiniones para determinar las opiniones de los comentarios de una publicación de blog y determinar si a los lectores les ha gustado la publicación.

Puede determinar la opinión de los documentos en cualquiera de los principales idiomas admitidos por Amazon Comprehend. Todos los documentos de un trabajo deben estar en el mismo idioma.

La determinación de las opiniones reporta los siguientes valores:
+ **Positive**: el texto expresa una opinión generalmente positiva.
+ **Negative**: el texto expresa una opinión generalmente negativa.
+ **Mixed**: el texto expresa opiniones tanto positivas como negativas.
+ **Neutral**: el texto no expresa ni opiniones positivas ni negativas.

Puede utilizar cualquiera de las siguientes operaciones de API para detectar las opiniones de un documento o de un conjunto de documentos.
+ [DetectSentiment](https://docs.aws.amazon.com/comprehend/latest/APIReference/API_DetectSentiment.html)
+  [BatchDetectSentiment](https://docs.aws.amazon.com/comprehend/latest/APIReference/API_BatchDetectSentiment.html)
+  [StartSentimentDetectionJob](https://docs.aws.amazon.com/comprehend/latest/APIReference/API_StartSentimentDetectionJob.html)

Las operaciones devuelven el sentimiento más probable para el texto y las puntuaciones de cada una de las opiniones. La puntuación representa la probabilidad de que el sentimiento se haya detectado correctamente. A fin de ilustrar lo anterior, en el siguiente ejemplo hay un 95 por ciento de probabilidades de que el texto tenga una opinión `Positive`. Hay una probabilidad de menos del 1 por ciento de que el texto tenga una opinión `Negative`. Puede utilizar `SentimentScore` para determinar si la precisión de la detección satisface las necesidades de su aplicación.

La `DetectSentiment` operación devuelve un objeto que contiene el sentimiento detectado y un [SentimentScore](https://docs.aws.amazon.com/comprehend/latest/APIReference/API_SentimentScore.html)objeto. La operación `BatchDetectSentiment` devuelve una lista de opiniones y objetos `SentimentScore`, una para cada documento del lote. La operación `StartSentimentDetectionJob` inicia un trabajo asíncrono que genera un archivo que contiene una lista de opiniones y objetos `SentimentScore`, una para cada documento de la tarea.

El siguiente ejemplo es la respuesta de la operación de `DetectSentiment`.

```
{
"SentimentScore": {
        "Mixed": 0.030585512690246105,
        "Positive": 0.94992071056365967,
        "Neutral": 0.0141543131828308,
        "Negative": 0.00893945890665054
    },
    "Sentiment": "POSITIVE",
    "LanguageCode": "en"
}
```

# Opiniones específicas
<a name="how-targeted-sentiment"></a>

La *opinión específica* ofrece una comprensión detallada de las opiniones asociadas a entidades específicas (como marcas o productos) en los documentos de entrada. 

La diferencia entre las opiniones específicas y las [opiniones](how-sentiment.md) es el nivel de detalle de los datos de salida. El análisis de las opiniones determina la opinión predominante para cada documento de entrada, pero no proporciona datos para un análisis posterior. El análisis de las opiniones específicas determina la opinión a nivel de entidad para entidades concretas de cada documento de entrada. Puede analizar los datos de salida para determinar los productos y servicios específicos que reciben reseñas positivas o negativas.

Por ejemplo, en una serie de reseñas de restaurantes, un cliente comparte la siguiente valoración: “Los tacos estaban deliciosos y el personal fue amable”. El análisis de esta reseña arroja los siguientes resultados: 
+ El **análisis de opiniones** determina si las opiniones generales de cada reseña del restaurante son positivas, negativas, neutras o mixtas. En este ejemplo, la opinión general es positiva. 
+ **El análisis de opiniones específicas** determina la opinión sobre las entidades y los atributos del restaurante que los clientes mencionan en las reseñas. En este ejemplo, el cliente ha hecho comentarios positivos sobre los “tacos” y el “personal”. 

La opinión específica ofrece los siguientes resultados para cada tarea de análisis:
+ Identidad de las entidades que se mencionan en los documentos.
+ Clasificación del tipo de entidad para cada entidad mencionada.
+ La opinión y una puntuación para la opinión por cada entidad mencionada.
+ Grupos de menciones (grupos de correferencia) que corresponden a una sola entidad.

Puede usar la [consola](get-started-console.md) o la [API](using-api-targeted-sentiment.md) para ejecutar un análisis de opinión específica. La consola y la API son compatibles con el análisis en tiempo real y con el análisis asíncrono de opiniones específicas.

 Amazon Comprehend es compatible con la opinión específica de los documentos en inglés. 

Para obtener información adicional sobre el sentimiento segmentado, incluido un tutorial, consulte [Extraiga un sentimiento detallado en el texto con Amazon Comprehend Targeted Sentiment](https://aws.amazon.com/blogs/machine-learning/extract-granular-sentiment-in-text-with-amazon-comprehend-targeted-sentiment/) en el blog de aprendizaje AWS automático. 

**Topics**
+ [Tipos de entidad](#how-targeted-sentiment-entities)
+ [Grupo de correferencia](#how-targeted-sentiment-values)
+ [Organización de archivos de salida](#how-targeted-sentiment-output)
+ [Análisis en tiempo real a través de la consola](#how-targeted-sentiment-console)
+ [Ejemplo de salida de opiniones específicas](#how-targeted-sentiment-example)

## Tipos de entidad
<a name="how-targeted-sentiment-entities"></a>

La opinión específica identifica los siguientes tipos de entidades. Asigna el tipo de entidad OTHER si la entidad no pertenece a ninguna otra categoría. Cada entidad mencionada en el archivo de salida incluye el tipo de entidad, por ejemplo `"Type": "PERSON"`.


**Definiciones de los tipos de entidad**  

| Tipo de identidad | Definición | 
| --- | --- | 
| INDIVIDUO | Los ejemplos incluyen personas, grupos de personas, apodos, personajes ficticios y nombres de animales. | 
| UBICACIÓN | Ubicaciones geográficas como países, ciudades, estados, direcciones, formaciones geológicas, masas de agua, puntos de referencia naturales y ubicaciones astronómicas. | 
| ORGANIZACIÓN | Algunos ejemplos son los gobiernos, las empresas, los equipos deportivos y las religiones. | 
| INSTALACIONES | Edificios, aeropuertos, autopistas, puentes y otras estructuras permanentes hechas por el hombre, así como mejoras inmobiliarias. | 
| BRAND | Organización, grupo o fabricante de un artículo comercial específico o de una línea de productos. | 
| COMMERCIAL\$1ITEM | Cualquier artículo no genérico que pueda comprarse o adquirirse, incluidos los vehículos y los productos de gran tamaño para los que solo se haya fabricado un artículo. | 
| MOVIE | Una película o un programa de televisión. La entidad puede ser el nombre completo, un apodo o un subtítulo. | 
| MUSIC | Una canción, entera o una parte. También recopilaciones de creaciones musicales individuales, por ejemplo un álbum o una antología. | 
| BOOK | Un libro, independientemente de si se ha autopublicado o la publicación es profesional. | 
| SOFTWARE | Un producto de software oficialmente lanzado al mercado. | 
| GAME | Un juego, por ejemplo: videojuegos, juegos de mesa, juegos comunes o deportes. | 
| PERSONAL\$1TITLE | Títulos oficiales y honoríficos, como presidente, PhD o Dr. | 
| EVENT | Los ejemplos incluyen festivales, conciertos, elecciones, guerras, conferencias y eventos promocionales. | 
| DATE | Cualquier referencia a una fecha u hora, ya sea específica o general, absoluta o relativa. | 
| CANTIDAD | Todas las medidas junto con sus unidades (moneda, porcentaje, número, bytes, etc.). | 
| ATTRIBUTE | Un atributo, característica o rasgo de una entidad; por ejemplo, la “calidad” de un producto, el “precio” de un teléfono o la “velocidad” de una CPU. | 
| OTHER | Entidades que no pertenecen a ninguna de las otras categorías. | 

## Grupo de correferencia
<a name="how-targeted-sentiment-values"></a>

La opinión específica identifica a los grupos de correferencia de cada documento de entrada. Un grupo de correferencia es un grupo de menciones de un documento que corresponden a una entidad del mundo real.

**Example**  
En el siguiente ejemplo de opinión de un cliente, “balneario” es la entidad que tiene el tipo de entidad `FACILITY`. La entidad tiene dos menciones adicionales como pronombre (“eso”).   

![\[Grupo de correferencia de opiniones específicas.\]](http://docs.aws.amazon.com/es_es/comprehend/latest/dg/images/gs-console-targeted-sentiment4.png)


## Organización de archivos de salida
<a name="how-targeted-sentiment-output"></a>

La tarea de análisis de opiniones específicas crea un archivo de salida de texto en formato JSON. El archivo contiene un objeto JSON para cada uno de los documentos de entrada. Todos los objetos JSON contienen los siguientes campos:
+ **Entidades**: una matriz de entidades identificadas en el documento. 
+ **Archivo**: el nombre de archivo del documento de entrada.
+ **Línea**: si el archivo de entrada es un documento por línea, **Entidades** contiene el número de línea del documento del archivo.

**nota**  
Si la opinión específica no identifica ninguna entidad en el texto de entrada, retornará una matriz vacía como el resultado de Entidades.

El siguiente ejemplo muestra las **entidades** de un archivo de entrada con tres líneas de entrada. El formato de entrada es **ONE\$1DOC\$1PER\$1LINE**, por lo que cada línea de entrada es un documento.

```
{ "Entities":[
    {entityA},
    {entityB},
    {entityC}
    ],
  "File": "TargetSentimentInputDocs.txt",
  "Line": 0
}
{ "Entities": [
    {entityD},
    {entityE}
  ],
  "File": "TargetSentimentInputDocs.txt",
  "Line": 1
}
{ "Entities": [
    {entityF},
    {entityG}
    ],
  "File": "TargetSentimentInputDocs.txt",
  "Line": 2
}
```



Una entidad de la matriz **Entidades** incluye una agrupación lógica (denominada grupo de correferencia) de las menciones de aquellas entidades que se han detectado en el documento. Cada entidad tiene la siguiente estructura general:

```
{"DescriptiveMentionIndex": [0],
  "Mentions": [
     {mentionD},
     {mentionE}
    ]
}
```

Una entidad contiene los siguientes campos:
+ **Menciones**: una matriz de menciones de la entidad del documento. La matriz representa a un grupo de correferencia. Consulte [Grupo de correferencia](#how-targeted-sentiment-values) para ver un ejemplo. El orden en que aparecen las menciones en la matriz Menciones coincide con el orden de su ubicación (desplazamiento) en el documento. Cada mención incluye la puntuación de opinión y la puntuación de grupo para esa mención. La puntuación grupal indica el nivel de confianza que existe en que dichas menciones pertenezcan a la misma entidad.
+ **DescriptiveMentionIndex**— Uno o más índices en la matriz de menciones que proporcionen el mejor nombre para el grupo de entidades. Por ejemplo, una entidad podría tener tres menciones con valores de **texto**: “ABC Hotel”, “ABC Hotel” y “este”. El mejor nombre es «ABC Hotel», que tiene un DescriptiveMentionIndex valor de [0,1]. 

Cada mención incluye los siguientes campos
+ **BeginOffset**— El desfase en el texto del documento donde comienza la mención.
+ **EndOffset**— El desfase en el texto del documento donde termina la mención.
+ **GroupScore**— La confianza de que todas las entidades mencionadas en el grupo se relacionan con la misma entidad.
+ **Text**: el texto del documento que identifica a la entidad.
+ **Type**: el tipo de entidad. Amazon Comprehend admite diversos [tipos de entidades](#how-targeted-sentiment-entities).
+ **Score**: confianza del modelo en que la entidad sea relevante. El rango de valores va de cero a uno, siendo uno la máxima confianza.
+ **MentionSentiment**— Contiene el sentimiento y la puntuación de sentimiento de la mención.
+ **Sentiment**: la opinión de la mención. Los valores incluyen: POSITIVO, NEUTRO, NEGATIVO y MIXTO. 
+ **SentimentScore**— Proporciona confianza al modelo para cada uno de los posibles sentimientos. El rango de valores va de cero a uno, siendo uno la máxima confianza.

Los valores de **Sentiment** tienen el siguiente significado:
+ **Positivo**: la entidad mencionada incita una opinión positiva.
+ **Negativo**: la entidad mencionada incita una opinión negativa.
+ **Mixto**: la entidad mencionada incita opiniones tanto positivas como negativas.
+ **Neutro**: la entidad mencionada no incita opiniones positivas ni negativas.

En el siguiente ejemplo, una entidad solo tiene una mención en el documento de entrada, por lo que DescriptiveMentionIndex es cero (la primera mención de la matriz de menciones). La entidad identificada es una PERSONA con el nombre “Yo”. La puntuación de la opinión es neutra.

```
{"Entities":[
  {
    "DescriptiveMentionIndex": [0],
    "Mentions": [
      {
       "BeginOffset": 0,
       "EndOffset": 1,
       "Score": 0.999997,
       "GroupScore": 1,
       "Text": "I",
       "Type": "PERSON",
       "MentionSentiment": {
         "Sentiment": "NEUTRAL",
         "SentimentScore": {
           "Mixed": 0,
           "Negative": 0,
           "Neutral": 1,
           "Positive": 0
         }
       }
     }
   ]
  }
 ],
 "File": "Input.txt",
 "Line": 0
}
```

## Análisis en tiempo real a través de la consola
<a name="how-targeted-sentiment-console"></a>

Puede utilizar la consola de Amazon Comprehend para ejecutar [Opiniones específicas](realtime-console-analysis.md#realtime-analysis-console-targeted-sentiment) en tiempo real. Utilice el texto de muestra o pegue su propio texto en el cuadro de texto de entrada y, a continuación, seleccione **Analizar**.

En el panel **Insights**, la consola muestra tres vistas del análisis de opinión específica:
+ **Texto analizado**: muestra el texto analizado y subraya cada entidad. El color del subrayado indica el valor de la opinión (positivo, neutro, negativo o mixto) que el análisis ha asignado a esa entidad. La consola muestra las asignaciones de colores en la esquina superior derecha de la caja de texto analizada. Si coloca el cursor sobre una entidad, la consola mostrará un panel emergente que contiene los valores del análisis (tipo de entidad, puntuación de la opinión) para esa entidad.
+ **Resultados**: muestra una tabla que contiene una fila para cada entidad que se menciona en el texto. La tabla muestra la [entidad](#how-targeted-sentiment-entities) y la puntuación de la entidad para cada una de ellas. La fila también incluye la opinión principal y la puntuación para cada valor de opinión. Si aparecen varias menciones a la misma entidad, lo que se conoce como [Grupo de correferencia](#how-targeted-sentiment-values), la tabla mostrará esas menciones como un conjunto desplegable de filas asociadas a la entidad principal. 

  Si pasa el ratón sobre una fila de la entidad de la tabla de **resultados**, la consola resaltará la mención a la entidad en el panel de **texto analizado**.
+ **Integración de aplicaciones**: muestra los valores de los parámetros de la solicitud de la API, así como la estructura del objeto JSON reportado en la respuesta de esta última. Para obtener una descripción de los campos del objeto JSON, consulte [Organización de archivos de salida](#how-targeted-sentiment-output).

### Ejemplo de análisis de consola en tiempo real
<a name="targeted-sentiment-example"></a>

En este ejemplo se utiliza el siguiente texto como entrada, que es el texto de entrada predeterminado que proporciona la consola.

```
Hello Zhang Wei, I am John. Your AnyCompany Financial Services, LLC credit card account 1111-0000-1111-0008 has a minimum payment 
  of $24.53 that is due by July 31st. Based on your autopay settings, we will withdraw your payment on the due date from your 
  bank account number XXXXXX1111 with the routing number XXXXX0000. 
  Customer feedback for Sunshine Spa, 123 Main St, Anywhere. Send comments to Alice at sunspa@mail.com. 
  I enjoyed visiting the spa. It was very comfortable but it was also very expensive. The amenities were ok but the service made 
  the spa a great experience.
```

En el panel **Texto analizado** se muestra el siguiente resultado para este ejemplo. Pase el ratón sobre el texto `Zhang Wei` para ver el panel emergente de esta entidad.

![\[Texto analizado de la opinión específica.\]](http://docs.aws.amazon.com/es_es/comprehend/latest/dg/images/gs-console-targeted-sentiment2.png)


La tabla de **resultados** proporciona información adicional sobre cada entidad, incluida la puntuación de entidad, la opinión principal y la puntuación de cada opinión. 

![\[Tabla de resultados de opiniones específicas.\]](http://docs.aws.amazon.com/es_es/comprehend/latest/dg/images/gs-console-targeted-sentiment3.png)


En nuestro ejemplo, el análisis de opiniones específicas reconoce que cada mención a **tu** en el texto de entrada es una referencia a la persona o entidad llamada **Zhang Wei**. La consola muestra estas menciones como un conjunto de filas desplegables asociadas a la entidad principal.

![\[Tabla de resultados de opiniones específicas.\]](http://docs.aws.amazon.com/es_es/comprehend/latest/dg/images/gs-console-targeted-sentiment5.png)


El panel de **integración de aplicaciones** muestra el objeto JSON que genera la DetectTargetedSentiment API. Para obtener un ejemplo detallado, consulte la siguiente sección.

## Ejemplo de salida de opiniones específicas
<a name="how-targeted-sentiment-example"></a>

El siguiente ejemplo muestra el archivo de salida de una tarea de análisis de opiniones específicas. El archivo de entrada consiste en tres documentos sencillos:

```
The burger was very flavorful and the burger bun was excellent. However, customer service was slow.
My burger was good, and it was warm. The burger had plenty of toppings.
The burger was cooked perfectly but it was cold. The service was OK.
```

El análisis de opiniones específicas de este archivo de entrada produce el siguiente resultado.

```
  {"Entities":[
    {
      "DescriptiveMentionIndex": [
        0
      ],
      "Mentions": [
        {
          "BeginOffset": 4,
          "EndOffset": 10,
          "Score": 0.999991,
          "GroupScore": 1,
          "Text": "burger",
          "Type": "OTHER",
          "MentionSentiment": {
            "Sentiment": "POSITIVE",
            "SentimentScore": {
              "Mixed": 0,
              "Negative": 0,
              "Neutral": 0,
              "Positive": 1
            }
          }
        }
      ]
    },
    {
      "DescriptiveMentionIndex": [
        0
      ],
      "Mentions": [
        {
          "BeginOffset": 38,
          "EndOffset": 44,
          "Score": 1,
          "GroupScore": 1,
          "Text": "burger",
          "Type": "OTHER",
          "MentionSentiment": {
            "Sentiment": "NEUTRAL",
            "SentimentScore": {
              "Mixed": 0.000005,
              "Negative": 0.000005,
              "Neutral": 0.999591,
              "Positive": 0.000398
            }
          }
        }
      ]
    },
    {
      "DescriptiveMentionIndex": [
        0
      ],
      "Mentions": [
        {
          "BeginOffset": 45,
          "EndOffset": 48,
          "Score": 0.961575,
          "GroupScore": 1,
          "Text": "bun",
          "Type": "OTHER",
          "MentionSentiment": {
            "Sentiment": "POSITIVE",
            "SentimentScore": {
              "Mixed": 0.000327,
              "Negative": 0.000286,
              "Neutral": 0.050269,
              "Positive": 0.949118
            }
          }
        }
      ]
    },
    {
      "DescriptiveMentionIndex": [
        0
      ],
      "Mentions": [
        {
          "BeginOffset": 73,
          "EndOffset": 89,
          "Score": 0.999988,
          "GroupScore": 1,
          "Text": "customer service",
          "Type": "ATTRIBUTE",
          "MentionSentiment": {
            "Sentiment": "NEGATIVE",
            "SentimentScore": {
              "Mixed": 0.000001,
              "Negative": 0.999976,
              "Neutral": 0.000017,
              "Positive": 0.000006
            }
          }
        }
      ]
    }
  ],
  "File": "TargetSentimentInputDocs.txt",
  "Line": 0
}
{
  "Entities": [
    {
      "DescriptiveMentionIndex": [
        0
      ],
      "Mentions": [
        {
          "BeginOffset": 0,
          "EndOffset": 2,
          "Score": 0.99995,
          "GroupScore": 1,
          "Text": "My",
          "Type": "PERSON",
          "MentionSentiment": {
            "Sentiment": "NEUTRAL",
            "SentimentScore": {
              "Mixed": 0,
              "Negative": 0,
              "Neutral": 1,
              "Positive": 0
            }
          }
        }
      ]
    },
    {
      "DescriptiveMentionIndex": [
        0,
        2
      ],
      "Mentions": [
        {
          "BeginOffset": 3,
          "EndOffset": 9,
          "Score": 0.999999,
          "GroupScore": 1,
          "Text": "burger",
          "Type": "OTHER",
          "MentionSentiment": {
            "Sentiment": "POSITIVE",
            "SentimentScore": {
              "Mixed": 0.000002,
              "Negative": 0.000001,
              "Neutral": 0.000003,
              "Positive": 0.999994
            }
          }
        },
        {
          "BeginOffset": 24,
          "EndOffset": 26,
          "Score": 0.999756,
          "GroupScore": 0.999314,
          "Text": "it",
          "Type": "OTHER",
          "MentionSentiment": {
            "Sentiment": "POSITIVE",
            "SentimentScore": {
              "Mixed": 0,
              "Negative": 0.000003,
              "Neutral": 0.000006,
              "Positive": 0.999991
            }
          }
        },
        {
          "BeginOffset": 41,
          "EndOffset": 47,
          "Score": 1,
          "GroupScore": 0.531342,
          "Text": "burger",
          "Type": "OTHER",
          "MentionSentiment": {
            "Sentiment": "POSITIVE",
            "SentimentScore": {
              "Mixed": 0.000215,
              "Negative": 0.000094,
              "Neutral": 0.00008,
              "Positive": 0.999611
            }
          }
        }
      ]
    },
    {
      "DescriptiveMentionIndex": [
        0
      ],
      "Mentions": [
        {
          "BeginOffset": 52,
          "EndOffset": 58,
          "Score": 0.965462,
          "GroupScore": 1,
          "Text": "plenty",
          "Type": "QUANTITY",
          "MentionSentiment": {
            "Sentiment": "NEUTRAL",
            "SentimentScore": {
              "Mixed": 0,
              "Negative": 0,
              "Neutral": 1,
              "Positive": 0
            }
          }
        }
      ]
    },
    {
      "DescriptiveMentionIndex": [
        0
      ],
      "Mentions": [
        {
          "BeginOffset": 62,
          "EndOffset": 70,
          "Score": 0.998353,
          "GroupScore": 1,
          "Text": "toppings",
          "Type": "OTHER",
          "MentionSentiment": {
            "Sentiment": "NEUTRAL",
            "SentimentScore": {
              "Mixed": 0,
              "Negative": 0,
              "Neutral": 0.999964,
              "Positive": 0.000036
            }
          }
        }
      ]
    }
  ],
  "File": "TargetSentimentInputDocs.txt",
  "Line": 1
}
{
  "Entities": [
    {
      "DescriptiveMentionIndex": [
        0
      ],
      "Mentions": [
        {
          "BeginOffset": 4,
          "EndOffset": 10,
          "Score": 1,
          "GroupScore": 1,
          "Text": "burger",
          "Type": "OTHER",
          "MentionSentiment": {
            "Sentiment": "POSITIVE",
            "SentimentScore": {
              "Mixed": 0.001515,
              "Negative": 0.000822,
              "Neutral": 0.000243,
              "Positive": 0.99742
            }
          }
        },
        {
          "BeginOffset": 36,
          "EndOffset": 38,
          "Score": 0.999843,
          "GroupScore": 0.999661,
          "Text": "it",
          "Type": "OTHER",
          "MentionSentiment": {
            "Sentiment": "NEGATIVE",
            "SentimentScore": {
              "Mixed": 0,
              "Negative": 0.999996,
              "Neutral": 0.000004,
              "Positive": 0
            }
          }
        }
      ]
    },
    {
      "DescriptiveMentionIndex": [
        0
      ],
      "Mentions": [
        {
          "BeginOffset": 53,
          "EndOffset": 60,
          "Score": 1,
          "GroupScore": 1,
          "Text": "service",
          "Type": "ATTRIBUTE",
          "MentionSentiment": {
            "Sentiment": "NEUTRAL",
            "SentimentScore": {
              "Mixed": 0.000033,
              "Negative": 0.000089,
              "Neutral": 0.993325,
              "Positive": 0.006553
            }
          }
        }
      ]
    }
  ],
  "File": "TargetSentimentInputDocs.txt",
  "Line": 2
}
  }
```

# Análisis de sintaxis
<a name="how-syntax"></a>

Utiliza el análisis sintáctico para analizar las palabras del documento y devolver la parte del discurso, o función sintáctica, de cada palabra del documento. Puede identificar los sustantivos, los verbos, los adjetivos, etc. del documento. Utilice esta información para comprender mejor el contenido de sus documentos y comprender la relación de las palabras en el documento.

Por ejemplo, puede buscar los sustantivos en un documento y, a continuación, buscar los verbos relacionados con esos sustantivos. En una oración como “Mi abuela movió el sofá”, puede ver los sustantivos “abuela” y “sofá” y el verbo “movió”. Puede usar esta información para crear aplicaciones que analicen el texto en busca de combinaciones de palabras que le interesen.

Para iniciar el análisis, Amazon Comprehend analiza el texto fuente para encontrar las palabras individuales en el texto. Después de analizar el texto, a cada palabra se le asigna la parte del discurso que ocupa en el texto fuente.

Amazon Comprehend puede identificar las siguientes partes del discurso. 


| Token | Parte del discurso | 
| --- | --- | 
| ADJ | Adjetivo Palabras que suelen modificar a los sustantivos. | 
| ADP | Adposición El encabezado de una frase preposicional o posposicional. | 
| ADV | Adverbio Palabras que suelen modificar a los verbos. También pueden modificar adjetivos y otros adverbios. | 
| AUX | Auxiliar Palabras funcionales que acompañan al verbo de una frase verbal. | 
| CCONJ | Conjunción coordinadora Una conjunción coordinante conecta palabras, frases o cláusulas de una oración sin subordinar una a la otra. | 
| CONJ | Conjunción Una conjunción conecta palabras, frases o cláusulas de una oración. | 
| DET | Determinador Artículos y otras palabras que especifican un sintagma nominal en particular. | 
| INT | Interjección Palabras utilizadas como exclamación o parte de una exclamación. | 
| SUSTANTIVO | Nombre Palabras que especifican una persona, un lugar, una cosa, un animal o una idea. | 
| NÚM. | Numeral Palabras, normalmente determinantes, adjetivos o pronombres, que expresan un número. | 
| O | Otro Palabras a las que no pueden asignarse una parte de la categoría del discurso. | 
| PART | Partícula Las palabras funcionales se asocian a otra palabra o frase para darles significado.  | 
| PRON | Pronombre Palabras que sustituyen a sustantivos o frases nominales. | 
| SUSTP | Sustantivo propioUn sustantivo que es el nombre de un individuo, lugar u objeto específico. | 
| PUNT | Puntuación Caracteres no alfabéticos que delimitan el texto. | 
| CONJS | Conjunción subordinada Conjunción que une una cláusula dependiente a una oración. Un ejemplo de conjunción subordinante es “porque”. | 
| SÍM | SímboloEntidades parecidas a palabras, como el signo de dólar (\$1) o los símbolos matemáticos. | 
| VERB | VerboPalabras que indican eventos y acciones. | 

Para obtener más información sobre las partes del discurso, consulte las [etiquetas POS universales](http://universaldependencies.org/u/pos/) en el sitio web de *Universal Dependencies*.

Las operaciones devuelven símbolos que identifican la palabra y la parte del discurso que la palabra representa en el texto. Cada token representa una palabra en el texto fuente. Proporciona la ubicación de la palabra en la fuente, la parte del discurso que ocupa la palabra en el texto, la confianza que Amazon Comprehend tiene de que la parte del discurso se identificó correctamente y la palabra que se analizó del texto fuente.

La siguiente es la estructura de la lista de tokens de sintaxis. Se genera un token de sintaxis para cada palabra del documento. 

```
{
   "SyntaxTokens": [ 
      { 
         "BeginOffset": number,
         "EndOffset": number,
         "PartOfSpeech": { 
            "Score": number,
            "Tag": "string"
         },
         "Text": "string",
         "TokenId": number
      }
   ]
}
```

Cada token proporciona la siguiente información:
+ `BeginOffset` y `EndOffset`: proporciona la ubicación de la palabra en el texto de entrada. 
+ `PartOfSpeech`—Proporciona dos datos: el `Tag` que identifica la parte del discurso y el `Score` que representa la confianza que Amazon Comprehend Syntax tiene de que la parte del discurso se ha identificado correctamente.
+ `Text`—Proporciona la palabra que se identificó.
+ `TokenId`—Proporciona un identificador para el token. El identificador es la posición del token en la lista de tokens.

# Amazon Comprehend Custom
<a name="concepts-custom"></a>

Puede personalizar Amazon Comprehend para sus necesidades específicas sin depender de las habilidades necesarias para la creación de soluciones PNL basadas en el machine learning. Con machine learning o AutoML, Comprehend Custom crea modelos personalizados de PNL en su nombre, utilizando los datos de entrenamiento que usted proporciona.

**Procesamiento del documento de entrada**: Amazon Comprehend admite el procesamiento de documentos en un solo paso para la clasificación personalizada y para el reconocimiento de entidades personalizado. Por ejemplo, puede introducir una combinación de documentos de texto sin formato y documentos semiestructurados (como documentos PDF, documentos de Microsoft Word e imágenes) en un trabajo de análisis personalizado. Para obtener más información, consulte [Procesamiento de documentos](idp.md).

**Clasificación personalizada**: crea modelos de clasificación personalizados (clasificadores) para organizar los documentos en sus propias categorías. Para cada etiqueta de clasificación, proporcione el conjunto de documentos que mejor represente a esa etiqueta y entrene al clasificador en ella. Una vez entrenado, el clasificador podrá utilizarse en cualquier cantidad de conjuntos de documentos sin etiquetar. Puede usar la consola para disfrutar de una experiencia libre de código o para instalar el SDK de AWS más reciente. Para obtener más información, consulte [Clasificación personalizada](how-document-classification.md).

**Reconocimiento de entidades personalizado**: crea modelos de reconocimiento de entidades personalizados (reconocedores) que puedan analizar el texto en busca de términos específicos y frases basadas en sustantivos. Puede entrenar a los reconocedores para que extraigan términos, como los números de póliza, o frases que impliquen un escalamiento de los clientes. Para entrenar el modelo, debe proporcionar una lista de las entidades y un conjunto de documentos que las contengan. Una vez que el modelo esté entrenado, podrá enviar tareas de análisis para extraer las entidades personalizadas. Para obtener más información, consulte [Reconocimiento de entidades personalizado](custom-entity-recognition.md). 

# Modelado de temas
<a name="topic-modeling"></a>

**nota**  
Las funciones de modelado de temas, detección de eventos y clasificación rápida de seguridad de Amazon Comprehend dejarán de estar disponibles para los nuevos clientes a partir del 30 de abril de 2026. Si desea utilizar estas funciones con cuentas nuevas, hágalo antes de esta fecha. No es necesario realizar ninguna acción en el caso de las cuentas que hayan utilizado estas funciones en los últimos 12 meses. Para obtener más información, consulte [Cambio en la disponibilidad de las funciones de Amazon Comprehend](comprehend-availability-change.md).

Puede utilizar Amazon Comprehend para examinar el contenido de una serie de documentos y determinar temas comunes. Por ejemplo, puede darle a Amazon Comprehend una serie de artículos de noticias y él determinará los temas, como deportes, política o entretenimiento. El texto de los documentos no necesita estar anotado. 

Amazon Comprehend utiliza un modelo de aprendizaje basado en la [Asignación de un dirichlet latente](http://www.jmlr.org/papers/volume3/blei03a/blei03a.pdf) para determinar los temas de un conjunto de documentos. Examina cada documento para determinar el contexto y el significado de una palabra. El conjunto de palabras que suelen pertenecer al mismo contexto en todo el conjunto de documentos constituye un tema.

Una palabra se asocia a un tema de un documento en función de la prevalencia de ese tema en el documento y de la afinidad que tenga el tema con la palabra. La misma palabra se puede asociar a distintos temas en distintos documentos según la distribución de los temas en un documento concreto. 

Por ejemplo, la palabra “glucosa” en un artículo que habla predominantemente de deportes puede asignarse al tema “deportes”, mientras que la misma palabra en un artículo sobre “medicina” se asignará al tema “medicina”.

A cada palabra relacionada con un tema se le asigna un peso que indica en qué medida la palabra ayuda a definir el tema. El peso indica cuántas veces aparece la palabra en el tema en comparación con otras palabras del tema, en todo el conjunto de documentos.

Para obtener resultados más precisos, debe proporcionar a Amazon Comprehend el corpus más grande posible con el que trabajar. Para obtener resultados óptimos:
+ Debe utilizar al menos 1000 documentos en cada trabajo de modelado de temas.
+ Cada documento debe tener al menos 3 oraciones.
+ Si un documento consta principalmente de datos numéricos, debe eliminarlo del corpus.

El modelado de temas es un proceso asíncrono. La lista de documentos se envía a Amazon Comprehend desde un bucket de Amazon S3 mediante la [StartTopicsDetectionJob](https://docs.aws.amazon.com/comprehend/latest/APIReference/API_StartTopicsDetectionJob.html)operación. La respuesta se envía a un bucket de Amazon S3. Puede configurar los buckets de entrada y salida. Obtenga una lista de los trabajos de modelado por temas que haya enviado mediante la [ListTopicsDetectionJobs](https://docs.aws.amazon.com/comprehend/latest/APIReference/API_ListTopicsDetectionJobs.html)operación y consulte la información sobre un trabajo que utilice la [DescribeTopicsDetectionJob](https://docs.aws.amazon.com/comprehend/latest/APIReference/API_DescribeTopicsDetectionJob.html)operación. El contenido entregado a los buckets de Amazon S3 puede contener contenido del cliente. Para obtener más información sobre la eliminación de información confidencial, consulte [¿Cómo puedo vaciar un bucket de S3?](https://docs.aws.amazon.com/AmazonS3/latest/userguide/empty-bucket.html) o [¿Cómo elimino un bucket de S3?](https://docs.aws.amazon.com/AmazonS3/latest/userguide/delete-bucket.html).

Los documentos deben ser archivos con formato UTF-8. Puede enviar sus documentos en dos formatos. En la siguiente tabla se muestran las opciones.


| Formato | Description (Descripción) | 
| --- | --- | 
| Un documento por archivo | Cada archivo contiene un documento de entrada. Esto es lo mejor para colecciones de documentos de gran tamaño. | 
| Un documento por línea | La entrada es un solo archivo. Cada línea de un archivo se considera un documento. Esta opción es la mejor para documentos cortos, como publicaciones en redes sociales. Cada línea debe terminar con un salto de línea (LF,\$1n), un retorno de carro (CR,\$1 r) o ambos (CRLF,\$1 r\$1n). El separador de líneas Unicode (u\$12028) no se puede usar para terminar una línea. | 

Para obtener más información, consulta el tipo de datos [InputDataConfig](https://docs.aws.amazon.com/comprehend/latest/APIReference/API_InputDataConfig.html).

Una vez que Amazon Comprehend procese su conjunto de documentos, devuelve un archivo comprimido que contiene dos archivos: `topic-terms.csv` y `doc-topics.csv`. Para obtener más información sobre el archivo de salida, consulte [OutputDataConfig](https://docs.aws.amazon.com/comprehend/latest/APIReference/API_OutputDataConfig.html). 

El primer archivo de salida, `topic-terms.csv`, es una lista de temas del conjunto. Para cada tema, la lista incluye, de forma predeterminada, los principales términos por tema según su importancia. Por ejemplo, si le da a Amazon Comprehend un conjunto de artículos de periódicos, podría devolver lo siguiente para describir los dos primeros temas del conjunto:


| Topic | Plazo | Peso | 
| --- | --- | --- | 
| 000 | equipo | 0,118533 | 
| 000 | partido | 0,106072 | 
| 000 | jugador | 0,031625 | 
| 000 | temporada | 0,023633 | 
| 000 | jugar | 0,021118 | 
| 000 | yarda | 0,024454 | 
| 000 | entrenador | 0,016012 | 
| 000 | partidos | 0,016191 | 
| 000 | fútbol | 0,015049 | 
| 000 | quarterback | 0,014239 | 
| 001 | copa | 0,205236 | 
| 001 | alimento | 0,040686 | 
| 001 | minutos | 0,036062 | 
| 001 | adición | 0,029697 | 
| 001 | cucharada | 0,028789 | 
| 001 | aceite | 0,021254 | 
| 001 | pimienta | 0,022205 | 
| 001 | cucharadita | 0,020040 | 
| 001 | vino | 0,016588 | 
| 001 | azúcar | 0,015101 | 

Los pesos representan una distribución de probabilidad entre las palabras de un tema determinado. Dado que Amazon Comprehend solo muestra las 10 palabras principales de cada tema, las ponderaciones no sumarán 1,0. En los raros casos en que un tema contenga menos de 10 palabras, las ponderaciones sumarán 1,0.

Las palabras se ordenan según su poder discriminatorio teniendo en cuenta su aparición en todos los temas. Normalmente es igual a su peso, pero en algunos casos, como en el caso de las palabras “jugar” y “yarda” de la tabla, el resultado es un orden que no coincide con el peso.

Usted puede especificar el número de temas que se van a devolver. Por ejemplo, si le pide a Amazon Comprehend que devuelva 25 temas, devolverá los 25 temas más destacados del conjunto. Amazon Comprehend puede detectar hasta 100 temas en un conjunto. Elija el número de temas en función de sus conocimientos del dominio. Puede ser necesario experimentar un poco para llegar al número correcto. 

El segundo archivo, `doc-topics.csv`, enumera los documentos relacionados con un tema y la proporción del documento que trata sobre el tema. Si usted especificó `ONE_DOC_PER_FILE`, el documento se identifica por el nombre del archivo. Si usted especificó `ONE_DOC_PER_LINE`, el documento se identifica por el nombre del archivo y el número de línea indexado a 0 dentro del archivo. Por ejemplo, Amazon Comprehend podría devolver lo siguiente para un conjunto de documentos enviados con un documento por archivo:


| Documento | Topic | Proporción | 
| --- | --- | --- | 
| sample-doc1 | 000 | 0,999330137 | 
| sample-doc2 | 000 | 0,998532187 | 
| sample-doc3 | 000 | 0,998384574 | 
| ... |   |   | 
| sample-docN | 000 | 3.57E-04 | 

Amazon Comprehend utiliza información del *conjunto de datos de listas de lematización de MBM*, que está disponible [aquí](https://github.com/michmech/lemmatization-lists) con la licencia de [base de datos abierta](https://opendatacommons.org/licenses/odbl/1-0/) (L) v1.0. ODb

# Modos de procesamiento de documentos
<a name="concepts-processing-modes"></a>

Amazon Comprehend admite tres modos de procesamiento de documentos. El modo que elija dependerá del número de documentos que necesite procesar y de la rapidez con la que necesite ver los resultados:
+ **Sincrónico de un solo documento**: llama a Amazon Comprehend con un solo documento y recibe una respuesta sincrónica que se envía a su aplicación (o a la consola) de inmediato. 
+ **Sincrónico de varios documentos**: llama a la API de Amazon Comprehend con una colección de hasta 25 documentos y recibe una respuesta sincrónica.
+ **Lote asíncrono**: para una colección de documentos grande, coloque los documentos en un bucket de Amazon S3 e inicie un trabajo asincrónico (mediante operaciones de consola o API) para analizar los documentos. Amazon Comprehend almacena los resultados del análisis en el S3 bucket/folder que especifique en la solicitud.

**Topics**
+ [Procesamiento de un solo documento](#how-single)
+ [Procesamiento sincrónico de varios documentos](#how-batch)
+ [Procesamiento por lotes asincrónico](#how-async)

## Procesamiento de un solo documento
<a name="how-single"></a>

Las operaciones de un solo documento son operaciones sincrónicas que devuelven los resultados del análisis del documento directamente a la aplicación. Utiliza operaciones sincrónicas de un solo documento cuando crea una aplicación interactiva que funcione en un documento a la vez.

Para obtener más información sobre las operaciones sincrónicas de la API, consulte [Análisis en tiempo real mediante los modelos integrados](realtime-console-analysis.md) (para la consola) y [Análisis en tiempo real mediante la API](using-api-sync.md).

## Procesamiento sincrónico de varios documentos
<a name="how-batch"></a>

Si desea procesar varios documentos, puede utilizar las operaciones de API de `Batch*` para enviar más de un documento a Amazon Comprehend a la vez. Puede enviar hasta 25 documentos en cada solicitud. Amazon Comprehend devuelve una lista de respuestas, una para cada documento de la solicitud. Las solicitudes realizadas con estas operaciones son sincrónicas. La aplicación llama a la operación y, a continuación, espera la respuesta del servicio. 

El uso de `Batch*` las operaciones es idéntico a llamar al documento único APIs para cada uno de los documentos de la solicitud. Su uso APIs puede mejorar el rendimiento de sus aplicaciones.

La entrada de cada una de ellas APIs es una estructura JSON que contiene los documentos que se van a procesar. Debe configurar el idioma de entrada para todas las operaciones, excepto para `BatchDetectDominantLanguage`. Puede definir solo un idioma de entrada para cada solicitud. Por ejemplo, la siguiente es la entrada de la operación `BatchDetectEntities`. Contiene dos documentos y está en inglés.

```
{
   "LanguageCode": "en",
   "TextList": [
      "I have been living in Seattle for almost 4 years",
      "It is raining today in Seattle"
   ]
}
```

La respuesta de una operación `Batch*` contiene dos listas, la `ResultList` y la `ErrorList`. La `ResultList` contiene un registro por cada documento que se haya procesado correctamente. El resultado de cada documento de la solicitud es idéntico al resultado que obtendría si ejecutara una sola operación de documento en el documento. A los resultados de cada documento se les asigna un índice en función del orden de los documentos en el archivo de entrada. La respuesta de la operación `BatchDetectEntities` es:

```
{
   "ResultList"  : [
      {
         "Index": 0,
         "Entities": [
            {
               "Text": "Seattle", 
               "Score": 0.95, 
               "Type": "LOCATION", 
               "BeginOffset": 22, 
               "EndOffset": 29
            },
            {
               "Text": "almost 4 years", 
               "Score": 0.89, 
               "Type": "QUANTITY", 
               "BeginOffset": 34, 
               "EndOffset": 48
            }
         ]
      },
      {
         "Index": 1,
         "Entities": [
            {
              "Text": "today",
              "Score": 0.87,
              "Type": "DATE",
              "BeginOffset": 14,
              "EndOffset": 19
            },
            {
               "Text": "Seattle",
               "Score": 0.96,
               "Type": "LOCATION",
               "BeginOffset": 23,
               "EndOffset": 30
            }
         ]
      }
   ],
   "ErrorList": []
}
```

Cuando se produce un error en la solicitud, la respuesta contiene una `ErrorList` que identifica los documentos que contenían el error. El documento se identifica por su índice en la lista de entradas. Por ejemplo, la siguiente entrada de la operación `BatchDetectLanguage` contiene un documento que no puede procesarse:

```
{
   "TextList": [
     "hello friend", 
     "$$$$$$",
     "hola amigo"
   ]       
}
```

La respuesta de Amazon Comprehend incluye una lista de errores que identifica el documento que contenía el error:

```
{
    "ResultList": [
        {
          "Index": 0,
          "Languages":[
            {
              "LanguageCode":"en",
              "Score": 0.99
            }
          ]
        },
        {
          "Index": 2
          "Languages":[
            {
              "LanguageCode":"es",
              "Score": 0.82
            }
          ]
        }
    ],
    "ErrorList": [
      {
        "Index": 1,
        "ErrorCode": "InternalServerException",
        "ErrorMessage": "Unexpected Server Error. Please try again."
      }
    ]
}
```

Para obtener más información sobre las operaciones de la API del lote sincrónico, consulte [Lote en tiempo real APIs](using-api-sync.md#get-started-batch).

## Procesamiento por lotes asincrónico
<a name="how-async"></a>

Para analizar documentos y colecciones de documentos de gran tamaño, utilice las operaciones asíncronas de Amazon Comprehend.

Para analizar un conjunto de documentos, debe llevar a cabo los siguientes pasos:

1. Almacene los documentos en un bucket de Amazon S3.

1. Inicie uno o más trabajos de análisis para analizar los documentos.

1. Supervise el progreso de los trabajos de análisis.

1. Recupere los resultados del análisis de un bucket de S3 cuando se complete el trabajo.

Para obtener más información sobre las operaciones asíncronas de la API, consulte [Ejecución de trabajos de análisis mediante la consola](analysis-jobs.md) (para la consola) y [Trabajos de análisis asíncrono mediante la API](api-async.md).