

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

# Operaciones de la API de análisis de texto
<a name="comprehendmedical-textanalysis"></a>

Utilice Amazon Comprehend Medical para examinar documentos clínicos y obtener información diversa sobre su contenido mediante modelos de procesamiento de lenguaje natural (NLP) previamente entrenados. Puede realizar análisis tanto en archivos individuales como en lotes de varios archivos almacenados en un bucket de Amazon Simple Storage Service (S3).

Con Amazon Comprehend Medical, puede realizar las tareas siguientes en sus documentos:
+ [Detección de entidades (versión 2)](textanalysis-entitiesv2.md): examinar textos clínicos no estructurados para detectar referencias textuales a información médica, como afecciones, tratamientos, pruebas y resultados, y medicamentos. Esta versión usa un modelo diferente al de la API Detect entities original y hay algunos cambios en la salida.
+ [Detección de información sanitaria protegida (PHI)](textanalysis-phi.md): examinar textos clínicos no estructurados para detectar referencias textuales a información sanitaria protegida (PHI), como nombres y direcciones.

Amazon Comprehend Medical también incluye varias operaciones de API que puede utilizar para realizar análisis de texto por lotes en documentos clínicos. Para obtener más información sobre cómo utilizar estas operaciones de la API, consulte [Lote de análisis de texto APIs](textanalysis-batchapi.md).

**Topics**
+ [Detección de entidades (versión 2)](textanalysis-entitiesv2.md)
+ [Detección de información sanitaria protegida (PHI)](textanalysis-phi.md)
+ [Lote de análisis de texto APIs](textanalysis-batchapi.md)

# Detección de entidades (versión 2)
<a name="textanalysis-entitiesv2"></a>

Utilice la **DetectEntitiesV2** para detectar entidades en archivos individuales o la **StartEntitiesDetectionV2Job** para el análisis por lotes en varios archivos. Puede detectar entidades en las siguientes categorías:
+ `ANATOMY:` detecta las referencias a partes o sistemas del cuerpo y sus localizaciones.
+ `BEHAVIORAL_ENVIRONMENTAL_SOCIAL`: detecta los comportamientos y las condiciones del entorno que afectan a la salud de una persona. Esto incluye el consumo de tabaco, alcohol o drogas recreativas, las alergias, el sexo y la raza o el grupo étnico.
+ `MEDICAL_CONDITION:` detecta los signos, síntomas y diagnósticos de afecciones médicas.
+ `MEDICATION:` detecta la información sobre los medicamentos y las dosis del paciente.
+ `PROTECTED_HEALTH_INFORMATION:` detecta la información personal del paciente.
+ `TEST_TREATMENT_PROCEDURE:` detecta los procedimientos que se utilizan para determinar una afección médica.
+ `TIME_EXPRESSION:` detecta entidades relacionadas con el tiempo cuando están asociadas a una entidad detectada. 

La operación **DetectEntitiesV2** detecta las seis categorías. Para el análisis específico de la detección de PHI, utilice **DetectPHI** en archivos individuales y **Start PHIDetection Job** para el análisis por lotes. 

 Amazon Comprehend Medical detecta información de las siguientes clases:
+ *Entidad*: referencia textual al nombre de objetos relevantes, como personas, tratamientos, medicamentos y afecciones médicas. Por ejemplo, `ibuprofen`. 
+ *Categoría*: agrupación general a la que pertenece una entidad. Por ejemplo, el ibuprofeno forma parte de la categoría `MEDICATION`.
+ *Tipo*: el tipo de entidad detectada dentro de una sola categoría. Por ejemplo, el ibuprofeno pertenece al tipo `GENERIC_NAME` de la categoría `MEDICATION`.
+ *Atributo*: información relacionada con una entidad, como la dosis de un medicamento. Por ejemplo, `200 mg` es un atributo de la entidad del ibuprofeno.
+ *Característica*: algo que Amazon Comprehend Medical entiende sobre una entidad, en función del contexto. Por ejemplo, un medicamento tiene la característica `NEGATION` si el paciente no lo está tomando.
+ *Tipo de relación*: la relación entre una entidad y un atributo.

Amazon Comprehend Medical le indica la ubicación de una entidad en el texto de entrada. En la consola de Amazon Comprehend, la ubicación se muestra de forma gráfica. Cuando usa la API, muestra la ubicación mediante un desplazamiento numérico.

Cada entidad y atributo incluye una puntuación que indica el nivel de confianza que Amazon Comprehend Medical tiene en la precisión de los elementos detectados. Cada atributo también tiene una puntuación de relación. La puntuación indica el nivel de confianza que Amazon Comprehend Medical tiene en la precisión de la relación entre el atributo y su entidad principal. Identifique el umbral de confianza apropiado para su caso de uso. Utilice umbrales de confianza altos en situaciones que requieran una gran precisión. Excluya los datos que no alcancen el umbral.

## Categoría de anatomía
<a name="anatomy-v2"></a>

La categoría `ANATOMY` detecta las referencias a partes o sistemas del cuerpo y sus localizaciones. 

### Tipos
<a name="anatomy-type-v2"></a>
+ `SYSTEM_ORGAN_SITE`: sistemas corporales, localizaciones o regiones anatómicas y partes del cuerpo.

### Atributos
<a name="anatomy-attribute-v2"></a>
+ `DIRECTION`: términos direccionales. Por ejemplo, izquierda, derecha, medial, lateral, superior, inferior, posterior, anterior, distal, proximal, contralateral, bilateral, ipsilateral, dorsal, ventral, etc.

## Categoría de salud conductual, ambiental y social
<a name="behavioral-category-v2"></a>

La categoría `BEHAVIORAL_ENVIRONMENTAL_SOCIAL` detecta referencias a comportamientos y condiciones del entorno que afectan a la salud de una persona.

### Tipo
<a name="behavioral-type-v2"></a>
+ `ALCOHOL_CONSUMPTION`: define el consumo de alcohol por parte del paciente en términos de estado de consumo, frecuencia, cantidad y duración.
+ `ALLERGIES`: define las alergias y las respuestas del paciente a los alérgenos.
+ `GENDER`: una identificación de las características de la identidad de género.
+ `RACE_ETHNICITY`: un constructo sociopolítico de la identificación de un paciente con un grupo racial y étnico concreto.
+ `REC_DRUG_USE`: define el consumo de drogas recreativas por parte del paciente en términos de estado de consumo, frecuencia, cantidad y duración.
+ `TOBACCO_USE`: define el consumo de tabaco por parte del paciente en términos de estado de consumo, frecuencia, cantidad y duración.Atributos

Los siguientes atributos detectados solo se aplican a los tipos `ALCOHOL_CONSUMPTION`, `TOBACCO_USE` y `REC_DRUG_USE`:
+ `AMOUNT`: la cantidad consumida de alcohol, tabaco o droga recreativa.
+ `DURATION`: cuánto tiempo se ha consumido el alcohol, el tabaco o la droga recreativa.
+ `FREQUENCY`: con qué frecuencia se consume el alcohol, el tabaco o la droga recreativa.

### Características
<a name="behavioral-trait-v2"></a>

Las siguientes características detectadas solo se aplican a los tipos `ALCOHOL_CONSUMPTION`, `ALLERGIES`, `TOBACCO_USE` y `REC_DRUG_USE`:
+ `NEGATION`: una indicación de que una acción o un resultado son negativos o no se están realizando.
+ `PAST_HISTORY`: una indicación de que el consumo de alcohol, tabaco o drogas recreativas se produjo en el pasado (antes del encuentro actual).

## Categoría de afección médica
<a name="medical-condition-v2"></a>

La categoría `MEDICAL_CONDITION` detecta los signos, síntomas y diagnósticos de afecciones médicas. Esta categoría tiene un tipo de entidad, cuatro atributos y cuatro características. Se pueden asociar una o más características a un tipo. La información contextual sobre los atributos y su relación con el diagnóstico se detecta y se asocia con `DX_NAME` a través de `RELATIONSHIP_EXTRACTION.`. Por ejemplo, en el texto “chronic pain in left leg” (dolor crónico en la pierna izquierda), “chronic” (crónico) se detecta como atributo `ACUITY`, “left” (izquierda) como atributo `DIRECTION` y “leg” (pierna) como atributo `SYSTEM_ORGAN_SITE`. Las relaciones de cada uno de estos atributos se asocian con la afección médica “pain” (dolor), y se indica una puntuación de confianza.

### Tipos
<a name="medical-condition-type-v2"></a>
+ `DX_NAME`: se enumeran todas las afecciones médicas. El tipo `DX_NAME` incluye la enfermedad actual, el motivo de la visita y la historia clínica.

### Atributos
<a name="medical-condition-attribute-v2"></a>
+ `ACUITY`: determinación de una enfermedad como crónica, aguda, repentina, persistente o gradual. 
+ `DIRECTION`: términos direccionales. Por ejemplo, izquierda, derecha, medial, lateral, superior, inferior, posterior, anterior, distal, proximal, contralateral, bilateral, ipsilateral, dorsal o ventral.
+ `SYSTEM_ORGAN_SITE`: localización anatómica.
+ `QUALITY`: cualquier término descriptivo de la afección médica, como el estadio o el grado.

### Características
<a name="medical-condition-trait-v2"></a>
+ `DIAGNOSIS`: una afección médica que se determina como la causa o el resultado de los síntomas. Los síntomas se pueden detectar mediante exploraciones físicas, informes de laboratorio o radiológicos o por cualquier otro medio.
+ `HYPOTHETICAL`: una indicación de que una afección médica se expresa como una hipótesis.
+ `LOW_CONFIDENCE`: una indicación de que una afección médica se expresa como de alta incertidumbre. Esto no está directamente relacionado con las puntuaciones de confianza proporcionadas.
+ `NEGATION`: una indicación de que una acción o un resultado son negativos o no se están realizando.
+ `PERTAINS_TO_FAMILY`: una indicación de que una afección médica es relevante para la familia del paciente, no para el paciente.
+ `SIGN`: una afección médica indicada por el médico.
+ `SYMPTOM`: una afección médica indicada por el paciente.

## Categoría de medicamento
<a name="medication-v2"></a>

La categoría `MEDICATION` detecta información sobre los medicamentos y las dosis para el paciente. Se pueden aplicar uno o varios atributos a un tipo.

### Tipos
<a name="medication-type-v2"></a>
+ `BRAND_NAME`: el nombre de marca registrada del medicamento o agente terapéutico.
+ `GENERIC_NAME`: el nombre no comercial, el nombre del ingrediente o la fórmula del medicamento o agente terapéutico.

### Atributos
<a name="medication-attribute-v2"></a>
+ `DOSAGE`: la cantidad de medicamento prescrita.
+ `DURATION`: cuánto tiempo debe administrarse el medicamento.
+ `FORM`: la forma del medicamento.
+ `FREQUENCY`: la frecuencia de administración del medicamento. 
+ `RATE`: La velocidad de administración del medicamento (principalmente para infusiones de medicamentos o IVs).
+ `ROUTE_OR_MODE`: el método de administración del medicamento.
+ `STRENGTH`: la concentración del medicamento.

### Características
<a name="medication-trait-v2"></a>
+ `NEGATION`: cualquier indicación de que el paciente no está tomando un medicamento.
+ `PAST_HISTORY`: una indicación de que un medicamento se prescribió al paciente antes del encuentro actual.

## Categoría de información sanitaria protegida
<a name="protected-health-information-v2"></a>

La categoría `PROTECTED_HEALTH_INFORMATION` detecta la información personal del paciente. Consulte [Detección de información sanitaria protegida (PHI)](textanalysis-phi.md) para obtener más información sobre esta operación.

### Tipos
<a name="protected-health-information-types-v2"></a>
+ `ADDRESS`: todas las subdivisiones geográficas de una dirección de cualquier centro, unidad o sala de un centro.
+ `AGE`: todos los componentes de edad, intervalos de edades o cualquier edad mencionada. Esto incluye los de un paciente, sus familiares u otras personas. El valor predeterminado se expresa en años, a menos que se indique lo contrario.
+ `EMAIL`: cualquier dirección de correo electrónico.
+ `ID`: número de la Seguridad Social, de la historia clínica, de identificación de un centro, de una prueba clínica, de un certificado o una licencia, la matrícula del vehículo, el número de un dispositivo, el del centro de asistencia o de un proveedor. Esto también incluye cualquier número biométrico del paciente, como la altura, el peso o un valor de laboratorio. 
+ `NAME`: todos los nombres. Por lo general, los nombres del paciente, los familiares o el proveedor.
+ `PHONE_OR_FAX`: cualquier número de teléfono, fax o buscapersonas. No incluye los números de teléfono mencionados, como el 1-855-DÉJELO-YA y el 112.
+ `PROFESSION`: cualquier profesión o empleador asociado con el paciente o con sus familiares. No incluye la profesión del médico mencionado en la nota. 

## Categoría de prueba, tratamiento y procedimiento
<a name="test-treatment-procedure-v2"></a>

La categoría `TEST_TREATMENT_PROCEDURE` detecta los procedimientos que se utilizan para determinar una afección médica. Uno o varios atributos pueden estar relacionados con una entidad de tipo `TEST_NAME`.

### Tipos
<a name="test-treatment-procedure-types-v2"></a>
+ `PROCEDURE_NAME`: intervenciones que consisten en una acción única que se realiza en el paciente para tratar una afección médica o para brindarle atención sanitaria.
+ `TEST_NAME`: procedimientos que se realizan en un paciente con fines de diagnóstico, medición, detección o valoración y que podrían tener un valor resultante. Esto incluye cualquier procedimiento, proceso, evaluación o calificación para determinar un diagnóstico, descartar o detectar una afección, o para puntuar o valorar a un paciente.
+ `TREATMENT_NAME`: intervenciones realizadas durante un periodo de tiempo para combatir una enfermedad o un trastorno. Esto incluye grupos de medicamentos, como antivirales y vacunas.

### Atributos
<a name="test-treatment-procedure-attributes-v2"></a>
+ `TEST_VALUE`: el resultado de una prueba. Se aplica solo al tipo de entidad `TEST_NAME`.
+ `TEST_UNIT`: la unidad de medida que puede acompañar al valor de la prueba. Se aplica solo al tipo de entidad `TEST_NAME`.

### Características
<a name="test-treatment-procedure-traits-v2"></a>
+ `FUTURE`: una indicación de que una prueba, un tratamiento o un procedimiento se refiere a una acción o un evento que tendrá lugar después del tema de abordado en las notas.
+ `HYPOTHETICAL`: una indicación de que una prueba, un tratamiento o un procedimiento se expresa como una hipótesis
+ `NEGATION`: una indicación de que una acción o un resultado son negativos o no se están realizando.
+ `PAST_HISTORY`: una indicación de que una prueba, un tratamiento o un procedimiento se realizó al paciente antes del encuentro actual.

## Categoría de expresión de tiempo
<a name="time-expression-v2"></a>

La categoría `TIME_EXPRESSION` detecta entidades relacionadas con el tiempo. Esto incluye entidades como fechas y expresiones de tiempo; por ejemplo, “three days ago” (hace tres días), “today” (hoy), “currently” (actualmente), “day of admission” (fecha de ingreso), “last month” (el mes pasado) o “16 days” (16 días). Los resultados de esta categoría solo se devuelven si están asociados a una entidad. Por ejemplo, “Yesterday, the patient took 200 mg of ibuprofen” (Ayer el paciente tomó 200 mg de ibuprofeno), devolvería `Yesterday` como una entidad `TIME_EXPRESSION` que se solapa con la entidad `GENERIC_NAME` “ibuprofen” (Ibuprofeno). Sin embargo, no se reconocería como entidad en el texto “Yesterday, the patient walked their dog” (Ayer el paciente sacó de paseo a su perro). 

### Tipos
<a name="time-expression-v2-categories"></a>
+ `TIME_TO_MEDICATION_NAME`: la fecha en que se tomó un medicamento. Los atributos específicos de este tipo son `BRAND_NAME` y `GENERIC_NAME`.
+ `TIME_TO_DX_NAME`: la fecha en que se produjo una afección médica. El atributo de este tipo es `DX_NAME`. 
+ `TIME_TO_TEST_NAME`: la fecha en que se realizó una prueba. El atributo de este tipo es `TEST_NAME`.
+ `TIME_TO_PROCEDURE_NAME`: la fecha en que se realizó un procedimiento. El atributo de este tipo es `PROCEDURE_NAME`.
+ `TIME_TO_TREATMENT_NAME`: la fecha en que se administró un tratamiento. El atributo de este tipo es `TREATMENT_NAME`.

### Tipo de relación
<a name="time-expression-v2-relationship-type"></a>
+  La relación entre una entidad y un atributo. El tipo de relación `Relationship_type` reconocida es la siguiente: 

  `Overlap`: `TIME_EXPRESSION` se solapa con la entidad detectada.

# Detección de información sanitaria protegida (PHI)
<a name="textanalysis-phi"></a>

Utilice la operación **DetectPHI** cuando solo desee detectar datos de información sanitaria protegida (PHI) al analizar textos clínicos. Para detectar todas las entidades disponibles en el texto clínico, utilice **DetectEntitiesV2**.

Esta API es ideal para casos en los que solo se requiere detectar entidades de PHI. Para saber más sobre la información de las categorías no relacionadas con la PHI, consulte [Detección de entidades (versión 2)](textanalysis-entitiesv2.md).

**importante**  
 Amazon Comprehend Medical proporciona puntuaciones de confianza que indican el nivel de confianza en la precisión de las entidades detectadas. Evalúe estas puntuaciones de confianza e identifique el umbral de confianza adecuado para su caso de uso. Para casos específicos de cumplimiento normativo, le recomendamos que realice una revisión humana adicional o utilice algún otro método para confirmar la precisión de la PHI detectada.

De conformidad con la ley HIPAA, la PHI que se basa en una lista de 18 identificadores debe tratarse con especial cuidado. Amazon Comprehend Medical detecta las entidades asociadas a estos identificadores, pero estas entidades no se relacionan de forma unívoca con la lista especificada por el método Safe Harbor. Los textos clínicos no estructurados no contienen todos los identificadores, pero Amazon Comprehend Medical cubre todos los identificadores relevantes. Estos identificadores son datos que se pueden utilizar para identificar a un paciente individual, incluidos los de la lista de abajo. Para obtener más información, consulte la [privacidad de la información sanitaria](https://www.hhs.gov/hipaa/for-professionals/privacy/special-topics/de-identification/index.html) en el sitio web de *Salud y Servicios Humanos del Gobierno de EE. UU.*. 

Cada entidad relacionada con PHI incluye una puntuación (`Score` en la respuesta) que indica el nivel de confianza que Amazon Comprehend Medical tiene en la precisión de los elementos detectados. Identifique el umbral de confianza adecuado para su caso de uso y excluya las entidades que no lo alcancen. Cuando identifique PHI, puede ser mejor utilizar un umbral de confianza bajo en el filtrado para detectar más posibles entidades. Esto es especialmente cierto cuando no se utilizan los valores de las entidades detectadas en casos de uso en los que se requiera conformidad con las normativas.

Las siguientes entidades relacionadas con el PHI se pueden detectar ejecutando las operaciones **DetectPHI** o **DetectEntitiesV2**:


**Entidades de PHI detectadas**  

|  Entidad  |  Description (Descripción)  |  Categoría de HIPAA  | 
| --- | --- | --- | 
|  AGE  |  Todos los componentes de edad, intervalos de edades y cualquier edad mencionada, ya sea del paciente, un familiar u otras personas indicadas en la nota. El valor predeterminado se expresa en años, a menos que se indique lo contrario.  |  3. Fechas relacionadas con una persona  | 
| DATE | Cualquier fecha relacionada con el paciente o la atención sanitaria.  | 3. Fechas relacionadas con una persona | 
|  NAME  |  Todos los nombres mencionados en la nota clínica, que suelen ser del paciente, sus familiares o el proveedor.  |  1. Name  | 
|  PHONE\$1OR\$1FAX  |  Cualquier teléfono, fax o buscapersonas; excluidos los números de teléfono mencionados, como el 1-855-DÈJELO-YA y el 112.  |  4. Número de teléfono 5. Número de fax  | 
|  EMAIL  |  Cualquier dirección de correo electrónico.  |  6. Direcciones de correo electrónico  | 
|  ID  |  Cualquier tipo de número asociado a la identidad de un paciente. Esto incluye el número de la Seguridad Social, de la historia clínica, de identificación del centro, de ensayo clínico, de certificado o licencia, la matrícula del vehículo o el número de dispositivo. También incluye números biométricos y números que identifican el lugar de atención sanitaria o el proveedor.  |  7. Número de la Seguridad Social  8. Número de historia clínica 9. Número de seguro médico 10. Números de cuenta 11. Certificate/License números 12. Identificadores de vehículos 13. Números de dispositivos 16. Información biométrica 18. Cualquier otra característica identificativa  | 
|  URL  |  Cualquier URL web.  |  14. URLs  | 
|  ADDRESS  |  Esto incluye todas las subdivisiones geográficas de la dirección de cualquier centro, centro médico mencionado o sala de un centro.  |  2. Ubicación geográfica  | 
|  PROFESSION  |  Incluye cualquier profesión o empleador mencionado en una nota relacionado con el paciente o con sus familiares.  |  18. Cualquier otra característica identificativa  | 



**Ejemplo**  


El texto “Patient is John Smith, a 48-year-old teacher and resident of Seattle, Washington” (El paciente es John Smith, un profesor de 48 años y residente en Seattle, Washington) devuelve lo siguiente:
+ “John Smith” como *entidad* de tipo `NAME` en la categoría `PROTECTED_HEALTH_INFORMATION`.
+ “48” como *entidad* de tipo `AGE` en la categoría `PROTECTED_HEALTH_INFORMATION`.
+ “teacher” (profesor) como *entidad* de tipo `PROFESSION` (característica identificativa) de la categoría `PROTECTED_HEALTH_INFORMATION`.
+ “Seattle, Washington” como *entidad* `ADDRESS` de la categoría `PROTECTED_HEALTH_INFORMATION`.

En la consola de Amazon Comprehend Medical, esto se muestra de esta forma:

![\[Patient information card displaying name, age, profession, and address details.\]](http://docs.aws.amazon.com/es_es/comprehend-medical/latest/dev/images/patient.png)


Cuando se utiliza la operación **DetectPHI**, la respuesta aparece como se indica más abajo. Al utilizar la operación **Start PHIDetection Job**, Amazon Comprehend Medical crea un archivo en la ubicación de salida con esta estructura.

```
{
    "Entities": [
        {
            "Id": 0,
            "BeginOffset": 11,
            "EndOffset": 21,
            "Score": 0.997368335723877,
            "Text": "John Smith",
            "Category": "PROTECTED_HEALTH_INFORMATION",
            "Type": "NAME",
            "Traits": []
        },
        {
            "Id": 1,
            "BeginOffset": 25,
            "EndOffset": 27,
            "Score": 0.9998362064361572,
            "Text": "48",
            "Category": "PROTECTED_HEALTH_INFORMATION",
            "Type": "AGE",
            "Traits": []
        },
        {
            "Id": 2,
            "BeginOffset": 37,
            "EndOffset": 44,
            "Score": 0.8661606311798096,
            "Text": "teacher",
            "Category": "PROTECTED_HEALTH_INFORMATION",
            "Type": "PROFESSION",
            "Traits": []
        },
        {
            "Id": 3,
            "BeginOffset": 61,
            "EndOffset": 68,
            "Score": 0.9629441499710083,
            "Text": "Seattle",
            "Category": "PROTECTED_HEALTH_INFORMATION",
            "Type": "ADDRESS",
            "Traits": []
        },
        {
            "Id": 4,
            "BeginOffset": 78,
            "EndOffset": 88,
            "Score": 0.38217034935951233,
            "Text": "Washington",
            "Category": "PROTECTED_HEALTH_INFORMATION",
            "Type": "ADDRESS",
            "Traits": []
        }
    ],
    "UnmappedAttributes": []
}
```

# Lote de análisis de texto APIs
<a name="textanalysis-batchapi"></a>

Utilice Amazon Comprehend Medical para analizar textos médicos almacenados en un bucket de Amazon S3. Puede analizar hasta 10 GB de documentos en un lote. La consola se utiliza para crear y gestionar trabajos de análisis por lotes o se utiliza por lotes APIs para detectar entidades médicas, incluida la información de salud protegida (PHI). El APIs inicio, la parada, la lista y la descripción de los trabajos de análisis de lotes en curso.

 Para ver información sobre precios de análisis por lotes y otras operaciones de Amazon Comprehend Medical, consulte [esta página](https://aws.amazon.com/comprehend/medical/pricing/).

## Aviso importante
<a name="important-notice"></a>

Las operaciones de análisis por lotes de Amazon Comprehend Medical no sustituyen el asesoramiento, el diagnóstico ni el tratamiento médico profesional. Identifique el umbral de confianza adecuado para su caso de uso y utilice umbrales de confianza altos en situaciones que requieran una alta precisión. En ciertos casos de uso, los resultados deberán ser revisados y verificados por revisores humanos debidamente entrenados. Todas las operaciones de Amazon Comprehend Medical solo deben utilizarse en escenarios de atención al paciente después de que un profesional médico debidamente formado haya revisado su exactitud y buen juicio médico.

## Realizar el análisis de lotes mediante el APIs
<a name="performing-batch-api"></a>

Puede ejecutar un trabajo de análisis por lotes mediante la consola Amazon Comprehend Medical o Amazon Comprehend APIs Medical Batch.

**Requisitos previos**

 Cuando utilice la API de Amazon Comprehend Medical, cree una política de AWS Identity Access and Management (IAM) y asóciela a un rol de IAM. Para obtener más información sobre las políticas de confianza y los roles de IAM, consulte [Políticas y permisos de IAM](https://docs.aws.amazon.com/IAM/latest/UserGuide/access_policies.html). 

****

1. Cargue sus datos en un bucket de S3.

1. Para iniciar un nuevo trabajo de análisis, utilice la operación StartEntitiesDetection V2Job o la operación Start PHIDetection Job. Cuando inicie el trabajo, indique a Amazon Comprehend Medical el nombre del bucket de S3 que contiene los archivos de entrada y designe el bucket de salida de S3 donde se escribirán los archivos tras realizar el análisis por lotes.

1. Supervise el progreso del trabajo mediante la consola o la operación DescribeEntitiesDetection V2Job o la operación Describe PHIDetection Job. Además, ListEntitiesDetection V2Jobs y List PHIDetection Jobs permiten ver el estado de todas las ontologías que vinculan los trabajos de análisis por lotes.

1. Si necesita detener un trabajo en curso, utilice StopEntitiesDetection V2Job o Stop Job para detener el análisis. PHIDetection

1. Para ver los resultados de un trabajo de análisis, consulte el bucket de salida de S3 que configuró al iniciar el trabajo.

## Realización de un análisis por lotes mediante la consola
<a name="batch-api-console"></a>

****

1. Cargue sus datos en un bucket de S3.

1. Para iniciar un nuevo trabajo, seleccione el tipo de análisis que va a realizar. A continuación, indique el nombre del bucket de S3 que contiene los archivos de entrada y el nombre del bucket de S3 donde desea enviar los archivos de salida.

1. Monitorice el estado del trabajo mientras está en marcha. En la consola puede ver todas las operaciones de análisis por lotes y su estado, incluido el momento en que se inició y finalizó el análisis.

1. Para ver los resultados de un trabajo de análisis, consulte el bucket de S3 de salida que configuró al iniciar el trabajo. 

## Políticas de IAM para operaciones por lotes
<a name="batch-iam"></a>

La función de IAM que denomina lote Amazon Comprehend Medical APIs debe tener una política que conceda acceso a los depósitos S3 que contienen los archivos de entrada y salida. También se le debe asignar una relación de confianza que permita al servicio Amazon Comprehend Medical asumir ese rol. Para obtener más información sobre las políticas de confianza y los roles de IAM, consulte [Roles de IAM](https://docs.aws.amazon.com/IAM/latest/UserGuide/id_roles.html).

El rol debe tener la siguiente política de IAM.

------
#### [ JSON ]

****  

```
{
    "Version":"2012-10-17",		 	 	 
    "Statement": [
        {
            "Action": [
                "s3:GetObject"
            ],
            "Resource": [
                "arn:aws:s3:::input-bucket/*"
            ],
            "Effect": "Allow"
        },
        {
            "Action": [
                "s3:ListBucket"
            ],
            "Resource": [
                "arn:aws:s3:::input-bucket",
                "arn:aws:s3:::output-bucket"
            ],
            "Effect": "Allow"
        },
        {
            "Action": [
                "s3:PutObject"
            ],
            "Resource": [
                "arn:aws:s3:::output-bucket/*"
            ],
            "Effect": "Allow"
        }
    ]
}
```

------

El rol debe tener la siguiente relación de confianza. Se recomienda utilizar las claves de condición `aws:SourceAccount ` y `aws:SourceArn` para evitar el problema de seguridad del suplente confuso. Para obtener más información sobre el problema del diputado confuso y sobre cómo proteger su AWS cuenta, consulte [El problema del diputado confuso en la](https://docs.aws.amazon.com/IAM/latest/UserGuide/confused-deputy.html) documentación de IAM.

------
#### [ JSON ]

****  

```
{
   "Version":"2012-10-17",		 	 	 
   "Statement":[
      {
         "Effect":"Allow",
         "Principal":{
            "Service":[
               "comprehendmedical.amazonaws.com"
            ]
         },
         "Action":"sts:AssumeRole",
         "Condition": {
            "StringEquals": {
               "aws:SourceAccount": "account_id"
            },
            "ArnLike": {
               "aws:SourceArn": "arn:aws:comprehendmedical:us-east-1:account_id:*"
            }
         }
      }
   ]
}
```

------

## Archivos de salida de análisis por lotes
<a name="batch-ouput"></a>

Amazon Comprehend Medical crea un archivo de salida para cada archivo de entrada de un lote. Este archivo tiene la extensión `.out`. Amazon Comprehend Medical crea primero un directorio en el bucket S3 de salida con *AwsAccountId* el nombre *JobType* *JobId* - - y, a continuación, escribe todos los archivos de salida del lote en este directorio. Amazon Comprehend Medical crea este nuevo directorio para que los datos de salida de un trabajo no sobrescriban los de otro.

La salida de una operación por lotes es igual a la de una operación sincrónica. Para ver ejemplos de la salida generada por Amazon Comprehend Medical, consulte [Detección de entidades (versión 2)](textanalysis-entitiesv2.md).

Cada operación por lotes produce tres archivos de manifiesto que contienen información sobre el trabajo. 
+ `Manifest`: ofrece un resumen del trabajo. Proporciona información sobre los parámetros utilizados, el tamaño total del trabajo y el número de archivos procesados.
+ `success`: proporciona información sobre los archivos que se han procesado correctamente. Incluye el nombre de los archivos de entrada y de salida, y el tamaño del archivo de entrada.
+ `unprocessed`: muestra los archivos que el trabajo por lotes no procesó, incluidos códigos de error y mensajes de error por archivo.

Amazon Comprehend Medical escribe los archivos en el directorio de salida que especificó para el trabajo por lotes. El archivo de manifiesto de resumen se escribirá en la carpeta de salida, junto con una carpeta titulada `Manifest_AccountId-Operation-JobId`. Dentro de la carpeta del manifiesto hay una carpeta `success` que contiene el manifiesto de los archivos procesados. También se incluye una carpeta `failed` que contiene el manifiesto de los archivos sin procesar. En las secciones siguientes se muestra la estructura de archivos de manifiesto.

### Archivo de manifiesto de procesamiento por lotes
<a name="batch-manifest"></a>

Esta es la estructura JSON del archivo de manifiesto por lotes:

```
{"Summary" : 
    {"Status" : "COMPLETED | FAILED | PARTIAL_SUCCESS | STOPPED", 
    "JobType" : "EntitiesDetection | PHIDetection", 
    "InputDataConfiguration" : {
        "Bucket" : "input bucket", 
        "Path" : "path to files/account ID-job type-job ID" 
    }, "OutputDataConfiguration" : {
        "Bucket" : "output bucket", 
        "Path" : "path to files" 
    }, 
    "InputFileCount" : number of files in input bucket, 
    "TotalMeteredCharacters" : total characters processed from all files, 
    "UnprocessedFilesCount" : number of files not processed, 
    "SuccessFilesCount" : total number of files processed, 
    "TotalDurationSeconds" : time required for processing, 
    "SuccessfulFilesListLocation" : "path to file", 
    "UnprocessedFilesListLocation" : "path to file",
    "FailedJobErrorMessage": "error message or if not applicable,
              The status of the job is completed"
    } 
}
```

### Archivo de manifiesto de los archivos procesados
<a name="batch-success"></a>

Esta es la estructura JSON del archivo que contiene información sobre los archivos procesados correctamente:

```
{
        "Files": [{
               "Input": "input path/input file name",
               "Output": "output path/output file name",
               "InputSize": size in bytes of input file
        }, {
               "Input": "input path/input file name",
               "Output": "output path/output file name",
               "InputSize": size in bytes of input file
        }]
}
```

### Archivo de manifiesto de los archivos no procesados
<a name="batch-unprocessed"></a>

Esta es la estructura JSON del archivo de manifiesto que contiene información sobre los archivos no procesados:

```
{
  "Files" : [ {
      "Input": "file_name_that_failed",
      "ErrorCode": "error code for exception",
      "ErrorMessage": "explanation of the error code and suggestions"
  }, 
  { ...}
  ]
}
```