

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

# Operações de API de análise de texto
<a name="comprehendmedical-textanalysis"></a>

Use o Amazon Comprehend Medical para examinar documentos clínicos e obter vários insights sobre seu conteúdo usando modelos pré-treinados de processamento de linguagem natural (PLN). Você pode realizar a análise em arquivos únicos ou em lote ou em vários arquivos armazenados em um bucket do Amazon Simple Storage Service (S3).

Com o Amazon Comprehend Medical, você pode realizar o seguinte em seus documentos:
+ [Detectar entidades (versão 2)](textanalysis-entitiesv2.md): examine textos clínicos não estruturados para detectar referências textuais para informações médicas, como condição médica, tratamento, testes e resultados e medicamentos. Essa versão usa um modelo diferente da API Detect entities original, e há algumas alterações na saída.
+ [Detectar PHI](textanalysis-phi.md): examine textos clínicos não estruturados para detectar referências textuais a informações de saúde protegidas (PHI), como nomes e endereços.

O Amazon Comprehend Medical também inclui várias operações de API que você pode usar para realizar análises de texto em lote em documentos clínicos. Para saber mais sobre como usar essas operações da API, consulte [Lote de análise de texto APIs](textanalysis-batchapi.md).

**Topics**
+ [Detectar entidades (versão 2)](textanalysis-entitiesv2.md)
+ [Detectar PHI](textanalysis-phi.md)
+ [Lote de análise de texto APIs](textanalysis-batchapi.md)

# Detectar entidades (versão 2)
<a name="textanalysis-entitiesv2"></a>

Use o **DetectEntitiesV2** para detectar entidades em arquivos únicos ou o **StartEntitiesDetectionV2Job** para análise em lote em vários arquivos. Você pode detectar entidades nas seguintes categorias:
+ `ANATOMY:` Detecta referências às partes do corpo ou sistemas corporais e às localizações dessas partes ou sistemas.
+ `BEHAVIORAL_ENVIRONMENTAL_SOCIAL`: detecta os comportamentos e condições do ambiente que afetam a saúde de uma pessoa. Isso inclui uso de tabaco, consumo de álcool, uso de drogas recreativas, alergias, sexo e raça/etnia.
+ `MEDICAL_CONDITION:` Detecta os sinais, sintomas e diagnósticos de condições médicas.
+ `MEDICATION:` Detecta informações sobre medicamentos e dosagens para o paciente.
+ `PROTECTED_HEALTH_INFORMATION:` detecta as informações pessoais do paciente.
+ `TEST_TREATMENT_PROCEDURE:` detecta os procedimentos usados para determinar uma condição médica.
+ `TIME_EXPRESSION:` detecta entidades relacionadas ao momento em que estão associadas a uma entidade detectada. 

Todas as seis categorias são detectadas pela operação **DetectEntitiesV2**. Para análises específicas de detecção de PHI, use **DetectPHI** em arquivos únicos e Start **Job PHIDetection** para análise em lote. 

 O Amazon Comprehend Medical detecta informações nas seguintes classes:
+ *Entidade:* uma referência textual ao nome de objetos relevantes, como pessoas, tratamentos, medicamentos e condições médicas. Por exemplo, .`ibuprofen` 
+ *Categoria:* o agrupamento generalizado ao qual uma entidade detectada pertence. Por exemplo, "Ibuprofeno" faz parte da categoria `MEDICATION`.
+ *Tipo:* o tipo de entidade detectada em uma única categoria. Por exemplo, "Ibuprofeno" está no tipo `GENERIC_NAME` da categoria `MEDICATION`.
+ *Atributo:* informações relacionadas a uma entidade detectada, como a dosagem de um medicamento. Por exemplo, `200 mg` é um atributo da entidade "Ibuprofeno".
+ *Característica:* algo que o Amazon Comprehend Medical entende sobre uma entidade, com base no contexto. Por exemplo, um medicamento tem a característica `NEGATION` quando o paciente não está fazendo uso dele.
+ *Tipo de relacionamento:* o relacionamento entre uma entidade e um atributo.

O Amazon Comprehend Medical fornece a localização de uma entidade no texto de entrada. No console do Amazon Comprehend, ele mostra a localização graficamente. Quando você usa a API, ela mostra a localização por deslocamento numérico.

Cada entidade e atributo inclui uma pontuação que indica o nível de confiança que o Amazon Comprehend Medical tem na precisão da detecção. Cada atributo também tem uma pontuação de relacionamento. A pontuação indica o nível de confiança que o Amazon Comprehend Medical tem na precisão da relação entre o atributo e sua entidade mãe. Identifique o limite de confiança certo para o seu caso de uso. Use limites de alta confiança em situações que exijam grande precisão. Filtre os dados que não atingem o limite.

## Categoria da anatomia
<a name="anatomy-v2"></a>

A categoria `ANATOMY` detecta referências às partes do corpo ou sistemas corporais e às localizações dessas partes ou sistemas. 

### Tipos
<a name="anatomy-type-v2"></a>
+ `SYSTEM_ORGAN_SITE`: sistemas corporais, localizações ou regiões anatômicas e locais corporais.

### Atributos
<a name="anatomy-attribute-v2"></a>
+ `DIRECTION`: termos direcionais. Por exemplo, esquerda, direita, medial, lateral, superior, inferior, posterior, anterior, distal, proximal, contralateral, bilateral, ipsilateral, dorsal, ventral e assim por diante.

## Categoria de saúde comportamental, ambiental e social
<a name="behavioral-category-v2"></a>

A categoria `BEHAVIORAL_ENVIRONMENTAL_SOCIAL` detecta os comportamentos e condições do ambiente que afetam a saúde de uma pessoa.

### Tipo
<a name="behavioral-type-v2"></a>
+ `ALCOHOL_CONSUMPTION`: define o consumo de álcool do paciente em termos de status de uso, frequência, quantidade e duração.
+ `ALLERGIES`: define as alergias do paciente e as respostas aos alérgenos.
+ `GENDER`: uma identificação das características da identidade de gênero.
+ `RACE_ETHNICITY`: uma construção sociopolítica da identificação de um paciente com grupos raciais e étnicos específicos.
+ `REC_DRUG_USE`: define o consumo de álcool do paciente em termos de status de uso, frequência, quantidade e duração.
+ `TOBACCO_USE`: define o consumo de álcool do paciente em termos de status de uso, frequência, quantidade e duração.Atributos

Os seguintes atributos detectados se aplicam somente aos tipos `ALCOHOL_CONSUMPTION`, `TOBACCO_USE` e`REC_DRUG_USE`:
+ `AMOUNT`: a quantidade de álcool, tabaco ou drogas recreativas usadas.
+ `DURATION`: há quanto tempo o álcool, o tabaco ou a droga recreativa foram usados.
+ `FREQUENCY`: a frequência de álcool, tabaco ou drogas recreativas usados.

### Características
<a name="behavioral-trait-v2"></a>

As seguintes características detectadas se aplicam somente aos tipos `ALCOHOL_CONSUMPTION`, `ALLERGIES`, `TOBACCO_USE` e `REC_DRUG_USE`:
+ `NEGATION`: uma indicação de que um resultado ou ação é negativo ou não está sendo executado.
+ `PAST_HISTORY`: uma indicação de que o uso de álcool, tabaco ou drogas recreativas é do passado do paciente (antes do encontro atual).

## Categoria da condição médica
<a name="medical-condition-v2"></a>

A categoria `MEDICAL_CONDITION` detecta os sinais, sintomas e diagnósticos de condições médicas. A categoria tem um tipo de entidade, quatro atributos e quatro características. Uma ou mais características podem ser associadas a um tipo. Informações contextuais sobre atributos e sua relação com o diagnóstico são detectadas e mapeadas `DX_NAME` até o fim. `RELATIONSHIP_EXTRACTION.` Por exemplo, a partir do texto "dor crônica na perna esquerda", "crônica" é detectada como o atributo`ACUITY`, "esquerda" é detectada como o atributo `DIRECTION` e "perna" é detectada como o atributo `SYSTEM_ORGAN_SITE`. As relações de cada um desses atributos são mapeadas para a entidade de condição médica "dor", junto com uma pontuação de confiança.

### Tipos
<a name="medical-condition-type-v2"></a>
+ `DX_NAME`: todas as condições médicas listadas. O tipo `DX_NAME` inclui doença atual, motivo da consulta e histórico médico.

### Atributos
<a name="medical-condition-attribute-v2"></a>
+ `ACUITY`: determinação da instância da doença, como crônica, aguda, repentina, persistente ou gradual. 
+ `DIRECTION`: termos direcionais. Por exemplo, esquerda, direita, medial, lateral, superior, inferior, posterior, anterior, distal, proximal, contralateral, bilateral, ipsilateral, dorsal ou ventral.
+ `SYSTEM_ORGAN_SITE`: localização anatômica.
+ `QUALITY`: qualquer termo descritivo da condição médica, como estágio ou grau.

### Características
<a name="medical-condition-trait-v2"></a>
+ `DIAGNOSIS`: uma condição médica determinada como causa ou resultado dos sintomas. Os sintomas podem ser encontrados por meio de achados físicos, relatórios laboratoriais ou radiológicos ou outros meios.
+ `HYPOTHETICAL`: uma indicação de que uma condição médica é expressa como uma hipótese.
+ `LOW_CONFIDENCE`: uma indicação de que uma condição médica é expressa como sendo de alta incerteza. Isso não está diretamente relacionado aos escores de confiança fornecidos.
+ `NEGATION`: uma indicação de que um resultado ou ação é negativo ou não está sendo executado.
+ `PERTAINS_TO_FAMILY`: uma indicação de que uma condição médica é relevante para a família do paciente, não para o paciente.
+ `SIGN`: uma condição médica relatada pelo médico.
+ `SYMPTOM`: uma condição médica relatada pelo paciente.

## Categoria do medicamento
<a name="medication-v2"></a>

A categoria `MEDICATION` detecta informações sobre medicamentos e dosagens para o paciente. Um ou mais atributos podem ser aplicados a um tipo.

### Tipos
<a name="medication-type-v2"></a>
+ `BRAND_NAME`: o nome comercial protegido por direitos autorais do medicamento ou agente terapêutico.
+ `GENERIC_NAME`: o nome não comercial, o nome do ingrediente ou a mistura da fórmula do medicamento ou agente terapêutico.

### Atributos
<a name="medication-attribute-v2"></a>
+ `DOSAGE`: a quantidade de medicamento solicitada.
+ `DURATION`: por quanto tempo o medicamento deve ser administrado.
+ `FORM`: a forma do medicamento.
+ `FREQUENCY`: com que frequência administrar o medicamento. 
+ `RATE`: A taxa de administração do medicamento (principalmente para infusões de medicamentos ou IVs).
+ `ROUTE_OR_MODE`: o método de administração do medicamento.
+ `STRENGTH`: a potência do medicamento.

### Características
<a name="medication-trait-v2"></a>
+ `NEGATION`: qualquer indicação de que o paciente não está tomando um medicamento.
+ `PAST_HISTORY`: uma indicação de que um medicamento detectado é do passado do paciente (antes do encontro atual).

## Categoria de Informações de Saúde Protegidas
<a name="protected-health-information-v2"></a>

A categoria `PROTECTED_HEALTH_INFORMATION` detecta as informações pessoais do paciente. Para saber mais sobre isso, consulte [Detectar PHI](textanalysis-phi.md).

### Tipos
<a name="protected-health-information-types-v2"></a>
+ `ADDRESS`: todas as subdivisões geográficas de um endereço de qualquer instalação, instalações médicas nomeadas ou enfermarias dentro de uma instalação.
+ `AGE`: todos os componentes da idade, períodos de idade ou qualquer idade mencionada. Isso inclui os de um paciente, familiares ou outros. O padrão é em anos, salvo indicação em contrário.
+ `EMAIL`: qualquer endereço de e-mail.
+ `ID`: CPF, número do prontuário médico, número de identificação da instalação, número do ensaio clínico, número do certificado ou licença, número do veículo ou dispositivo, o local ou o provedor do atendimento. Isso também inclui qualquer número biométrico do paciente, como altura, peso ou valor laboratorial. 
+ `NAME`: todos os nomes. Normalmente, nomes do paciente, família ou provedor.
+ `PHONE_OR_FAX`: qualquer número de telefone, fax ou pager. Exclui números de telefone nomeados, como 1-800-QUIT-NOW e 911.
+ `PROFESSION`: qualquer profissão ou empregador que diga respeito ao paciente ou à família do paciente. Isso não inclui a profissão de médico mencionada na nota. 

## Categoria de teste, tratamento e procedimento
<a name="test-treatment-procedure-v2"></a>

A categoria `TEST_TREATMENT_PROCEDURE` detecta os procedimentos usados para determinar uma condição médica. Um ou mais atributos podem estar relacionados a uma entidade do tipo `TEST_NAME`.

### Tipos
<a name="test-treatment-procedure-types-v2"></a>
+ `PROCEDURE_NAME`: intervenções como uma ação única realizada no paciente para tratar uma condição médica ou fornecer assistência ao paciente.
+ `TEST_NAME`: procedimentos realizados em um paciente para diagnóstico, medição, triagem ou avaliação que podem ter um valor resultante. Isso inclui qualquer procedimento, processo, avaliação ou classificação para determinar um diagnóstico, descartar ou encontrar uma condição ou escalar ou pontuar um paciente.
+ `TREATMENT_NAME`: intervenções realizadas durante um período para combater uma doença ou um distúrbio. Isso inclui grupos de medicamentos, como antivirais e vacinas.

### Atributos
<a name="test-treatment-procedure-attributes-v2"></a>
+ `TEST_VALUE`: o resultado de um teste. Aplica-se somente ao tipo de entidade `TEST_NAME`.
+ `TEST_UNIT`: a unidade de medida que pode acompanhar o valor do teste. Aplica-se somente ao tipo de entidade `TEST_NAME`.

### Características
<a name="test-treatment-procedure-traits-v2"></a>
+ `FUTURE`: uma indicação de que um teste, tratamento ou procedimento se refere a uma ação ou evento que ocorrerá após o assunto das notas.
+ `HYPOTHETICAL`: uma indicação de que um teste, tratamento ou procedimento é expresso como uma hipótese.
+ `NEGATION`: uma indicação de que um resultado ou ação é negativo ou não está sendo executado.
+ `PAST_HISTORY`: uma indicação de que um teste, tratamento ou procedimento é do passado do paciente (antes do encontro atual).

## Categoria de expressão de tempo
<a name="time-expression-v2"></a>

A categoria `TIME_EXPRESSION` detecta entidades relacionadas ao tempo. Isso inclui entidades como datas e expressões de horário, como "três dias atrás", "hoje", "atualmente", "dia da admissão", "último mês" ou "16 dias". Os resultados nessa categoria só são retornados se estiverem associados a uma entidade. Por exemplo, "Ontem, o paciente tomou 200 mg de ibuprofeno" retornaria `Yesterday` como uma `TIME_EXPRESSION` entidade que se sobrepõe à entidade "ibuprofeno" `GENERIC_NAME`. No entanto, não seria reconhecido como uma entidade na expressão "ontem, o paciente passeou com o cachorro". 

### Tipos
<a name="time-expression-v2-categories"></a>
+ `TIME_TO_MEDICATION_NAME`: a data em que o medicamento foi tomado. Os atributos específicos desse tipo são `BRAND_NAME` e `GENERIC_NAME`.
+ `TIME_TO_DX_NAME`: a data em que ocorreu uma condição médica. O atributo desse tipo é `DX_NAME`. 
+ `TIME_TO_TEST_NAME`: a data em que o teste foi realizado. O atributo desse tipo é `TEST_NAME`.
+ `TIME_TO_PROCEDURE_NAME`: a data em que um procedimento foi realizado. O atributo desse tipo é `PROCEDURE_NAME`.
+ `TIME_TO_TREATMENT_NAME`: a data em que um tratamento foi administrado. O atributo desse tipo é `TREATMENT_NAME`.

### Tipo de relacionamento
<a name="time-expression-v2-relationship-type"></a>
+  O relacionamento entre uma entidade e um atributo. O reconhecido `Relationship_type` é o seguinte: 

  `Overlap`: `TIME_EXPRESSION` concorda com a entidade detectada.

# Detectar PHI
<a name="textanalysis-phi"></a>

Use a operação **DetectPHI** quando quiser detectar somente dados de Informações de Saúde Protegidas (PHI) ao digitalizar o texto clínico. Para detectar todas as entidades disponíveis no texto clínico, use **DetectEntitiesV2**.

Essa API é melhor para um caso de uso em que somente a detecção de entidades PHI é necessária. Para obter informações sobre informações nas categorias não PHI, consulte. [Detectar entidades (versão 2)](textanalysis-entitiesv2.md)

**Importante**  
 O Amazon Comprehend Medical fornece pontuações de confiança que indicam o nível de confiança na precisão das entidades detectadas. Avalie essas pontuações de confiança e identifique o limite de confiança certo para seu caso de uso. Para casos de uso específicos de conformidade, recomendamos que você use análise humana adicional ou outros métodos para confirmar a precisão das PHI detectadas.

De acordo com a lei HIPAA, as PHI baseadas em uma lista de 18 identificadores devem ser tratadas com cuidado especial. O Amazon Comprehend Medical detecta entidades associadas a esses identificadores, mas essas entidades não mapeiam 1:1 para a lista especificada pelo método Safe Harbor. Nem todos os identificadores estão contidos em textos clínicos não estruturados, mas o Amazon Comprehend Medical cobre todos os identificadores relevantes. Esses identificadores consistem em dados que podem ser usados para identificar um paciente individual, incluindo a lista a seguir. Para obter mais informações, consulte [Privacidade de informações de saúde](https://www.hhs.gov/hipaa/for-professionals/privacy/special-topics/de-identification/index.html) no site de *Saúde e Serviços Humanos do Governo dos EUA.* 

Cada entidade relacionada ao PHI inclui uma pontuação (`Score` na resposta) que indica o nível de confiança que o Amazon Comprehend Medical tem na precisão da detecção. Identifique o limite de confiança certo para seu caso de uso e filtre entidades que não o atendam. Ao identificar ocorrências de PHI, talvez seja melhor usar um limite de confiança baixo para filtrar a fim de capturar mais entidades detectadas em potencial. Isso é especialmente verdadeiro quando não se usa os valores das entidades detectadas em casos de uso de conformidade.

**As seguintes entidades relacionadas ao PHI podem ser detectadas executando as operações **DetectPhi** ou V2: DetectEntities**


**Entidades PHI detectadas**  

|  Entidade  |  Description  |  Categoria da HIPAA  | 
| --- | --- | --- | 
|  AGE  |  Todos os componentes da idade, faixa etária e qualquer idade mencionada, seja paciente, membro da família ou outras pessoas envolvidas na nota. O padrão é em anos, salvo indicação em contrário.  |  3. Datas relacionadas a um indivíduo  | 
| DATE | Qualquer data relacionada ao paciente ou ao atendimento ao paciente.  | 3. Datas relacionadas a um indivíduo | 
|  NAME  |  Todos os nomes mencionados na nota clínica, geralmente pertencentes ao paciente, à família ou ao profissional de saúde.  |  1. Nome  | 
|  PHONE\$1OR\$1FAX  |  Qualquer telefone, fax, pager; exclui números de telefone nomeados, como 1-800-QUIT-NOW e 911.  |  4. Número de telefone 5. Número de FAX  | 
|  EMAIL  |  Qualquer endereço de e-mail.  |  6. Endereços de e-mail  | 
|  ID  |  Qualquer tipo de número associado à identidade de um paciente. Isso inclui o número de CPF, número do prontuário médico, número de identificação da instalação, número do ensaio clínico, número do certificado ou licença, número do veículo ou dispositivo. Também inclui números biométricos e números que identificam o local do atendimento ou do prestador.  |  7. Número da previdência social  8. Número do prontuário médico 9. Número do plano de saúde 10. Números de conta 11. Certificate/License números 12. Identificadores de veículos 13. Números de dispositivos 16. Informações biométricas 18. Quaisquer outras características de identificação  | 
|  URL  |  Qualquer URL da Web.  |  14. URLs  | 
|  ADDRESS  |  Isso inclui todas as subdivisões geográficas de um endereço de qualquer instalação, instalações médicas nomeadas ou enfermarias dentro de uma instalação.  |  2. Localização geográfica  | 
|  PROFISSÃO  |  Inclui qualquer profissão ou empregador mencionado em uma nota no que diz respeito ao paciente ou à família do paciente.  |  18. Quaisquer outras características de identificação  | 



**Exemplo**  


O texto "O paciente é John Smith, professor de 48 anos e residente em Seattle, Washington". retornará:
+ "John Smith" como uma *entidade* do tipo `NAME` na categoria `PROTECTED_HEALTH_INFORMATION`.
+ "48" como uma *entidade* do tipo `AGE` na categoria `PROTECTED_HEALTH_INFORMATION`.
+ "professor" como uma *entidade* do tipo `PROFESSION` (característica identificadora) na categoria `PROTECTED_HEALTH_INFORMATION`.
+ "Seattle, Washington" como `ADDRESS` *entidade* na categoria `PROTECTED_HEALTH_INFORMATION`.

No console do Amazon Comprehend Medical, isso é mostrado assim:

![\[Patient information card displaying name, age, profession, and address details.\]](http://docs.aws.amazon.com/pt_br/comprehend-medical/latest/dev/images/patient.png)


Ao usar a operação **DetectPHI**, a resposta aparece assim. Quando você usa a operação **Start PHIDetection Job**, o Amazon Comprehend Medical cria um arquivo no local de saída com essa estrutura.

```
{
    "Entities": [
        {
            "Id": 0,
            "BeginOffset": 11,
            "EndOffset": 21,
            "Score": 0.997368335723877,
            "Text": "John Smith",
            "Category": "PROTECTED_HEALTH_INFORMATION",
            "Type": "NAME",
            "Traits": []
        },
        {
            "Id": 1,
            "BeginOffset": 25,
            "EndOffset": 27,
            "Score": 0.9998362064361572,
            "Text": "48",
            "Category": "PROTECTED_HEALTH_INFORMATION",
            "Type": "AGE",
            "Traits": []
        },
        {
            "Id": 2,
            "BeginOffset": 37,
            "EndOffset": 44,
            "Score": 0.8661606311798096,
            "Text": "teacher",
            "Category": "PROTECTED_HEALTH_INFORMATION",
            "Type": "PROFESSION",
            "Traits": []
        },
        {
            "Id": 3,
            "BeginOffset": 61,
            "EndOffset": 68,
            "Score": 0.9629441499710083,
            "Text": "Seattle",
            "Category": "PROTECTED_HEALTH_INFORMATION",
            "Type": "ADDRESS",
            "Traits": []
        },
        {
            "Id": 4,
            "BeginOffset": 78,
            "EndOffset": 88,
            "Score": 0.38217034935951233,
            "Text": "Washington",
            "Category": "PROTECTED_HEALTH_INFORMATION",
            "Type": "ADDRESS",
            "Traits": []
        }
    ],
    "UnmappedAttributes": []
}
```

# Lote de análise de texto APIs
<a name="textanalysis-batchapi"></a>

Use o Amazon Comprehend Medical para analisar textos médicos armazenados no bucket do Amazon S3. Analise até 10 GB de documentos em um lote. Você usa o console para criar e gerenciar trabalhos de análise em lote ou usa em lote APIs para detectar entidades médicas, incluindo informações de saúde protegidas (PHI). O APIs início, a interrupção, a lista e a descrição dos trabalhos de análise em lote em andamento.

 Informações sobre preços para análise de lotes e outras operações do Amazon Comprehend Medical podem ser encontradas [aqui](https://aws.amazon.com/comprehend/medical/pricing/).

## Aviso importante
<a name="important-notice"></a>

As operações de análise do Amazon Comprehend Medical não substituem o aconselhamento, diagnóstico ou tratamento médico profissional. Identifique o limite de confiança certo para seu caso de uso e use limites de alta confiança em situações que exigem alta precisão. Para certos casos de uso, os resultados devem ser revisados e verificados por revisores humanos devidamente treinados. Todas as operações do Amazon Comprehend Medical só devem ser usadas em cenários de atendimento ao paciente após uma revisão que assegure a precisão e uma opinião médica confiável por profissionais médicos treinados.

## Executando a análise em lote usando o APIs
<a name="performing-batch-api"></a>

Você pode executar um trabalho de análise em lote usando o console do Amazon Comprehend Medical ou o Amazon Comprehend Medical Batch. APIs

**Pré-requisitos**

 Ao usar a API do Amazon Comprehend Medical, crie uma política do AWS Identity Access and Management (IAM) e anexe-a a um perfil do IAM. Para saber mais sobre as políticas de confiança e os perfis do IAM, consulte [Políticas e permissões do IAM](https://docs.aws.amazon.com/IAM/latest/UserGuide/access_policies.html). 

****

1. Faça upload de seus dados em um bucket do S3.

1. Para iniciar um novo trabalho de análise, use a operação StartEntitiesDetection V2Job ou a operação Start PHIDetection Job. Ao iniciar o trabalho, informe ao Amazon Comprehend Medical o nome do bucket do S3 de entrada que contém os arquivos de entrada e designe o bucket do S3 de saída para gravar os arquivos após a análise em lote.

1. Monitore o progresso do trabalho usando o console ou a operação DescribeEntitiesDetection V2Job ou a operação Describe PHIDetection Job. Além disso, o ListEntitiesDetection V2Jobs e o List PHIDetection Jobs permitem que você veja o status de todas as ontologias que vinculam trabalhos de análise em lote.

1. Se você precisar interromper um trabalho em andamento, use o StopEntitiesDetection V2Job ou o Stop Job PHIDetection para interromper a análise.

1. Para ver os resultados do seu trabalho de análise, consulte o bucket do S3 de saída que você configurou ao iniciar o trabalho.

## Executar análise em lote usando o console
<a name="batch-api-console"></a>

****

1. Faça upload de seus dados em um bucket do S3.

1. Para iniciar um novo trabalho de análise, selecione o tipo de análise que você executará. Em seguida, forneça o nome do bucket do S3 que contém os arquivos de entrada e o nome do bucket do S3 para o qual você deseja enviar os arquivos de saída.

1. Monitore o status do seu trabalho enquanto ele estiver em andamento. No console, você pode visualizar todas as operações de análise em lote e seu status, incluindo quando a análise foi iniciada e finalizada.

1. Para ver os resultados do seu trabalho de análise, consulte o bucket do S3 de saída que você configurou ao iniciar o trabalho. 

## Políticas do IAM para operações em lote
<a name="batch-iam"></a>

A função do IAM que chama o lote do Amazon Comprehend Medical APIs deve ter uma política que conceda acesso aos buckets do S3 que contêm os arquivos de entrada e saída. Também deve ser atribuída uma relação de confiança que permite que o serviço do Amazon Comprehend Medical assuma a função. Para saber mais sobre as políticas de confiança e os perfis do IAM, consulte [Perfis do IAM](https://docs.aws.amazon.com/IAM/latest/UserGuide/id_roles.html).

O perfil deve ter a política a seguir.

------
#### [ JSON ]

****  

```
{
    "Version":"2012-10-17",		 	 	 
    "Statement": [
        {
            "Action": [
                "s3:GetObject"
            ],
            "Resource": [
                "arn:aws:s3:::input-bucket/*"
            ],
            "Effect": "Allow"
        },
        {
            "Action": [
                "s3:ListBucket"
            ],
            "Resource": [
                "arn:aws:s3:::input-bucket",
                "arn:aws:s3:::output-bucket"
            ],
            "Effect": "Allow"
        },
        {
            "Action": [
                "s3:PutObject"
            ],
            "Resource": [
                "arn:aws:s3:::output-bucket/*"
            ],
            "Effect": "Allow"
        }
    ]
}
```

------

O perfil deve ter a relação de confiança a seguir. É recomendável usar as chaves de condição `aws:SourceAccount ` ou `aws:SourceArn` para evitar o problema de segurança "confused deputy". Para saber mais sobre o problema do delegado confuso e como proteger sua AWS conta, consulte [O problema do deputado confuso](https://docs.aws.amazon.com/IAM/latest/UserGuide/confused-deputy.html) na documentação do IAM.

------
#### [ JSON ]

****  

```
{
   "Version":"2012-10-17",		 	 	 
   "Statement":[
      {
         "Effect":"Allow",
         "Principal":{
            "Service":[
               "comprehendmedical.amazonaws.com"
            ]
         },
         "Action":"sts:AssumeRole",
         "Condition": {
            "StringEquals": {
               "aws:SourceAccount": "account_id"
            },
            "ArnLike": {
               "aws:SourceArn": "arn:aws:comprehendmedical:us-east-1:account_id:*"
            }
         }
      }
   ]
}
```

------

## Arquivos de saída de análise em lote
<a name="batch-ouput"></a>

O Amazon Comprehend Medical cria um arquivo de saída para cada arquivo de entrada no lote. O arquivo tem a extensão `.out`. O Amazon Comprehend Medical primeiro cria um diretório no bucket S3 de saída usando o *AwsAccountId* - *JobType* - *JobId* como nome e, em seguida, grava todos os arquivos de saída do lote nesse diretório. O Amazon Comprehend Medical cria esse novo diretório para que a saída de um trabalho não substitua a saída de outro.

A saída de uma operação em lote produz a mesma saída de uma operação síncrona. Para obter exemplos da saída gerada pelo Amazon Comprehend Medical, consulte [Detectar entidades (versão 2)](textanalysis-entitiesv2.md).

Cada operação em lote produz três arquivos de manifesto que contêm informações sobre o trabalho. 
+ `Manifest`: resume o trabalho. Fornece informações sobre os parâmetros usados para a tarefa, o tamanho total da tarefa e o número de arquivos processados.
+ `success`: fornece informações sobre os arquivos que foram processados com êxito. Inclui o nome do arquivo de entrada e saída e o tamanho do arquivo de entrada.
+ `unprocessed`: lista os arquivos que o trabalho em lote não processou, incluindo códigos de erro e mensagens de erro por arquivo.

O Amazon Comprehend Medical grava os arquivos no diretório de saída que você especificou para o trabalho em lotes. O arquivo de resumo do manifesto será gravado na pasta de saída, junto com uma pasta chamada `Manifest_AccountId-Operation-JobId`. Dentro da pasta do manifesto, há uma pasta `success` que contém o manifesto de sucesso. Também está incluída uma pasta `failed` que contém o manifesto do arquivo não processado. As seções a seguir mostram a estrutura dos arquivos do manifesto.

### Arquivo de manifesto em lote
<a name="batch-manifest"></a>

Veja a seguir a estrutura JSON do arquivo do manifesto em lote.

```
{"Summary" : 
    {"Status" : "COMPLETED | FAILED | PARTIAL_SUCCESS | STOPPED", 
    "JobType" : "EntitiesDetection | PHIDetection", 
    "InputDataConfiguration" : {
        "Bucket" : "input bucket", 
        "Path" : "path to files/account ID-job type-job ID" 
    }, "OutputDataConfiguration" : {
        "Bucket" : "output bucket", 
        "Path" : "path to files" 
    }, 
    "InputFileCount" : number of files in input bucket, 
    "TotalMeteredCharacters" : total characters processed from all files, 
    "UnprocessedFilesCount" : number of files not processed, 
    "SuccessFilesCount" : total number of files processed, 
    "TotalDurationSeconds" : time required for processing, 
    "SuccessfulFilesListLocation" : "path to file", 
    "UnprocessedFilesListLocation" : "path to file",
    "FailedJobErrorMessage": "error message or if not applicable,
              The status of the job is completed"
    } 
}
```

### Arquivo de manifesto de sucesso
<a name="batch-success"></a>

Veja a seguir a estrutura JSON do arquivo que contém informações sobre arquivos processados com êxito.

```
{
        "Files": [{
               "Input": "input path/input file name",
               "Output": "output path/output file name",
               "InputSize": size in bytes of input file
        }, {
               "Input": "input path/input file name",
               "Output": "output path/output file name",
               "InputSize": size in bytes of input file
        }]
}
```

### Arquivo de manifesto não processado
<a name="batch-unprocessed"></a>

Veja a seguir a estrutura JSON do arquivo de manifesto que contém informações sobre arquivos não processados.

```
{
  "Files" : [ {
      "Input": "file_name_that_failed",
      "ErrorCode": "error code for exception",
      "ErrorMessage": "explanation of the error code and suggestions"
  }, 
  { ...}
  ]
}
```