

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

# Opérations de l'API d'analyse de texte
<a name="comprehendmedical-textanalysis"></a>

Utilisez Amazon Comprehend Medical pour examiner des documents cliniques et obtenir diverses informations sur leur contenu à l'aide de modèles de traitement du langage naturel (NLP) préentraînés. Vous pouvez effectuer une analyse à la fois sur des fichiers individuels ou sous forme d'analyse par lots sur plusieurs fichiers stockés dans un compartiment Amazon Simple Storage Service (S3).

Avec Amazon Comprehend Medical, vous pouvez effectuer les opérations suivantes sur vos documents :
+ [Détecter les entités (version 2)](textanalysis-entitiesv2.md)— Examinez le texte clinique non structuré pour détecter les références textuelles à des informations médicales telles que l'état de santé, le traitement, les tests et les résultats, ainsi que les médicaments. Cette version utilise un modèle différent de celui de l'API Detect entities d'origine, et quelques modifications ont été apportées au résultat.
+ [Détecter PHI](textanalysis-phi.md)— Examinez le texte clinique non structuré pour détecter les références textuelles aux informations de santé protégées (PHI) telles que les noms et adresses.

Amazon Comprehend Medical inclut également plusieurs opérations d'API que vous pouvez utiliser pour effectuer une analyse de texte par lots sur des documents cliniques. Pour en savoir plus sur l'utilisation de ces opérations d'API, consultez[Batch d'analyse de texte APIs](textanalysis-batchapi.md).

**Topics**
+ [Détecter les entités (version 2)](textanalysis-entitiesv2.md)
+ [Détecter PHI](textanalysis-phi.md)
+ [Batch d'analyse de texte APIs](textanalysis-batchapi.md)

# Détecter les entités (version 2)
<a name="textanalysis-entitiesv2"></a>

Utilisez le **DetectEntitiesV2** pour détecter des entités dans des fichiers uniques ou le **StartEntitiesDetectionV2Job** pour une analyse par lots sur plusieurs fichiers. Vous pouvez détecter des entités appartenant aux catégories suivantes :
+ `ANATOMY:`Détecte les références aux parties du corps ou aux systèmes corporels ainsi que l'emplacement de ces parties ou systèmes.
+ `BEHAVIORAL_ENVIRONMENTAL_SOCIAL`: Détecte les comportements et les conditions de l'environnement qui ont un impact sur la santé d'une personne. Cela inclut le tabagisme, la consommation d'alcool, la consommation de drogues récréatives, les allergies, le sexe et la race/l'origine ethnique.
+ `MEDICAL_CONDITION:`Détecte les signes, les symptômes et les diagnostics des problèmes de santé.
+ `MEDICATION:`Détecte les informations relatives au médicament et à la posologie du patient.
+ `PROTECTED_HEALTH_INFORMATION:`Détecte les informations personnelles du patient.
+ `TEST_TREATMENT_PROCEDURE:`Détecte les procédures utilisées pour déterminer un état de santé.
+ `TIME_EXPRESSION:`Détecte les entités associées à l'heure à laquelle elles sont associées à une entité détectée. 

Les six catégories sont détectées par l'opération **DetectEntitiesV2**. Pour les analyses spécifiques à la détection des PHI, utilisez **DetectPHI** sur des fichiers individuels et Start **PHIDetectionJob** pour une analyse par lots. 

 Amazon Comprehend Medical détecte les informations appartenant aux catégories suivantes :
+ *Entité :* référence textuelle au nom d'objets pertinents, tels que des personnes, des traitements, des médicaments et des problèmes de santé. Par exemple, `ibuprofen`. 
+ *Catégorie :* regroupement généralisé auquel appartient une entité. Par exemple, l'ibuprofène fait partie de `MEDICATION` cette catégorie.
+ *Type :* type d'entité détectée dans une seule catégorie. Par exemple, l'ibuprofène est du `GENERIC_NAME` type de `MEDICATION` cette catégorie.
+ *Attribut :* Informations relatives à une entité, telles que le dosage d'un médicament. Par exemple, `200 mg` est un attribut de l'entité ibuprofène.
+ *Trait :* quelque chose qu'Amazon Comprehend Medical comprend à propos d'une entité, en fonction du contexte. Par exemple, un médicament présente cette `NEGATION` caractéristique si le patient ne le prend pas.
+ *Type de relation :* relation entre une entité et un attribut.

Amazon Comprehend Medical indique l'emplacement d'une entité dans le texte saisi. Dans la console Amazon Comprehend, il vous indique graphiquement l'emplacement. Lorsque vous utilisez l'API, elle vous indique l'emplacement par décalage numérique.

Chaque entité et attribut inclut un score qui indique le niveau de confiance d'Amazon Comprehend Medical quant à la précision de la détection. Chaque attribut possède également un score de relation. Le score indique le niveau de confiance d'Amazon Comprehend Medical quant à l'exactitude de la relation entre l'attribut et son entité mère. Identifiez le seuil de confiance approprié pour votre cas d'utilisation. Utilisez des seuils de confiance élevés dans les situations qui nécessitent une grande précision. Filtrez les données qui n'atteignent pas le seuil.

## Catégorie Anatomie
<a name="anatomy-v2"></a>

La `ANATOMY` catégorie détecte les références aux parties du corps ou aux systèmes du corps ainsi que l'emplacement de ces parties ou systèmes. 

### Types
<a name="anatomy-type-v2"></a>
+ `SYSTEM_ORGAN_SITE`: Systèmes corporels, localisations ou régions anatomiques et sites corporels.

### Attributes
<a name="anatomy-attribute-v2"></a>
+ `DIRECTION`: Termes directionnels. Par exemple, gauche, droite, médial, latéral, supérieur, inférieur, postérieur, antérieur, distal, proximal, contralatéral, bilatéral, ipsilatéral, dorsal, ventral, etc.

## Catégorie de santé comportementale, environnementale et sociale
<a name="behavioral-category-v2"></a>

La `BEHAVIORAL_ENVIRONMENTAL_SOCIAL` catégorie détecte les références aux comportements et aux conditions de l'environnement qui ont un impact sur la santé d'une personne.

### Type
<a name="behavioral-type-v2"></a>
+ `ALCOHOL_CONSUMPTION`: définit la consommation d'alcool du patient en termes d'état de consommation, de fréquence, de quantité et de durée.
+ `ALLERGIES`: Définit les allergies du patient et ses réponses aux allergènes.
+ `GENDER`: Identification des caractéristiques de l'identité de genre.
+ `RACE_ETHNICITY`: Construction socio-politique de l'identification d'un patient à des groupes raciaux et ethniques particuliers.
+ `REC_DRUG_USE`: Définit la consommation de drogues récréatives par le patient en termes d'état de consommation, de fréquence, de quantité et de durée.
+ `TOBACCO_USE`: définit la consommation de tabac du patient en termes d'état de consommation, de fréquence, de quantité et de durée.Attributes

Les attributs détectés suivants s'appliquent uniquement aux types `ALCOHOL_CONSUMPTION``TOBACCO_USE`, et `REC_DRUG_USE` :
+ `AMOUNT`: La quantité d'alcool, de tabac ou de drogue récréative consommée.
+ `DURATION`: Depuis combien de temps l'alcool, le tabac ou la drogue à usage récréatif ont été consommés.
+ `FREQUENCY`: À quelle fréquence l'alcool, le tabac ou les drogues récréatives sont-ils consommés ?

### Traits
<a name="behavioral-trait-v2"></a>

Les traits détectés suivants ne s'appliquent qu'aux types `ALCOHOL_CONSUMPTION``ALLERGIES`,`TOBACCO_USE`, et `REC_DRUG_USE` :
+ `NEGATION`: Indique qu'un résultat ou une action est négatif ou qu'il n'est pas exécuté.
+ `PAST_HISTORY`: Une indication selon laquelle la consommation d'alcool, de tabac ou de drogues récréatives provient du passé du patient (avant le rendez-vous actuel).

## Catégorie d'état de santé
<a name="medical-condition-v2"></a>

La `MEDICAL_CONDITION` catégorie détecte les signes, les symptômes et les diagnostics des problèmes de santé. La catégorie comporte un type d'entité, quatre attributs et quatre traits. Un ou plusieurs traits peuvent être associés à un type. Les informations contextuelles concernant les attributs et leur relation avec le diagnostic sont détectées et mises en correspondance. `DX_NAME` `RELATIONSHIP_EXTRACTION.` Par exemple, à partir du texte « douleur chronique à la jambe gauche », « chronique » est détecté comme attribut`ACUITY`, « gauche » est détecté comme attribut `DIRECTION` et « jambe » est détecté comme attribut. `SYSTEM_ORGAN_SITE` Les relations entre chacun de ces attributs sont associées à l'entité « douleur » associée à l'affection médicale, ainsi qu'à un score de confiance.

### Types
<a name="medical-condition-type-v2"></a>
+ `DX_NAME`: Toutes les affections médicales sont répertoriées. Le `DX_NAME` type comprend la maladie actuelle, le motif de la visite et les antécédents médicaux.

### Attributes
<a name="medical-condition-attribute-v2"></a>
+ `ACUITY`: Détermination d'un cas de maladie, tel qu'une maladie chronique, aiguë, soudaine, persistante ou progressive. 
+ `DIRECTION`: Termes directionnels. Par exemple, gauche, droite, médial, latéral, supérieur, inférieur, postérieur, antérieur, distal, proximal, contralatéral, bilatéral, ipsilatéral, dorsal ou ventral.
+ `SYSTEM_ORGAN_SITE`: Localisation anatomique.
+ `QUALITY`: Tout terme descriptif de l'affection, tel que le stade ou le grade.

### Traits
<a name="medical-condition-trait-v2"></a>
+ `DIAGNOSIS`: Affection médicale déterminée comme étant la cause ou le résultat des symptômes. Les symptômes peuvent être décelés par des constatations physiques, des rapports de laboratoire ou radiologiques, ou par tout autre moyen.
+ `HYPOTHETICAL`: Une indication selon laquelle un problème médical est exprimé sous forme d'hypothèse.
+ `LOW_CONFIDENCE`: Une indication selon laquelle un problème médical est exprimé comme présentant un degré élevé d'incertitude. Cela n'est pas directement lié aux scores de confiance fournis.
+ `NEGATION`: Indique qu'un résultat ou une action est négatif ou qu'il n'est pas exécuté.
+ `PERTAINS_TO_FAMILY`: Une indication qu'un problème médical concerne la famille du patient, et non le patient lui-même.
+ `SIGN`: Un problème de santé signalé par le médecin.
+ `SYMPTOM`: Affection médicale signalée par le patient.

## Catégorie de médicaments
<a name="medication-v2"></a>

La `MEDICATION` catégorie détecte les informations relatives au médicament et à la posologie pour le patient. Un ou plusieurs attributs peuvent s'appliquer à un type.

### Types
<a name="medication-type-v2"></a>
+ `BRAND_NAME`: Le nom de marque protégé par le droit d'auteur du médicament ou de l'agent thérapeutique.
+ `GENERIC_NAME`: Le nom autre que la marque, le nom de l'ingrédient ou le mélange de formules du médicament ou de l'agent thérapeutique.

### Attributes
<a name="medication-attribute-v2"></a>
+ `DOSAGE`: La quantité de médicament commandée.
+ `DURATION`: Pendant combien de temps le médicament doit-il être administré ?
+ `FORM`: La forme du médicament.
+ `FREQUENCY`: À quelle fréquence administrer le médicament. 
+ `RATE`: Le taux d'administration du médicament (principalement pour les perfusions de médicaments ou IVs).
+ `ROUTE_OR_MODE`: Mode d'administration du médicament.
+ `STRENGTH`: La concentration du médicament.

### Traits
<a name="medication-trait-v2"></a>
+ `NEGATION`: Toute indication indiquant que le patient ne prend pas de médicament.
+ `PAST_HISTORY`: Une indication qu'un médicament détecté provient du passé du patient (avant le rendez-vous actuel).

## Catégorie d'informations de santé protégées
<a name="protected-health-information-v2"></a>

La `PROTECTED_HEALTH_INFORMATION` catégorie détecte les informations personnelles du patient. Consultez [Détecter PHI](textanalysis-phi.md) pour en savoir plus sur cette opération.

### Types
<a name="protected-health-information-types-v2"></a>
+ `ADDRESS`: Toutes les subdivisions géographiques d'une adresse d'une installation, d'une unité ou d'un service au sein d'une installation.
+ `AGE`: Toutes les composantes de l'âge, les tranches d'âge ou tout âge mentionné. Cela inclut ceux d'un patient, des membres de sa famille ou d'autres personnes. La valeur par défaut est exprimée en années, sauf indication contraire.
+ `EMAIL`: N'importe quelle adresse e-mail.
+ `ID`: Numéro de sécurité sociale, numéro de dossier médical, numéro d'identification de l'établissement, numéro d'essai clinique, numéro de certificat ou de licence, numéro de véhicule ou d'appareil, lieu de soins ou prestataire. Cela inclut également tout numéro biométrique du patient, tel que sa taille, son poids ou une valeur de laboratoire. 
+ `NAME`: Tous les noms. Généralement, les noms du patient, de la famille ou du fournisseur de soins.
+ `PHONE_OR_FAX`: N'importe quel numéro de téléphone, de télécopieur ou de téléavertisseur. Exclut les numéros de téléphone nommés, tels que le 1-800-QUIT-NOW et le 911.
+ `PROFESSION`: Toute profession ou tout employeur lié au patient ou à sa famille. Elle n'inclut pas la profession du clinicien mentionnée dans la note. 

## Catégorie de test, de traitement et de procédure
<a name="test-treatment-procedure-v2"></a>

La `TEST_TREATMENT_PROCEDURE` catégorie détecte les procédures utilisées pour déterminer un état de santé. Un ou plusieurs attributs peuvent être associés à une entité de `TEST_NAME` ce type.

### Types
<a name="test-treatment-procedure-types-v2"></a>
+ `PROCEDURE_NAME`: Interventions en tant qu'action ponctuelle effectuée sur le patient pour traiter un problème médical ou pour fournir des soins au patient.
+ `TEST_NAME`: Procédures effectuées sur un patient à des fins de diagnostic, de mesure, de dépistage ou d'évaluation qui peuvent avoir une valeur résultante. Cela inclut toute procédure, processus, évaluation ou évaluation visant à établir un diagnostic, à exclure ou à détecter une affection, ou à évaluer ou à évaluer un patient.
+ `TREATMENT_NAME`: Interventions effectuées sur une période donnée pour combattre une maladie ou un trouble. Cela inclut des groupes de médicaments, tels que les antiviraux et les vaccins.

### Attributes
<a name="test-treatment-procedure-attributes-v2"></a>
+ `TEST_VALUE`: résultat d'un test. S'applique uniquement au type d'`TEST_NAME`entité.
+ `TEST_UNIT`: unité de mesure qui peut accompagner la valeur du test. S'applique uniquement au type d'`TEST_NAME`entité.

### Traits
<a name="test-treatment-procedure-traits-v2"></a>
+ `FUTURE`: Une indication selon laquelle un test, un traitement ou une procédure fait référence à une action ou à un événement qui se produira après le sujet des notes.
+ `HYPOTHETICAL`: Une indication selon laquelle un test, un traitement ou une procédure est exprimé sous forme d'hypothèse.
+ `NEGATION`: Indique qu'un résultat ou une action est négatif ou qu'il n'est pas exécuté.
+ `PAST_HISTORY`: Une indication qu'un test, un traitement ou une intervention provient du passé du patient (avant le rendez-vous actuel).

## Catégorie d'expression temporelle
<a name="time-expression-v2"></a>

La `TIME_EXPRESSION` catégorie détecte les entités liées au temps. Cela inclut des entités telles que des expressions de date et d'heure telles que « il y a trois jours », « aujourd'hui », « actuellement », « jour d'admission », « le mois dernier » ou « 16 jours ». Les résultats de cette catégorie ne sont renvoyés que s'ils sont associés à une entité. Par exemple, « Hier, le patient a pris 200 mg d'ibuprofène » reviendrait `Yesterday` sous la forme d'une `TIME_EXPRESSION` entité recouvrant l'`GENERIC_NAME`entité « ibuprofène ». Cependant, elle ne serait pas reconnue comme une entité dans « hier, le patient promenait son chien ». 

### Types
<a name="time-expression-v2-categories"></a>
+ `TIME_TO_MEDICATION_NAME`: Date à laquelle un médicament a été pris. Les attributs spécifiques à ce type sont `BRAND_NAME` et`GENERIC_NAME`.
+ `TIME_TO_DX_NAME`: Date à laquelle un problème médical est apparu. L'attribut de ce type est`DX_NAME`. 
+ `TIME_TO_TEST_NAME`: date à laquelle un test a été effectué. L'attribut de ce type est`TEST_NAME`.
+ `TIME_TO_PROCEDURE_NAME`: date à laquelle une procédure a été effectuée. L'attribut de ce type est`PROCEDURE_NAME`.
+ `TIME_TO_TREATMENT_NAME`: Date à laquelle le traitement a été administré. L'attribut de ce type est`TREATMENT_NAME`.

### Type de relation
<a name="time-expression-v2-relationship-type"></a>
+  Relation entre une entité et un attribut. Les valeurs reconnues `Relationship_type` sont les suivantes : 

  `Overlap`— Ils sont `TIME_EXPRESSION` d'accord avec l'entité détectée.

# Détecter PHI
<a name="textanalysis-phi"></a>

Utilisez l'opération **DetectPhi** lorsque vous souhaitez uniquement détecter les données PHI (Protected Health Information) lors de la numérisation du texte clinique. Pour détecter toutes les entités disponibles dans le texte clinique, utilisez **DetectEntitiesV2**.

Cette API est idéale pour les cas d'utilisation où seule la détection d'entités PHI est requise. Pour plus d'informations sur les informations figurant dans les catégories autres que PHI, consultez[Détecter les entités (version 2)](textanalysis-entitiesv2.md).

**Important**  
 Amazon Comprehend Medical fournit des scores de confiance qui indiquent le niveau de confiance dans la précision des entités détectées. Évaluez ces scores de confiance et identifiez le seuil de confiance adapté à votre cas d'utilisation. Pour les cas d'utilisation spécifiques liés à la conformité, nous vous recommandons d'utiliser un examen humain supplémentaire ou d'autres méthodes pour confirmer l'exactitude des PHI détectés.

En vertu de la loi HIPAA, les PHI basés sur une liste de 18 identifiants doivent être traités avec une attention particulière. Amazon Comprehend Medical détecte les entités associées à ces identifiants, mais ces entités ne correspondent pas 1:1 à la liste spécifiée par la méthode Safe Harbor. Tous les identifiants ne figurent pas dans un texte clinique non structuré, mais Amazon Comprehend Medical couvre tous les identifiants pertinents. Ces identifiants sont constitués de données qui peuvent être utilisées pour identifier un patient individuel, notamment la liste suivante. Pour plus d'informations, consultez [la section Health Information Privacy](https://www.hhs.gov/hipaa/for-professionals/privacy/special-topics/de-identification/index.html) sur le site Web *du gouvernement américain chargé de la santé et des services* sociaux. 

Chaque entité associée au PHI inclut un score (`Score`dans la réponse) qui indique le niveau de confiance d'Amazon Comprehend Medical dans la précision de la détection. Identifiez le seuil de confiance adapté à votre cas d'utilisation et filtrez les entités qui ne l'atteignent pas. Lors de l'identification des occurrences de PHI, il peut être préférable d'utiliser un seuil de confiance faible pour le filtrage afin de capturer davantage d'entités potentielles détectées. Cela est particulièrement vrai lorsque les valeurs des entités détectées ne sont pas utilisées dans des cas d'utilisation liés à la conformité.

**Les entités liées au PHI suivantes peuvent être détectées en exécutant les opérations **DetectPhi ou DetectEntities V2** :**


**Entités PHI détectées**  

|  Entité  |  Description  |  Catégorie HIPAA  | 
| --- | --- | --- | 
|  AGE  |  Toutes les composantes de l'âge, les tranches d'âge et tout âge mentionnés, qu'il s'agisse du patient, d'un membre de la famille ou d'autres personnes impliquées dans la note. La valeur par défaut est exprimée en années, sauf indication contraire.  |  3. Dates liées à un individu  | 
| DATE | Toute date liée au patient ou à ses soins.  | 3. Dates liées à un individu | 
|  NAME  |  Tous les noms mentionnés dans la note clinique, appartenant généralement au patient, à la famille ou au professionnel de la santé.  |  1. Nom  | 
|  TÉLÉPHONE\$1OU\$1TÉLÉCOPIEUR  |  Tout téléphone, télécopieur ou téléavertisseur ; à l'exception des numéros de téléphone nominatifs tels que le 1-800-QUIT-NOW et le 911.  |  4. Numéro de téléphone 5. Numéro de télécopie  | 
|  EMAIL  |  N'importe quelle adresse e-mail.  |  6. Adresses e-mail  | 
|  ID  |  Toute sorte de numéro associé à l'identité d'un patient. Cela inclut leur numéro de sécurité sociale, leur numéro de dossier médical, le numéro d'identification de l'établissement, le numéro d'essai clinique, le numéro de certificat ou de licence, le numéro de véhicule ou d'appareil. Il comprend également les numéros biométriques et les numéros identifiant le lieu de soins ou le fournisseur de soins.  |  7. Numéro de sécurité sociale  8. Numéro de dossier médical 9. Numéro du plan de santé 10. Numéros de comptes 11. Certificate/License chiffres 12. Identifiants du véhicule 13. Numéros d'appareils 16. Informations biométriques 18. Toute autre caractéristique d'identification  | 
|  URL  |  N'importe quelle URL Web.  |  14. URLs  | 
|  ADDRESS  |  Cela inclut toutes les subdivisions géographiques d'une adresse d'un établissement, les établissements médicaux nommés ou les services d'un établissement.  |  2. Situation géographique  | 
|  PROFESSION  |  Comprend toute profession ou tout employeur mentionné dans une note en ce qui concerne le patient ou sa famille.  |  18. Toute autre caractéristique d'identification  | 



**Exemple**  


Le texte « Le patient est John Smith, un enseignant de 48 ans résidant à Seattle, dans l'État de Washington ». renvoie :
+ « John Smith » en tant qu'*entité* de type `NAME` dans la `PROTECTED_HEALTH_INFORMATION` catégorie.
+ « 48 » en tant qu'*entité* de type `AGE` dans la `PROTECTED_HEALTH_INFORMATION` catégorie.
+ « enseignant » en tant qu'*entité* de type `PROFESSION` (caractéristique d'identification) dans la `PROTECTED_HEALTH_INFORMATION` catégorie.
+ « Seattle, Washington » en tant qu'`ADDRESS`*entité* de la `PROTECTED_HEALTH_INFORMATION` catégorie.

Dans la console Amazon Comprehend Medical, cela s'affiche comme suit :

![\[Patient information card displaying name, age, profession, and address details.\]](http://docs.aws.amazon.com/fr_fr/comprehend-medical/latest/dev/images/patient.png)


Lorsque vous utilisez l'opération **DetectPhi**, la réponse apparaît comme suit. Lorsque vous utilisez l'opération **Start PHIDetection Job**, Amazon Comprehend Medical crée un fichier dans l'emplacement de sortie avec cette structure.

```
{
    "Entities": [
        {
            "Id": 0,
            "BeginOffset": 11,
            "EndOffset": 21,
            "Score": 0.997368335723877,
            "Text": "John Smith",
            "Category": "PROTECTED_HEALTH_INFORMATION",
            "Type": "NAME",
            "Traits": []
        },
        {
            "Id": 1,
            "BeginOffset": 25,
            "EndOffset": 27,
            "Score": 0.9998362064361572,
            "Text": "48",
            "Category": "PROTECTED_HEALTH_INFORMATION",
            "Type": "AGE",
            "Traits": []
        },
        {
            "Id": 2,
            "BeginOffset": 37,
            "EndOffset": 44,
            "Score": 0.8661606311798096,
            "Text": "teacher",
            "Category": "PROTECTED_HEALTH_INFORMATION",
            "Type": "PROFESSION",
            "Traits": []
        },
        {
            "Id": 3,
            "BeginOffset": 61,
            "EndOffset": 68,
            "Score": 0.9629441499710083,
            "Text": "Seattle",
            "Category": "PROTECTED_HEALTH_INFORMATION",
            "Type": "ADDRESS",
            "Traits": []
        },
        {
            "Id": 4,
            "BeginOffset": 78,
            "EndOffset": 88,
            "Score": 0.38217034935951233,
            "Text": "Washington",
            "Category": "PROTECTED_HEALTH_INFORMATION",
            "Type": "ADDRESS",
            "Traits": []
        }
    ],
    "UnmappedAttributes": []
}
```

# Batch d'analyse de texte APIs
<a name="textanalysis-batchapi"></a>

Utilisez Amazon Comprehend Medical pour analyser le texte médical stocké dans un compartiment Amazon S3. Analysez jusqu'à 10 Go de documents en un seul lot. Vous utilisez la console pour créer et gérer des tâches d'analyse par lots, ou vous utilisez le traitement par lots APIs pour détecter des entités médicales, notamment des informations de santé protégées (PHI). APIs Démarrage, arrêt, liste et description des tâches d'analyse par lots en cours.

 Les informations tarifaires pour l'analyse des lots et les autres opérations d'Amazon Comprehend Medical sont [disponibles](https://aws.amazon.com/comprehend/medical/pricing/) ici.

## Avis important
<a name="important-notice"></a>

Les opérations d'analyse par lots d'Amazon Comprehend Medical ne remplacent pas les conseils, diagnostics ou traitements médicaux professionnels. Déterminez le seuil de confiance approprié pour votre cas et utilisez des seuils de confiance élevés dans les situations qui exigent une grande précision. Dans certains cas d'utilisation, les résultats doivent être examinés et vérifiés par des examinateurs humains dûment formés. Toutes les opérations d'Amazon Comprehend Medical ne doivent être utilisées dans des scénarios de soins aux patients qu'après vérification de leur exactitude et du bon jugement médical par des professionnels de santé qualifiés.

## Réalisation d'une analyse par lots à l'aide du APIs
<a name="performing-batch-api"></a>

Vous pouvez exécuter une tâche d'analyse par lots à l'aide de la console Amazon Comprehend Medical ou d'Amazon Comprehend APIs Medical Batch.

**Conditions préalables**

 Lorsque vous utilisez l'API Amazon Comprehend Medical, créez une politique AWS Identity Access and Management (IAM) et associez-la à un rôle IAM. Pour en savoir plus sur les rôles IAM et les politiques de confiance, consultez [Politiques et autorisations IAM](https://docs.aws.amazon.com/IAM/latest/UserGuide/access_policies.html). 

****

1. Téléchargez vos données dans un compartiment S3.

1. Pour démarrer une nouvelle tâche d'analyse, utilisez l'opération StartEntitiesDetection V2Job ou l'opération Start PHIDetection Job. Lorsque vous démarrez la tâche, indiquez à Amazon Comprehend Medical le nom du compartiment S3 d'entrée contenant les fichiers d'entrée et désignez le compartiment S3 de sortie pour écrire les fichiers après l'analyse par lots.

1. Surveillez la progression de la tâche à l'aide de la console ou de l'opération DescribeEntitiesDetection V2Job ou de l'opération Describe PHIDetection Job. En outre, ListEntitiesDetection V2Jobs et List PHIDetection Jobs vous permettent de voir l'état de toutes les ontologies liant les tâches d'analyse par lots.

1. Si vous devez arrêter une tâche en cours, utilisez StopEntitiesDetection V2Job ou Stop Job PHIDetection pour arrêter l'analyse.

1. Pour consulter les résultats de votre tâche d'analyse, consultez le compartiment S3 de sortie que vous avez configuré lorsque vous avez démarré la tâche.

## Exécution d'une analyse par lots à l'aide de la console
<a name="batch-api-console"></a>

****

1. Téléchargez vos données dans un compartiment S3.

1. Pour démarrer une nouvelle tâche d'analyse, sélectionnez le type d'analyse que vous allez effectuer. Indiquez ensuite le nom du compartiment S3 contenant les fichiers d'entrée et le nom du compartiment S3 dans lequel vous souhaitez envoyer les fichiers de sortie.

1. Surveillez le statut de votre travail pendant qu'il est en cours. Depuis la console, vous pouvez consulter toutes les opérations d'analyse par lots et leur statut, y compris les dates de début et de fin de l'analyse.

1. Pour consulter les résultats de votre tâche d'analyse, consultez le compartiment S3 de sortie que vous avez configuré lorsque vous avez démarré la tâche. 

## Politiques IAM pour les opérations par lots
<a name="batch-iam"></a>

Le rôle IAM qui appelle le lot Amazon Comprehend Medical APIs doit disposer d'une politique autorisant l'accès aux compartiments S3 contenant les fichiers d'entrée et de sortie. Il doit également se voir attribuer une relation de confiance permettant au service Amazon Comprehend Medical d'assumer ce rôle. Pour en savoir plus sur les rôles IAM et les politiques de confiance, consultez la section Rôles [IAM](https://docs.aws.amazon.com/IAM/latest/UserGuide/id_roles.html).

Le rôle doit respecter la politique suivante.

------
#### [ JSON ]

****  

```
{
    "Version":"2012-10-17",		 	 	 
    "Statement": [
        {
            "Action": [
                "s3:GetObject"
            ],
            "Resource": [
                "arn:aws:s3:::input-bucket/*"
            ],
            "Effect": "Allow"
        },
        {
            "Action": [
                "s3:ListBucket"
            ],
            "Resource": [
                "arn:aws:s3:::input-bucket",
                "arn:aws:s3:::output-bucket"
            ],
            "Effect": "Allow"
        },
        {
            "Action": [
                "s3:PutObject"
            ],
            "Resource": [
                "arn:aws:s3:::output-bucket/*"
            ],
            "Effect": "Allow"
        }
    ]
}
```

------

Le rôle doit avoir la relation de confiance suivante. Il est recommandé d'utiliser les touches de `aws:SourceArn` condition `aws:SourceAccount ` et pour éviter tout problème de sécurité secondaire confus. Pour en savoir plus sur le problème des députés confus et sur la manière de protéger votre AWS compte, consultez [la section Le problème des adjoints confus](https://docs.aws.amazon.com/IAM/latest/UserGuide/confused-deputy.html) dans la documentation IAM.

------
#### [ JSON ]

****  

```
{
   "Version":"2012-10-17",		 	 	 
   "Statement":[
      {
         "Effect":"Allow",
         "Principal":{
            "Service":[
               "comprehendmedical.amazonaws.com"
            ]
         },
         "Action":"sts:AssumeRole",
         "Condition": {
            "StringEquals": {
               "aws:SourceAccount": "account_id"
            },
            "ArnLike": {
               "aws:SourceArn": "arn:aws:comprehendmedical:us-east-1:account_id:*"
            }
         }
      }
   ]
}
```

------

## Fichiers de sortie d'analyse par lots
<a name="batch-ouput"></a>

Amazon Comprehend Medical crée un fichier de sortie pour chaque fichier d'entrée du lot. Le fichier possède l'extension`.out`. Amazon Comprehend Medical crée d'abord un répertoire dans le compartiment S3 de sortie en utilisant *AwsAccountId* le nom *JobType* *JobId* - -, puis écrit tous les fichiers de sortie du lot dans ce répertoire. Amazon Comprehend Medical crée ce nouveau répertoire afin que le résultat d'une tâche ne remplace pas le résultat d'une autre.

La sortie d'une opération par lots produit la même sortie qu'une opération synchrone. Pour des exemples de résultats générés par Amazon Comprehend Medical, [Détecter les entités (version 2)](textanalysis-entitiesv2.md) consultez.

Chaque opération par lots produit trois fichiers manifestes contenant des informations sur la tâche. 
+ `Manifest`— Résume le travail. Fournit des informations sur les paramètres utilisés pour la tâche, la taille totale de la tâche et le nombre de fichiers traités.
+ `success`— Fournit des informations sur les fichiers traités avec succès. Inclut le nom du fichier d'entrée et de sortie ainsi que la taille du fichier d'entrée.
+ `unprocessed`— Répertorie les fichiers que le traitement par lots n'a pas traités, y compris les codes d'erreur et les messages d'erreur par fichier.

Amazon Comprehend Medical écrit les fichiers dans le répertoire de sortie que vous avez spécifié pour le traitement par lots. Le fichier manifeste récapitulatif sera écrit dans le dossier de sortie, avec un dossier intitulé`Manifest_AccountId-Operation-JobId`. Le dossier du manifeste contient un `success` dossier contenant le manifeste de réussite. Un `failed` dossier contenant le manifeste du fichier non traité est également inclus. Les sections suivantes présentent la structure des fichiers manifestes.

### Fichier manifeste Batch
<a name="batch-manifest"></a>

Voici la structure JSON du fichier manifeste par lots.

```
{"Summary" : 
    {"Status" : "COMPLETED | FAILED | PARTIAL_SUCCESS | STOPPED", 
    "JobType" : "EntitiesDetection | PHIDetection", 
    "InputDataConfiguration" : {
        "Bucket" : "input bucket", 
        "Path" : "path to files/account ID-job type-job ID" 
    }, "OutputDataConfiguration" : {
        "Bucket" : "output bucket", 
        "Path" : "path to files" 
    }, 
    "InputFileCount" : number of files in input bucket, 
    "TotalMeteredCharacters" : total characters processed from all files, 
    "UnprocessedFilesCount" : number of files not processed, 
    "SuccessFilesCount" : total number of files processed, 
    "TotalDurationSeconds" : time required for processing, 
    "SuccessfulFilesListLocation" : "path to file", 
    "UnprocessedFilesListLocation" : "path to file",
    "FailedJobErrorMessage": "error message or if not applicable,
              The status of the job is completed"
    } 
}
```

### Fichier manifeste de réussite
<a name="batch-success"></a>

Voici la structure JSON du fichier qui contient des informations sur les fichiers traités avec succès.

```
{
        "Files": [{
               "Input": "input path/input file name",
               "Output": "output path/output file name",
               "InputSize": size in bytes of input file
        }, {
               "Input": "input path/input file name",
               "Output": "output path/output file name",
               "InputSize": size in bytes of input file
        }]
}
```

### Fichier manifeste non traité
<a name="batch-unprocessed"></a>

Voici la structure JSON du fichier manifeste qui contient des informations sur les fichiers non traités.

```
{
  "Files" : [ {
      "Input": "file_name_that_failed",
      "ErrorCode": "error code for exception",
      "ErrorMessage": "explanation of the error code and suggestions"
  }, 
  { ...}
  ]
}
```