

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

# Analyse des documents
<a name="how-it-works-analyzing"></a>

Amazon Textract analyse les documents et les formulaires à la recherche de relations entre le texte détecté. Les opérations d'analyse Amazon Textract renvoient trois catégories d'extraction de documents : texte, formulaires et tableaux. L'analyse des factures et des reçus est gérée par un processus différent. Pour plus d'informations, voir[Analyse des factures et des reçus](invoices-receipts.md).

**Extraction de texte**  
Texte brut extrait d'un document. Pour de plus amples informations, veuillez consulter[Lignes et mots de texte](how-it-works-lines-words.md).

**Extraction de formulaire**  
Les données de formulaire sont liées à des éléments de texte extraits d'un document. Amazon Textract représente les données de formulaire sous forme de paires clé-valeur. Dans l'exemple suivant, l'une des lignes de texte détectées par Amazon Textract est*Name : Jane Die*. Amazon Textract identifie également une clé (*Name :*) et une valeur (*Jane Die*). Pour de plus amples informations, veuillez consulter[Données de formulaire (paires clé-valeur)](how-it-works-kvp.md).

*Name : Jane Die*

*Adresse : 123 Any Street, Anytown, États-Unis*

*Date de naissance : 26-1980*

Les paires clé-valeur sont également utilisées pour représenter des cases à cocher ou des boutons d'option (boutons radio) extraits des formulaires.

*Homme :*☑

Pour de plus amples informations, veuillez consulter[Éléments de sélection](how-it-works-selectables.md).

**Extraction de table**  
Amazon Textract peut extraire des tables, des cellules de tableau et les éléments contenus dans des cellules de tableau et peut être programmé pour renvoyer les résultats dans un fichier JSON, .csv ou .txt.


| Nom | Address | 
| --- | --- | 
| Ana Caroline | 123 Any Town | 

Pour de plus amples informations, veuillez consulter [Tables](how-it-works-tables.md). Les éléments de sélection peuvent également être extraits des tableaux. Pour de plus amples informations, veuillez consulter[Éléments de sélection](how-it-works-selectables.md).

Pour les articles analysés, Amazon Textract renvoie ce qui suit en plusieurs[Block](API_Block.md)objets :
+ Les lignes et les mots du texte détecté
+ Le contenu des éléments détectés
+ La relation entre les éléments détectés
+ La page sur laquelle l'élément a été détecté
+ L'emplacement de l'élément sur la page de document

Vous pouvez utiliser des opérations synchrone ou asynchrone pour analyser du texte dans un document. Pour analyser du texte de manière synchrone, utilisez le[AnalyzeDocument](API_AnalyzeDocument.md)et transmettez un document en entrée.`AnalyzeDocument`renvoie l'ensemble des résultats. Pour plus d'informations, consultez [Analyse du texte du document avec Amazon Textract](analyzing-document-text.md). 

Pour détecter du texte de manière asynchrone, utilisez[StartDocumentAnalysis](API_StartDocumentAnalysis.md)pour commencer le traitement. Pour obtenir les résultats, appelez[GetDocumentAnalysis](API_GetDocumentAnalysis.md). Les résultats sont renvoyés dans une ou plusieurs réponses de`GetDocumentAnalysis`. Pour plus d'informations et pour voir un exemple, consultez [Détection ou analyse de texte dans un document multipage](async-analyzing-with-sqs.md). 

Pour spécifier le type d'analyse à effectuer, vous pouvez utiliser le`FeatureTypes`paramètre d'entrée de liste. Ajoutez TABLES à la liste pour renvoyer des informations sur les tables détectées dans le document en entrée, par exemple les cellules du tableau, le texte de cellule et les éléments de sélection dans les cellules. Ajoutez FORMS pour renvoyer des relations entre mots, telles que des paires clé-valeur et des éléments de sélection. Pour effectuer les deux types d'analyse, ajoutez TABLES et FORMS à`FeatureTypes`. 

Toutes les lignes et tous les mots détectés dans le document sont inclus dans la réponse (y compris le texte non lié à la valeur de`FeatureTypes`).