

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

# Análisis de documentos
<a name="how-it-works-analyzing"></a>

Amazon Textract analiza documentos y formularios en busca de relaciones entre el texto detectado. Las operaciones de análisis de Amazon Textract devuelven 3 categorías de extracción de documentos: texto, formularios y tablas. El análisis de facturas y recibos se gestiona mediante un proceso diferente; para obtener más información, consulte[Análisis de facturas y recibos](invoices-receipts.md).

**Extracción de texto**  
Texto sin procesar extraído de un documento. Para obtener más información, consulte[Líneas y palabras de texto](how-it-works-lines-words.md).

**Extraction de formularios**  
Los datos del formulario están vinculados a elementos de texto extraídos de un documento. Amazon Textract representa los datos de formulario como pares clave-valor. En el siguiente ejemplo, una de las líneas de texto detectadas por Amazon Textract es*Name: Jane Doe*. Amazon Textract Texact también identifica una clave (*Name:*) y un valor (*Jane Doe*). Para obtener más información, consulte[Datos de formulario (pares clave-valor)](how-it-works-kvp.md).

*Name: Jane Doe*

*Address: 123 Any Street, Anytown, Estados Unidos*

*Fecha de nacimiento: 12-26-09-1980*

Los pares clave-valor también se utilizan para representar casillas de verificación o botones de opción (botones de opción) que se extraen de los formularios.

*male:*☑

Para obtener más información, consulte[Elementos de selección](how-it-works-selectables.md).

**Extraction de tablas**  
Amazon Texact puede extraer tablas, celdas de tabla y elementos de celdas de tabla y puede programarse para devolver los resultados en un archivo JSON, .csv o un archivo.txt.


| Nombre | Dirección | 
| --- | --- | 
|  Ana Carolina  |  Cualquier Ciudad 123  | 

Para obtener más información, consulte [Tablas](how-it-works-tables.md). Los elementos de selección también se pueden extraer de las tablas. Para obtener más información, consulte[Elementos de selección](how-it-works-selectables.md).

Para los artículos analizados, Amazon Textract devuelve lo siguiente en varios[Block](API_Block.md)objects:
+ Las líneas y palabras del texto detectado
+ El contenido de los elementos detectados
+ Relación entre los elementos detectados
+ Página en la que se ha detectado el elemento
+ Ubicación del elemento en la página del documento

Puede utilizar operaciones síncronas o asíncronas para analizar el texto de un documento. Para analizar el texto de forma sincrónica, utilice el[AnalyzeDocument](API_AnalyzeDocument.md)y pasar un documento como entrada.`AnalyzeDocument`devuelve todo el conjunto de resultados. Para obtener más información, consulte [Análisis del texto del documento con Amazon Textract](analyzing-document-text.md). 

Para detectar texto de forma asíncrona, utilice[StartDocumentAnalysis](API_StartDocumentAnalysis.md)para empezar a procesar. Para obtener los resultados, llame[GetDocumentAnalysis](API_GetDocumentAnalysis.md). Los resultados se devuelven en una o más respuestas de`GetDocumentAnalysis`. Para obtener más información y un ejemplo, consulte [Detección o análisis de texto en un documento de varias páginas](async-analyzing-with-sqs.md). 

Para especificar qué tipo de análisis se va a realizar, puede utilizar el`FeatureTypes`parámetro de entrada de lista. Agregue TABLES a la lista para devolver información sobre las tablas detectadas en el documento de entrada, por ejemplo, celdas de tabla, texto de celda y elementos de selección de celdas. Agregue FORMULARIOS para devolver relaciones de palabras, como pares clave-valor y elementos de selección. Para realizar ambos tipos de análisis, agregue TABLAS y FORMS a`FeatureTypes`. 

Todas las líneas y palabras detectadas en el documento se incluyen en la respuesta (incluido el texto no relacionado con el valor de`FeatureTypes`).