

# API de rastreadores y clasificadores
<a name="aws-glue-api-crawler"></a>

La API de rastreadores y clasificadores describe los tipos de datos de rastreadores y clasificadores de AWS Glue e incluye la API para crear, eliminar, actualizar y ver listas de rastreadores o clasificadores.

**Topics**
+ [API de clasificador](aws-glue-api-crawler-classifiers.md)
+ [La API del rastreador](aws-glue-api-crawler-crawling.md)
+ [API de estadísticas de columna](aws-glue-api-crawler-column-statistics.md)
+ [API del programador del rastreador](aws-glue-api-crawler-scheduler.md)

# API de clasificador
<a name="aws-glue-api-crawler-classifiers"></a>

La API de clasificador describe los tipos de datos de clasificador de AWS Glue e incluye la API de creación, eliminación, actualización y creación de listados de clasificadores.

## Tipos de datos
<a name="aws-glue-api-crawler-classifiers-objects"></a>
+ [Estructura Classifier](#aws-glue-api-crawler-classifiers-Classifier)
+ [Estructura GrokClassifier](#aws-glue-api-crawler-classifiers-GrokClassifier)
+ [Estructura XMLClassifier](#aws-glue-api-crawler-classifiers-XMLClassifier)
+ [Estructura JsonClassifier](#aws-glue-api-crawler-classifiers-JsonClassifier)
+ [Estructura CsvClassifier](#aws-glue-api-crawler-classifiers-CsvClassifier)
+ [Estructura CreateGrokClassifierRequest](#aws-glue-api-crawler-classifiers-CreateGrokClassifierRequest)
+ [Estructura UpdateGrokClassifierRequest](#aws-glue-api-crawler-classifiers-UpdateGrokClassifierRequest)
+ [Estructura CreateXMLClassifierRequest](#aws-glue-api-crawler-classifiers-CreateXMLClassifierRequest)
+ [Estructura UpdateXMLClassifierRequest](#aws-glue-api-crawler-classifiers-UpdateXMLClassifierRequest)
+ [Estructura CreateJsonClassifierRequest](#aws-glue-api-crawler-classifiers-CreateJsonClassifierRequest)
+ [Estructura UpdateJsonClassifierRequest](#aws-glue-api-crawler-classifiers-UpdateJsonClassifierRequest)
+ [Estructura CreateCsvClassifierRequest](#aws-glue-api-crawler-classifiers-CreateCsvClassifierRequest)
+ [Estructura UpdateCsvClassifierRequest](#aws-glue-api-crawler-classifiers-UpdateCsvClassifierRequest)

## Estructura Classifier
<a name="aws-glue-api-crawler-classifiers-Classifier"></a>

Los clasificadores se disparan durante una tarea de rastreo. Un clasificador comprueba si un determinado archivo está en un formato que puede administrar. En caso afirmativo, el clasificador crea un esquema en forma de un objeto `StructType` que coincida con formato de datos.

Puede utilizar los clasificadores estándar que suministra AWS Glue o puede escribir sus propios clasificadores para clasificar mejor los orígenes de datos y especificar los esquemas adecuados para usar con ellos. Una clasificador puede ser un clasificador `grok`, un clasificador `XML`, un clasificador `JSON` o un clasificador `CSV` personalizado, en función de lo que se especifique en uno de los campos del objeto `Classifier`.

**Campos**
+ `GrokClassifier`: un objeto [GrokClassifier](#aws-glue-api-crawler-classifiers-GrokClassifier).

  Un clasificador que utiliza `grok`.
+ `XMLClassifier`: un objeto [XMLClassifier](#aws-glue-api-crawler-classifiers-XMLClassifier).

  Un clasificador de contenido XML.
+ `JsonClassifier`: un objeto [JsonClassifier](#aws-glue-api-crawler-classifiers-JsonClassifier).

  Un clasificador de contenido JSON.
+ `CsvClassifier`: un objeto [CsvClassifier](#aws-glue-api-crawler-classifiers-CsvClassifier).

  Un clasificador de valores separados por comas (CSV).

## Estructura GrokClassifier
<a name="aws-glue-api-crawler-classifiers-GrokClassifier"></a>

Un clasificador que utiliza patrones `grok`.

**Campos**
+ `Name`: *obligatorio:* cadena UTF-8, con 1 byte de largo como mínimo y 255 bytes de largo como máximo, que coincide con el [Single-line string pattern](aws-glue-api-common.md#aws-glue-api-regex-oneLine).

  El nombre del clasificador.
+ `Classification` – *Obligatorio:* cadena UTF-8.

  Identificador del formato de los datos que el clasificador correlaciona; por ejemplo, Twitter, JSON, registros de Omniture, etc.
+ `CreationTime`: marca temporal.

  La hora de registro de este clasificador.
+ `LastUpdated`: marca temporal.

  La hora de actualización de este clasificador.
+ `Version`: número (largo).

  Versión de este clasificador.
+ `GrokPattern` – *Obligatorio:* cadena UTF-8, con 1 byte de largo como mínimo y 2048 bytes de largo como máximo, que coincide con el [A Logstash Grok string pattern](aws-glue-api-common.md#aws-glue-api-grok-pattern).

  El patrón grok que este clasificador aplica a un almacén de datos. Para obtener más información, consulte los patrones integrados en [Escritura de clasificadores personalizados](https://docs.aws.amazon.com/glue/latest/dg/custom-classifier.html).
+ `CustomPatterns`: cadena UTF-8 con un máximo de 16000 bytes de largo, que coincide con el [URI address multi-line string pattern](aws-glue-api-common.md#aws-glue-api-regex-uri).

  Patrones de grok personalizados opcionales definidos por este clasificador. Para obtener más información, consulte los patrones personalizados en [Escritura de clasificadores personalizados](https://docs.aws.amazon.com/glue/latest/dg/custom-classifier.html).

## Estructura XMLClassifier
<a name="aws-glue-api-crawler-classifiers-XMLClassifier"></a>

Un clasificador de contenido `XML`.

**Campos**
+ `Name`: *obligatorio:* cadena UTF-8, con 1 byte de largo como mínimo y 255 bytes de largo como máximo, que coincide con el [Single-line string pattern](aws-glue-api-common.md#aws-glue-api-regex-oneLine).

  El nombre del clasificador.
+ `Classification` – *Obligatorio:* cadena UTF-8.

  Identificador del formato de datos que el clasificador correlaciona.
+ `CreationTime`: marca temporal.

  La hora de registro de este clasificador.
+ `LastUpdated`: marca temporal.

  La hora de actualización de este clasificador.
+ `Version`: número (largo).

  Versión de este clasificador.
+ `RowTag`: cadena UTF-8.

  La etiqueta XML que designa el elemento que contiene cada registro en un documento XML que se está analizando. Esto no puede identificar un elemento de cierre (cerrado por `/>`). Un elemento de fila vacío que solo contenga atributos puede analizarse siempre y cuando finalice con una etiqueta de cierre (por ejemplo, `<row item_a="A" item_b="B"></row>` es correcto, pero `<row item_a="A" item_b="B" />` no lo es).

## Estructura JsonClassifier
<a name="aws-glue-api-crawler-classifiers-JsonClassifier"></a>

Un clasificador de contenido `JSON`.

**Campos**
+ `Name`: *obligatorio:* cadena UTF-8, con 1 byte de largo como mínimo y 255 bytes de largo como máximo, que coincide con el [Single-line string pattern](aws-glue-api-common.md#aws-glue-api-regex-oneLine).

  El nombre del clasificador.
+ `CreationTime`: marca temporal.

  La hora de registro de este clasificador.
+ `LastUpdated`: marca temporal.

  La hora de actualización de este clasificador.
+ `Version`: número (largo).

  Versión de este clasificador.
+ `JsonPath` – *Obligatorio:* cadena UTF-8.

  Una cadena `JsonPath` que define los datos JSON que el clasificador debe clasificar. AWS Glue soporta un subconjunto de operadores de JsonPath, tal y como se describe en [Escritura de clasificadores personalizados de JsonPath](https://docs.aws.amazon.com/glue/latest/dg/custom-classifier.html#custom-classifier-json).

## Estructura CsvClassifier
<a name="aws-glue-api-crawler-classifiers-CsvClassifier"></a>

Clasificador de contenido `CSV` personalizado.

**Campos**
+ `Name`: *obligatorio:* cadena UTF-8, con 1 byte de largo como mínimo y 255 bytes de largo como máximo, que coincide con el [Single-line string pattern](aws-glue-api-common.md#aws-glue-api-regex-oneLine).

  El nombre del clasificador.
+ `CreationTime`: marca temporal.

  La hora de registro de este clasificador.
+ `LastUpdated`: marca temporal.

  La hora de actualización de este clasificador.
+ `Version`: número (largo).

  Versión de este clasificador.
+ `Delimiter`: cadena UTF-8, con 1 byte de largo como mínimo y 1 byte de largo como máximo, que coincide con el [Custom string pattern #26](aws-glue-api-common.md#regex_26).

  Símbolo personalizado que indica qué elemento va a separar cada entrada de columna en la fila.
+ `QuoteSymbol`: cadena UTF-8, con 1 byte de largo como mínimo y 1 byte de largo como máximo, que coincide con el [Custom string pattern #26](aws-glue-api-common.md#regex_26).

  Símbolo personalizado que indica qué elemento va a combinar contenido en un valor de columna único. Debe ser distinto al delimitador de columnas.
+ `ContainsHeader`: cadena UTF-8 (valores válidos: `UNKNOWN` \$1 `PRESENT` \$1 `ABSENT`).

  Indica si el archivo CSV contiene un encabezado.
+ `Header`: matriz de cadenas UTF-8.

  Lista de cadenas que representan nombres de columnas.
+ `DisableValueTrimming`: booleano.

  Indica que los valores no deben recortarse antes de identificar el tipo de valores de columna. El valor predeterminado es `true`.
+ `AllowSingleColumn`: booleano.

  Permite procesar los archivos que contienen una sola columna.
+ `CustomDatatypeConfigured`: booleano.

  Permite configurar el tipo de datos personalizado.
+ `CustomDatatypes`: matriz de cadenas UTF-8.

  Lista de tipos de datos personalizados que incluyen "BINARIO", "BOOLEANO", "FECHA", "DECIMAL", "DOUBLE", "FLOAT", "INT", "LONG", "SHORT", "STRING", "TIMESTAMP".
+ `Serde`: cadena UTF-8 (valores válidos: `OpenCSVSerDe` \$1 `LazySimpleSerDe` \$1 `None`).

  Establece el SerDe para procesar CSV en el clasificador, que se aplicará en el catálogo de datos. Los valores válidos son `OpenCSVSerDe`, `LazySimpleSerDe` y `None`. Puede especificar el valor `None` cuando desee que el rastreador realice la detección.

## Estructura CreateGrokClassifierRequest
<a name="aws-glue-api-crawler-classifiers-CreateGrokClassifierRequest"></a>

Especifica un clasificador `grok` para que `CreateClassifier` lo cree.

**Campos**
+ `Classification` – *Obligatorio:* cadena UTF-8.

  Identificador del formato de los datos que el clasificador correlaciona; por ejemplo, Twitter, JSON, registros de Omniture, Amazon CloudWatch Logs, etc.
+ `Name`: *obligatorio:* cadena UTF-8, con 1 byte de largo como mínimo y 255 bytes de largo como máximo, que coincide con el [Single-line string pattern](aws-glue-api-common.md#aws-glue-api-regex-oneLine).

  Nombre del nuevo clasificador.
+ `GrokPattern` – *Obligatorio:* cadena UTF-8, con 1 byte de largo como mínimo y 2048 bytes de largo como máximo, que coincide con el [A Logstash Grok string pattern](aws-glue-api-common.md#aws-glue-api-grok-pattern).

  Patrón de grok que este clasificador utiliza.
+ `CustomPatterns`: cadena UTF-8 con un máximo de 16000 bytes de largo, que coincide con el [URI address multi-line string pattern](aws-glue-api-common.md#aws-glue-api-regex-uri).

  Patrones de grok personalizados opcionales utilizados por este clasificador.

## Estructura UpdateGrokClassifierRequest
<a name="aws-glue-api-crawler-classifiers-UpdateGrokClassifierRequest"></a>

Especifica un clasificador de grok que debe actualizarse cuando se pase a `UpdateClassifier`.

**Campos**
+ `Name`: *obligatorio:* cadena UTF-8, con 1 byte de largo como mínimo y 255 bytes de largo como máximo, que coincide con el [Single-line string pattern](aws-glue-api-common.md#aws-glue-api-regex-oneLine).

  Nombre del elemento `GrokClassifier`.
+ `Classification`: cadena UTF-8.

  Identificador del formato de los datos que el clasificador correlaciona; por ejemplo, Twitter, JSON, registros de Omniture, Amazon CloudWatch Logs, etc.
+ `GrokPattern`: cadena UTF-8, con 1 byte de largo como mínimo y 2048 bytes de largo como máximo, que coincide con el [A Logstash Grok string pattern](aws-glue-api-common.md#aws-glue-api-grok-pattern).

  Patrón de grok que este clasificador utiliza.
+ `CustomPatterns`: cadena UTF-8 con un máximo de 16000 bytes de largo, que coincide con el [URI address multi-line string pattern](aws-glue-api-common.md#aws-glue-api-regex-uri).

  Patrones de grok personalizados opcionales utilizados por este clasificador.

## Estructura CreateXMLClassifierRequest
<a name="aws-glue-api-crawler-classifiers-CreateXMLClassifierRequest"></a>

Especifica un clasificador de XML para que `CreateClassifier` lo cree.

**Campos**
+ `Classification` – *Obligatorio:* cadena UTF-8.

  Identificador del formato de datos que el clasificador correlaciona.
+ `Name`: *obligatorio:* cadena UTF-8, con 1 byte de largo como mínimo y 255 bytes de largo como máximo, que coincide con el [Single-line string pattern](aws-glue-api-common.md#aws-glue-api-regex-oneLine).

  El nombre del clasificador.
+ `RowTag`: cadena UTF-8.

  La etiqueta XML que designa el elemento que contiene cada registro en un documento XML que se está analizando. Esto no puede identificar un elemento de cierre (cerrado por `/>`). Un elemento de fila vacío que solo contenga atributos puede analizarse siempre y cuando finalice con una etiqueta de cierre (por ejemplo, `<row item_a="A" item_b="B"></row>` es correcto, pero `<row item_a="A" item_b="B" />` no lo es).

## Estructura UpdateXMLClassifierRequest
<a name="aws-glue-api-crawler-classifiers-UpdateXMLClassifierRequest"></a>

Especifica un clasificador de XML que debe actualizarse.

**Campos**
+ `Name`: *obligatorio:* cadena UTF-8, con 1 byte de largo como mínimo y 255 bytes de largo como máximo, que coincide con el [Single-line string pattern](aws-glue-api-common.md#aws-glue-api-regex-oneLine).

  El nombre del clasificador.
+ `Classification`: cadena UTF-8.

  Identificador del formato de datos que el clasificador correlaciona.
+ `RowTag`: cadena UTF-8.

  La etiqueta XML que designa el elemento que contiene cada registro en un documento XML que se está analizando. Tenga en cuenta que no puede identificar un elemento que se autocierra (cerrado con `/>`). Un elemento de fila vacío que solo contenga atributos puede analizarse siempre y cuando finalice con una etiqueta de cierre (por ejemplo, `<row item_a="A" item_b="B"></row>` es correcto, pero `<row item_a="A" item_b="B" />` no lo es).

## Estructura CreateJsonClassifierRequest
<a name="aws-glue-api-crawler-classifiers-CreateJsonClassifierRequest"></a>

Especifica un clasificador de JSON para que `CreateClassifier` lo cree.

**Campos**
+ `Name`: *obligatorio:* cadena UTF-8, con 1 byte de largo como mínimo y 255 bytes de largo como máximo, que coincide con el [Single-line string pattern](aws-glue-api-common.md#aws-glue-api-regex-oneLine).

  El nombre del clasificador.
+ `JsonPath` – *Obligatorio:* cadena UTF-8.

  Una cadena `JsonPath` que define los datos JSON que el clasificador debe clasificar. AWS Glue soporta un subconjunto de operadores de JsonPath, tal y como se describe en [Escritura de clasificadores personalizados de JsonPath](https://docs.aws.amazon.com/glue/latest/dg/custom-classifier.html#custom-classifier-json).

## Estructura UpdateJsonClassifierRequest
<a name="aws-glue-api-crawler-classifiers-UpdateJsonClassifierRequest"></a>

Especifica un clasificador de JSON que debe actualizarse.

**Campos**
+ `Name`: *obligatorio:* cadena UTF-8, con 1 byte de largo como mínimo y 255 bytes de largo como máximo, que coincide con el [Single-line string pattern](aws-glue-api-common.md#aws-glue-api-regex-oneLine).

  El nombre del clasificador.
+ `JsonPath`: cadena UTF-8.

  Una cadena `JsonPath` que define los datos JSON que el clasificador debe clasificar. AWS Glue soporta un subconjunto de operadores de JsonPath, tal y como se describe en [Escritura de clasificadores personalizados de JsonPath](https://docs.aws.amazon.com/glue/latest/dg/custom-classifier.html#custom-classifier-json).

## Estructura CreateCsvClassifierRequest
<a name="aws-glue-api-crawler-classifiers-CreateCsvClassifierRequest"></a>

Especifica un clasificador CSV personalizado para que `CreateClassifier` lo cree.

**Campos**
+ `Name`: *obligatorio:* cadena UTF-8, con 1 byte de largo como mínimo y 255 bytes de largo como máximo, que coincide con el [Single-line string pattern](aws-glue-api-common.md#aws-glue-api-regex-oneLine).

  El nombre del clasificador.
+ `Delimiter`: cadena UTF-8, con 1 byte de largo como mínimo y 1 byte de largo como máximo, que coincide con el [Custom string pattern #26](aws-glue-api-common.md#regex_26).

  Símbolo personalizado que indica qué elemento va a separar cada entrada de columna en la fila.
+ `QuoteSymbol`: cadena UTF-8, con 1 byte de largo como mínimo y 1 byte de largo como máximo, que coincide con el [Custom string pattern #26](aws-glue-api-common.md#regex_26).

  Símbolo personalizado que indica qué elemento va a combinar contenido en un valor de columna único. Debe ser diferente al delimitador de columnas.
+ `ContainsHeader`: cadena UTF-8 (valores válidos: `UNKNOWN` \$1 `PRESENT` \$1 `ABSENT`).

  Indica si el archivo CSV contiene un encabezado.
+ `Header`: matriz de cadenas UTF-8.

  Lista de cadenas que representan nombres de columnas.
+ `DisableValueTrimming`: booleano.

  Indica que los valores no deben recortarse antes de identificar el tipo de valores de columna. El valor predeterminado es true.
+ `AllowSingleColumn`: booleano.

  Permite procesar los archivos que contienen una sola columna.
+ `CustomDatatypeConfigured`: booleano.

  Permite la configuración de tipos de datos personalizados.
+ `CustomDatatypes`: matriz de cadenas UTF-8.

  Crea una lista de tipos de datos personalizados compatibles.
+ `Serde`: cadena UTF-8 (valores válidos: `OpenCSVSerDe` \$1 `LazySimpleSerDe` \$1 `None`).

  Establece el SerDe para procesar CSV en el clasificador, que se aplicará en el catálogo de datos. Los valores válidos son `OpenCSVSerDe`, `LazySimpleSerDe` y `None`. Puede especificar el valor `None` cuando desee que el rastreador realice la detección.

## Estructura UpdateCsvClassifierRequest
<a name="aws-glue-api-crawler-classifiers-UpdateCsvClassifierRequest"></a>

Especifica un clasificador CSV personalizado para que se actualice.

**Campos**
+ `Name`: *obligatorio:* cadena UTF-8, con 1 byte de largo como mínimo y 255 bytes de largo como máximo, que coincide con el [Single-line string pattern](aws-glue-api-common.md#aws-glue-api-regex-oneLine).

  El nombre del clasificador.
+ `Delimiter`: cadena UTF-8, con 1 byte de largo como mínimo y 1 byte de largo como máximo, que coincide con el [Custom string pattern #26](aws-glue-api-common.md#regex_26).

  Símbolo personalizado que indica qué elemento va a separar cada entrada de columna en la fila.
+ `QuoteSymbol`: cadena UTF-8, con 1 byte de largo como mínimo y 1 byte de largo como máximo, que coincide con el [Custom string pattern #26](aws-glue-api-common.md#regex_26).

  Símbolo personalizado que indica qué elemento va a combinar contenido en un valor de columna único. Debe ser distinto al delimitador de columnas.
+ `ContainsHeader`: cadena UTF-8 (valores válidos: `UNKNOWN` \$1 `PRESENT` \$1 `ABSENT`).

  Indica si el archivo CSV contiene un encabezado.
+ `Header`: matriz de cadenas UTF-8.

  Lista de cadenas que representan nombres de columnas.
+ `DisableValueTrimming`: booleano.

  Indica que los valores no deben recortarse antes de identificar el tipo de valores de columna. El valor predeterminado es true.
+ `AllowSingleColumn`: booleano.

  Permite procesar los archivos que contienen una sola columna.
+ `CustomDatatypeConfigured`: booleano.

  Especifica la configuración de los tipos de datos personalizados.
+ `CustomDatatypes`: matriz de cadenas UTF-8.

  Especifica una lista de tipos de datos personalizados compatibles.
+ `Serde`: cadena UTF-8 (valores válidos: `OpenCSVSerDe` \$1 `LazySimpleSerDe` \$1 `None`).

  Establece el SerDe para procesar CSV en el clasificador, que se aplicará en el catálogo de datos. Los valores válidos son `OpenCSVSerDe`, `LazySimpleSerDe` y `None`. Puede especificar el valor `None` cuando desee que el rastreador realice la detección.

## Operaciones
<a name="aws-glue-api-crawler-classifiers-actions"></a>
+ [Acción CreateClassifier (Python: create\$1classifier)](#aws-glue-api-crawler-classifiers-CreateClassifier)
+ [Acción DeleteClassifier (Python: delete\$1classifier)](#aws-glue-api-crawler-classifiers-DeleteClassifier)
+ [Acción GetClassifier (Python: get\$1classifier)](#aws-glue-api-crawler-classifiers-GetClassifier)
+ [Acción GetClassifiers (Python: get\$1classifiers)](#aws-glue-api-crawler-classifiers-GetClassifiers)
+ [Acción UpdateClassifier (Python: update\$1classifier)](#aws-glue-api-crawler-classifiers-UpdateClassifier)

## Acción CreateClassifier (Python: create\$1classifier)
<a name="aws-glue-api-crawler-classifiers-CreateClassifier"></a>

Crea un clasificador en la cuenta del usuario. Puede ser `GrokClassifier`, `XMLClassifier`, `JsonClassifier` o `CsvClassifier`, en función de qué campo de la solicitud esté presente.

**Solicitud**
+ `GrokClassifier`: un objeto [CreateGrokClassifierRequest](#aws-glue-api-crawler-classifiers-CreateGrokClassifierRequest).

  Objeto `GrokClassifier` que especifica el clasificador que debe crearse.
+ `XMLClassifier`: un objeto [CreateXMLClassifierRequest](#aws-glue-api-crawler-classifiers-CreateXMLClassifierRequest).

  Objeto `XMLClassifier` que especifica el clasificador que debe crearse.
+ `JsonClassifier`: un objeto [CreateJsonClassifierRequest](#aws-glue-api-crawler-classifiers-CreateJsonClassifierRequest).

  Objeto `JsonClassifier` que especifica el clasificador que debe crearse.
+ `CsvClassifier`: un objeto [CreateCsvClassifierRequest](#aws-glue-api-crawler-classifiers-CreateCsvClassifierRequest).

  Objeto `CsvClassifier` que especifica el clasificador que debe crearse.

**Respuesta**
+ *Sin parámetros de respuesta.*

**Errores**
+ `AlreadyExistsException`
+ `InvalidInputException`
+ `OperationTimeoutException`

## Acción DeleteClassifier (Python: delete\$1classifier)
<a name="aws-glue-api-crawler-classifiers-DeleteClassifier"></a>

Quita un clasificador del catálogo de datos.

**Solicitud**
+ `Name`: *obligatorio:* cadena UTF-8, con 1 byte de largo como mínimo y 255 bytes de largo como máximo, que coincide con el [Single-line string pattern](aws-glue-api-common.md#aws-glue-api-regex-oneLine).

  Nombre del clasificador que debe eliminarse.

**Respuesta**
+ *Sin parámetros de respuesta.*

**Errores**
+ `EntityNotFoundException`
+ `OperationTimeoutException`

## Acción GetClassifier (Python: get\$1classifier)
<a name="aws-glue-api-crawler-classifiers-GetClassifier"></a>

Recupera un clasificador por su nombre.

**Solicitud**
+ `Name`: *obligatorio:* cadena UTF-8, con 1 byte de largo como mínimo y 255 bytes de largo como máximo, que coincide con el [Single-line string pattern](aws-glue-api-common.md#aws-glue-api-regex-oneLine).

  Nombre del clasificador que debe recuperarse.

**Respuesta**
+ `Classifier`: un objeto [Clasificador](#aws-glue-api-crawler-classifiers-Classifier).

  El clasificador solicitado.

**Errores**
+ `EntityNotFoundException`
+ `OperationTimeoutException`

## Acción GetClassifiers (Python: get\$1classifiers)
<a name="aws-glue-api-crawler-classifiers-GetClassifiers"></a>

Muestra todos los objetos de tipo clasificador del catálogo de datos.

**Solicitud**
+ `MaxResults`: número (entero) que no es inferior a 1 ni es superior a 1000.

  Tamaño de la lista que se devolverá (opcional).
+ `NextToken`: cadena UTF-8.

  Token de continuación opcional.

**Respuesta**
+ `Classifiers`: matriz de objetos [Clasificador](#aws-glue-api-crawler-classifiers-Classifier).

  La lista de objetos de tipo clasificador solicitada.
+ `NextToken`: cadena UTF-8.

  Token de continuación.

**Errores**
+ `OperationTimeoutException`

## Acción UpdateClassifier (Python: update\$1classifier)
<a name="aws-glue-api-crawler-classifiers-UpdateClassifier"></a>

Modifica un clasificador existente (`GrokClassifier`, `XMLClassifier`, `JsonClassifier` o `CsvClassifier`, en función del campo que esté presente).

**Solicitud**
+ `GrokClassifier`: un objeto [UpdateGrokClassifierRequest](#aws-glue-api-crawler-classifiers-UpdateGrokClassifierRequest).

  Objeto `GrokClassifier` con campos actualizados.
+ `XMLClassifier`: un objeto [UpdateXMLClassifierRequest](#aws-glue-api-crawler-classifiers-UpdateXMLClassifierRequest).

  Objeto `XMLClassifier` con campos actualizados.
+ `JsonClassifier`: un objeto [UpdateJsonClassifierRequest](#aws-glue-api-crawler-classifiers-UpdateJsonClassifierRequest).

  Objeto `JsonClassifier` con campos actualizados.
+ `CsvClassifier`: un objeto [UpdateCsvClassifierRequest](#aws-glue-api-crawler-classifiers-UpdateCsvClassifierRequest).

  Objeto `CsvClassifier` con campos actualizados.

**Respuesta**
+ *Sin parámetros de respuesta.*

**Errores**
+ `InvalidInputException`
+ `VersionMismatchException`
+ `EntityNotFoundException`
+ `OperationTimeoutException`

# La API del rastreador
<a name="aws-glue-api-crawler-crawling"></a>

La API del rastreador describe los tipos de datos del rastreador de AWS Glue, junto con la API de creación, eliminación, actualización y creación de listados de rastreadores.

## Tipos de datos
<a name="aws-glue-api-crawler-crawling-objects"></a>
+ [Estructura de rastreador](#aws-glue-api-crawler-crawling-Crawler)
+ [Estructura de programación](#aws-glue-api-crawler-crawling-Schedule)
+ [Estructura CrawlerTargets](#aws-glue-api-crawler-crawling-CrawlerTargets)
+ [Estructura S3Target](#aws-glue-api-crawler-crawling-S3Target)
+ [Estructura de S3DeltaCatalogTarget](#aws-glue-api-crawler-crawling-S3DeltaCatalogTarget)
+ [Estructura de S3DeltaDirectTarget](#aws-glue-api-crawler-crawling-S3DeltaDirectTarget)
+ [Estructura JdbcTarget](#aws-glue-api-crawler-crawling-JdbcTarget)
+ [Estructura MongoDBTarget](#aws-glue-api-crawler-crawling-MongoDBTarget)
+ [Estructura DynamoDBTarget](#aws-glue-api-crawler-crawling-DynamoDBTarget)
+ [Estructura DeltaTarget](#aws-glue-api-crawler-crawling-DeltaTarget)
+ [Estructura de IcebergTarget](#aws-glue-api-crawler-crawling-IcebergTarget)
+ [Estructura de HudiTarget](#aws-glue-api-crawler-crawling-HudiTarget)
+ [Estructura CatalogTarget](#aws-glue-api-crawler-crawling-CatalogTarget)
+ [Estructura CrawlerMetrics](#aws-glue-api-crawler-crawling-CrawlerMetrics)
+ [Estructura de CrawlerHistory](#aws-glue-api-crawler-crawling-CrawlerHistory)
+ [Estructura de CrawlsFilter](#aws-glue-api-crawler-crawling-CrawlsFilter)
+ [Estructura SchemaChangePolicy](#aws-glue-api-crawler-crawling-SchemaChangePolicy)
+ [Estructura LastCrawlInfo](#aws-glue-api-crawler-crawling-LastCrawlInfo)
+ [Estructura RecrawlPolicy](#aws-glue-api-crawler-crawling-RecrawlPolicy)
+ [Estructura LineageConfiguration](#aws-glue-api-crawler-crawling-LineageConfiguration)
+ [Estructura LakeFormationConfiguration](#aws-glue-api-crawler-crawling-LakeFormationConfiguration)

## Estructura de rastreador
<a name="aws-glue-api-crawler-crawling-Crawler"></a>

Especifica un programa de rastreador que examina un origen de datos y utiliza clasificadores para intentar determinar su esquema. Si ejecuta la operación correctamente, el rastreador registra los metadatos relativos al origen de los datos en AWS Glue Data Catalog.

**Campos**
+ `Name` – cadena UTF-8, con 1 byte de largo como mínimo y 255 bytes de largo como máximo, que coincide con el [Single-line string pattern](aws-glue-api-common.md#aws-glue-api-regex-oneLine).

  Nombre del rastreador.
+ `Role`: cadena UTF-8.

  El nombre de recurso de Amazon (ARN) de un rol de IAM que se utiliza para obtener acceso a los recursos del cliente como, por ejemplo, los datos de Amazon Simple Storage Service (Amazon S3).
+ `Targets`: un objeto [CrawlerTargets](#aws-glue-api-crawler-crawling-CrawlerTargets).

  Colección de objetivos del rastreo.
+ `DatabaseName`: cadena UTF-8.

  El nombre de la base de datos donde se almacena la salida del rastreador.
+ `Description` – cadena de descripción de un máximo de 2048 bytes de largo, que coincide con el [URI address multi-line string pattern](aws-glue-api-common.md#aws-glue-api-regex-uri).

  Descripción del rastreador.
+ `Classifiers`: matriz de cadenas UTF-8.

  Una lista de cadenas UTF-8 que especifican los clasificadores personalizados que están asociados al rastreador.
+ `RecrawlPolicy`: un objeto [RecrawlPolicy](#aws-glue-api-crawler-crawling-RecrawlPolicy).

  Política que especifica si se debe rastrear de nuevo todo el conjunto de datos o si se deben rastrear sólo las carpetas que se agregaron desde la última ejecución del rastreador.
+ `SchemaChangePolicy`: un objeto [SchemaChangePolicy](#aws-glue-api-crawler-crawling-SchemaChangePolicy).

  La política que especifica los comportamientos de actualización y eliminación del rastreador.
+ `LineageConfiguration`: un objeto [LineageConfiguration](#aws-glue-api-crawler-crawling-LineageConfiguration).

  Configuración que especifica si el linaje de datos está habilitado para el rastreador.
+ `State` – Cadena UTF-8 (valores válidos: `READY` \$1 `RUNNING` \$1 `STOPPING`).

  Indica si el rastreador se está ejecutando o si queda pendiente una ejecución.
+ `TablePrefix`: cadena UTF-8 de 128 bytes de largo como máximo.

  Prefijo añadido a los nombres de tablas que se crean.
+ `Schedule`: un objeto [Programación](aws-glue-api-crawler-scheduler.md#aws-glue-api-crawler-scheduler-Schedule).

  En rastreadores programados, el programa cuando se ejecuta el rastreador.
+ `CrawlElapsedTime`: número (largo).

  Si el rastreador se está ejecutando, contiene el tiempo transcurrido total desde que comenzó el último rastreo.
+ `CreationTime`: marca temporal.

  La hora de creación del rastreador.
+ `LastUpdated`: marca temporal.

  La hora de la última actualización del rastreador.
+ `LastCrawl`: un objeto [LastCrawlInfo](#aws-glue-api-crawler-crawling-LastCrawlInfo).

  Estado del último rastreo e información de error potencial si se produjo un error.
+ `Version`: número (largo).

  Versión del rastreador.
+ `Configuration`: cadena UTF-8.

  Información de configuración del rastreador. Esta cadena JSON con varias versiones permite a los usuarios especificar aspectos del comportamiento de un rastreador. Para obtener más información, consulte [Establecimiento de opciones de configuración de rastreadores](https://docs.aws.amazon.com/glue/latest/dg/crawler-configuration.html).
+ `CrawlerSecurityConfiguration`: cadena UTF-8 de 128 bytes de largo como máximo.

  El nombre de la estructura `SecurityConfiguration` que va a utilizar este rastreador.
+ `LakeFormationConfiguration`: un objeto [LakeFormationConfiguration](#aws-glue-api-crawler-crawling-LakeFormationConfiguration).

  Especifica si el rastreador debe utilizar credenciales de AWS Lake Formation para el rastreador en lugar de las credenciales de rol de IAM.

## Estructura de programación
<a name="aws-glue-api-crawler-crawling-Schedule"></a>

Objeto de programación que usa una instrucción `cron` para programar un evento.

**Campos**
+ `ScheduleExpression`: cadena UTF-8.

  Expresión `cron` utilizada para especificar el programa (consulte [Programaciones basadas en tiempo para trabajos y rastreadores](https://docs.aws.amazon.com/glue/latest/dg/monitor-data-warehouse-schedule.html)). Por ejemplo, para ejecutar algo todos los días a las 12:15 UTC, especifique: `cron(15 12 * * ? *)`.
+ `State` – Cadena UTF-8 (valores válidos: `SCHEDULED` \$1 `NOT_SCHEDULED` \$1 `TRANSITIONING`).

  Estado del programa.

## Estructura CrawlerTargets
<a name="aws-glue-api-crawler-crawling-CrawlerTargets"></a>

Especifica los almacenes de datos que deben rastrearse.

**Campos**
+ `S3Targets`: matriz de objetos [S3Target](#aws-glue-api-crawler-crawling-S3Target).

  Especifica los destinos de Amazon Simple Storage Service (Amazon S3).
+ `JdbcTargets`: matriz de objetos [JdbcTarget](#aws-glue-api-crawler-crawling-JdbcTarget).

  Especifica los destinos de JDBC.
+ `MongoDBTargets`: matriz de objetos [MongoDBTarget](#aws-glue-api-crawler-crawling-MongoDBTarget).

  Especifica los orígenes de Amazon DocumentDB o MongoDB.
+ `DynamoDBTargets`: matriz de objetos [DynamoDBTarget](#aws-glue-api-crawler-crawling-DynamoDBTarget).

  Especifica los destinos de Amazon DynamoDB.
+ `CatalogTargets`: matriz de objetos [CatalogTarget](#aws-glue-api-crawler-crawling-CatalogTarget).

  Especifica orígenes de AWS Glue Data Catalog.
+ `DeltaTargets`: matriz de objetos [DeltaTarget](#aws-glue-api-crawler-crawling-DeltaTarget).

  Especifica los destinos de almacenamiento de datos Delta.
+ `IcebergTargets`: matriz de objetos [IcebergTarget](#aws-glue-api-crawler-crawling-IcebergTarget).

  Especifica los destinos de almacenamiento de datos Apache Iceberg.
+ `HudiTargets`: matriz de objetos [HudiTarget](#aws-glue-api-crawler-crawling-HudiTarget).

  Especifica los destinos de almacenamiento de datos Apache Hudi.

## Estructura S3Target
<a name="aws-glue-api-crawler-crawling-S3Target"></a>

Especifica un almacén de datos en Amazon Simple Storage Service (Amazon S3).

**Campos**
+ `Path`: cadena UTF-8.

  Ruta al destino de Amazon S3.
+ `Exclusions`: matriz de cadenas UTF-8.

  Lista de patrones glob utilizados para excluir elementos del rastreo. Para obtener más información, consulte la sección acerca de cómo [Catalogar tablas con un rastreador](https://docs.aws.amazon.com/glue/latest/dg/add-crawler.html).
+ `ConnectionName`: cadena UTF-8 con una extensión de 1 byte como mínimo o 2048 bytes como máximo.

  Nombre de una conexión que permite a un trabajo o rastreador acceder a los datos de Amazon S3 dentro de un entorno de Amazon Virtual Private Cloud (Amazon VPC).
+ `SampleSize`: número (entero).

  Establece el número de archivos de cada carpeta que se van a rastrear al rastrear archivos de ejemplo en un conjunto de datos. Si no se establece, se rastrean todos los archivos. Un valor válido es un entero entre 1 y 249.
+ `EventQueueArn`: cadena UTF-8.

  Un ARN de Amazon SQS válido. Por ejemplo, `arn:aws:sqs:region:account:sqs`.
+ `DlqEventQueueArn`: cadena UTF-8.

  Un ARN de Amazon SQS válido con mensajes fallidos. Por ejemplo, `arn:aws:sqs:region:account:deadLetterQueue`.

## Estructura de S3DeltaCatalogTarget
<a name="aws-glue-api-crawler-crawling-S3DeltaCatalogTarget"></a>

Especifica un destino que escribe en un origen de datos de Delta Lake en el Catálogo de datos de AWS Glue.

**Campos**
+ `Name`: *obligatorio:* cadena UTF-8 que coincide con el [Custom string pattern #63](aws-glue-api-common.md#regex_63).

  El nombre del destino de datos.
+ `Inputs`: *Obligatorio:* matriz de cadenas UTF-8, con una cadena como mínimo y una cadena como máximo.

  Los nodos que son entradas para el destino de datos.
+ `PartitionKeys`: matriz de cadenas UTF-8.

  Especifica la partición nativa mediante una secuencia de claves.
+ `Table`: *obligatorio:* cadena UTF-8 que coincide con el [Custom string pattern #61](aws-glue-api-common.md#regex_61).

  El nombre de la tabla de la base de datos de escritura.
+ `Database`: *obligatorio:* cadena UTF-8 que coincide con el [Custom string pattern #61](aws-glue-api-common.md#regex_61).

  El nombre de la base de datos de escritura.
+ `AdditionalOptions`: matriz de mapas de pares clave-valor.

  Cada clave es una cadena UTF-8 que coincide con el [Custom string pattern #61](aws-glue-api-common.md#regex_61).

  Cada valor es una cadena UTF-8 que coincide con el [Custom string pattern #61](aws-glue-api-common.md#regex_61).

  Especifica opciones de conexión adicionales para el conector.
+ `SchemaChangePolicy`: un objeto [CatalogSchemaChangePolicy](aws-glue-api-visual-job-api.md#aws-glue-api-visual-job-api-CatalogSchemaChangePolicy).

  Una política que especifica los comportamientos de actualización del rastreador.
+ `AutoDataQuality`: un objeto [AutoDataQuality](aws-glue-api-visual-job-api.md#aws-glue-api-visual-job-api-AutoDataQuality).

  Especifica si se habilita automáticamente la evaluación de la calidad de los datos para el destino del catálogo de Delta de S3. Si se establece en `true`, las comprobaciones de calidad de los datos se realizan automáticamente durante la operación de escritura.
+ `OutputSchemas`: matriz de objetos [GlueSchema](aws-glue-api-visual-job-api.md#aws-glue-api-visual-job-api-GlueSchema).

  Especifica el esquema de datos para el destino del catálogo de Delta de S3.

## Estructura de S3DeltaDirectTarget
<a name="aws-glue-api-crawler-crawling-S3DeltaDirectTarget"></a>

Especifica un destino que escribe en un origen de datos de Delta Lake en el Amazon S3.

**Campos**
+ `Name`: *obligatorio:* cadena UTF-8 que coincide con el [Custom string pattern #63](aws-glue-api-common.md#regex_63).

  El nombre del destino de datos.
+ `Inputs`: *Obligatorio:* matriz de cadenas UTF-8, con una cadena como mínimo y una cadena como máximo.

  Los nodos que son entradas para el destino de datos.
+ `PartitionKeys`: matriz de cadenas UTF-8.

  Especifica la partición nativa mediante una secuencia de claves.
+ `Path`: *obligatorio:* cadena UTF-8 que coincide con el [Custom string pattern #61](aws-glue-api-common.md#regex_61).

  La ruta de Amazon S3 del origen de datos de Delta Lake en la que desea escribir.
+ `Compression`: *obligatorio:* cadena UTF-8 (valores válidos: `uncompressed="UNCOMPRESSED"` \$1 `snappy="SNAPPY"`).

  Especifica la forma en que los datos se comprimen. Po lo general no es necesario si los datos tienen una extensión de archivo estándar. Los posibles valores son `"gzip"` y `"bzip"`).
+ `NumberTargetPartitions`: cadena UTF-8.

  Especifica cuántas particiones de destino se utilizan para distribuir los archivos del conjunto de datos de Delta Lake en Amazon S3.
+ `Format`: *Obligatorio:* cadena UTF-8 (valores válidos: `json="JSON"` \$1 `csv="CSV"` \$1 `avro="AVRO"` \$1 `orc="ORC"` \$1 `parquet="PARQUET"` \$1 `hudi="HUDI"` \$1 `delta="DELTA"` \$1 `iceberg="ICEBERG"` \$1 `hyper="HYPER"` \$1 `xml="XML"`).

  Especifica el formato de salida de datos para el destino.
+ `AdditionalOptions`: matriz de mapas de pares clave-valor.

  Cada clave es una cadena UTF-8 que coincide con el [Custom string pattern #61](aws-glue-api-common.md#regex_61).

  Cada valor es una cadena UTF-8 que coincide con el [Custom string pattern #61](aws-glue-api-common.md#regex_61).

  Especifica opciones de conexión adicionales para el conector.
+ `SchemaChangePolicy`: un objeto [DirectSchemaChangePolicy](aws-glue-api-visual-job-api.md#aws-glue-api-visual-job-api-DirectSchemaChangePolicy).

  Una política que especifica los comportamientos de actualización del rastreador.
+ `AutoDataQuality`: un objeto [AutoDataQuality](aws-glue-api-visual-job-api.md#aws-glue-api-visual-job-api-AutoDataQuality).

  Especifica si se debe habilitar automáticamente la evaluación de la calidad de los datos para el destino directo de Delta de S3. Si se establece en `true`, las comprobaciones de calidad de los datos se realizan automáticamente durante la operación de escritura.

## Estructura JdbcTarget
<a name="aws-glue-api-crawler-crawling-JdbcTarget"></a>

Especifica un almacén de datos JDBC donde efectuar el rastreo.

**Campos**
+ `ConnectionName`: cadena UTF-8 con una extensión de 1 byte como mínimo o 2048 bytes como máximo.

  Nombre de la conexión que se utilizará para establecer conexión con el destino de JDBC.
+ `Path`: cadena UTF-8.

  Ruta del destino de JDBC.
+ `Exclusions`: matriz de cadenas UTF-8.

  Lista de patrones glob utilizados para excluir elementos del rastreo. Para obtener más información, consulte la sección acerca de cómo [Catalogar tablas con un rastreador](https://docs.aws.amazon.com/glue/latest/dg/add-crawler.html).
+ `EnableAdditionalMetadata`: matriz de cadenas UTF-8.

  Especifique un valor de `RAWTYPES` o `COMMENTS` para habilitar metadatos adicionales en las respuestas de la tabla. `RAWTYPES` proporciona el tipo de datos de nivel nativo. `COMMENTS` proporciona comentarios asociados a una columna o tabla de la base de datos.

  Si no necesita metadatos adicionales, mantenga el campo vacío.

## Estructura MongoDBTarget
<a name="aws-glue-api-crawler-crawling-MongoDBTarget"></a>

Especifica un almacén de datos Amazon DocumentDB o MongoDB donde realizar el rastreo.

**Campos**
+ `ConnectionName`: cadena UTF-8 con una extensión de 1 byte como mínimo o 2048 bytes como máximo.

  Nombre de la conexión que se utilizará para establecer conexión con el origen de Amazon DocumentDB o MongoDB.
+ `Path`: cadena UTF-8.

  Ruta de acceso del origen de Amazon DocumentDB o MongoDB (base de datos/recopilación).
+ `ScanAll`: booleano.

  Indica si se deben analizar todos los registros o si se deben muestrear filas de la tabla. Escanear todos los registros puede tardar mucho tiempo cuando la tabla no es una tabla de alto rendimiento.

  Un valor de `true` significa que hay que escanear todos los registros, mientras que un valor de `false` significa que se deben muestrear los registros. Si no se especifica ningún valor, el valor predeterminado es `true`.

## Estructura DynamoDBTarget
<a name="aws-glue-api-crawler-crawling-DynamoDBTarget"></a>

Especifica una tabla de Amazon DynamoDB para rastrear.

**Campos**
+ `Path`: cadena UTF-8.

  Nombre de la tabla de DynamoDB donde efectuar el rastreo.
+ `scanAll`: booleano.

  Indica si se deben analizar todos los registros o si se deben muestrear filas de la tabla. Escanear todos los registros puede tardar mucho tiempo cuando la tabla no es una tabla de alto rendimiento.

  Un valor de `true` significa que hay que escanear todos los registros, mientras que un valor de `false` significa que se deben muestrear los registros. Si no se especifica ningún valor, el valor predeterminado es `true`.
+ `scanRate`: número (doble).

  El porcentaje de las unidades de capacidad de lectura configuradas que utilizará el rastreador de AWS Glue. Unidades de capacidad de lectura es un término definido por DynamoDB y es un valor numérico que actúa como limitador de velocidad del número de lecturas que se pueden realizar en esa tabla por segundo.

  Los valores válidos son nulos o un valor entre 0,1 y 1,5. Se utiliza un valor nulo cuando el usuario no proporciona un valor y el valor predeterminado es 0,5 de la unidad de capacidad de lectura configurada (en tablas aprovisionadas) o 0,25 de la unidad de capacidad de lectura máxima configurada (en tablas que utilizan el modo bajo demanda).

## Estructura DeltaTarget
<a name="aws-glue-api-crawler-crawling-DeltaTarget"></a>

Especifica un almacenamiento de datos Delta para rastrear una o más tablas Delta.

**Campos**
+ `DeltaTables`: matriz de cadenas UTF-8.

  Una lista de las rutas de Simple Storage Service (Amazon S3) hacia las tablas Delta.
+ `ConnectionName`: cadena UTF-8 con una extensión de 1 byte como mínimo o 2048 bytes como máximo.

  Nombre de la conexión que se utilizará para establecer conexión con el destino de la tabla Delta.
+ `WriteManifest`: booleano.

  Especifica si se deben escribir los archivos de manifiesto en la ruta de la tabla Delta.
+ `CreateNativeDeltaTable`: booleano.

  Especifica si el rastreador creará tablas nativas para permitir la integración con los motores de consulta que permiten consultar directamente el registro de transacciones de Delta.

## Estructura de IcebergTarget
<a name="aws-glue-api-crawler-crawling-IcebergTarget"></a>

Especifica un origen de datos de Apache Iceberg en la que se almacenan las tablas de Iceberg en Amazon S3.

**Campos**
+ `Paths`: matriz de cadenas UTF-8.

  Una o más rutas de Amazon S3 que contienen carpetas de metadatos de Iceberg como `s3://bucket/prefix`.
+ `ConnectionName`: cadena UTF-8 con una extensión de 1 byte como mínimo o 2048 bytes como máximo.

  Nombre de la conexión que se utilizará para establecer conexión con el destino de Iceberg.
+ `Exclusions`: matriz de cadenas UTF-8.

  Lista de patrones glob utilizados para excluir elementos del rastreo. Para obtener más información, consulte la sección acerca de cómo [Catalogar tablas con un rastreador](https://docs.aws.amazon.com/glue/latest/dg/add-crawler.html).
+ `MaximumTraversalDepth`: número (entero).

  La profundidad máxima de las rutas de Amazon S3 que el rastreador puede recorrer para descubrir la carpeta de metadatos de Iceberg en la ruta de Amazon S3. Se utiliza para limitar el tiempo de ejecución del rastreador.

## Estructura de HudiTarget
<a name="aws-glue-api-crawler-crawling-HudiTarget"></a>

Especifica un origen de datos Apache Hudi.

**Campos**
+ `Paths`: matriz de cadenas UTF-8.

  Matriz de cadenas de ubicación de Amazon S3 para Hudi, cada una de las cuales indica la carpeta raíz con la que residen los archivos de metadatos de una tabla Hudi. La carpeta Hudi puede estar ubicada en una carpeta secundaria de la carpeta raíz.

  El rastreador escaneará todas las carpetas situadas debajo de una ruta para una carpeta Hudi.
+ `ConnectionName`: cadena UTF-8 con una extensión de 1 byte como mínimo o 2048 bytes como máximo.

  Nombre de la conexión que se utilizará para establecer conexión con el destino de Hudi. Si sus archivos Hudi están almacenados en buckets que requieren autorización de VPC, puede configurar sus propiedades de conexión aquí.
+ `Exclusions`: matriz de cadenas UTF-8.

  Lista de patrones glob utilizados para excluir elementos del rastreo. Para obtener más información, consulte la sección acerca de cómo [Catalogar tablas con un rastreador](https://docs.aws.amazon.com/glue/latest/dg/add-crawler.html).
+ `MaximumTraversalDepth`: número (entero).

  La profundidad máxima de las rutas de Amazon S3 que el rastreador puede recorrer para descubrir la carpeta de metadatos de Hudi en la ruta de Amazon S3. Se utiliza para limitar el tiempo de ejecución del rastreador.

## Estructura CatalogTarget
<a name="aws-glue-api-crawler-crawling-CatalogTarget"></a>

Especifica un origen de AWS Glue Data Catalog.

**Campos**
+ `DatabaseName`: *obligatorio:* cadena UTF-8, con 1 byte de largo como mínimo y 255 bytes de largo como máximo, que coincide con el [Single-line string pattern](aws-glue-api-common.md#aws-glue-api-regex-oneLine).

  Nombre de la base de datos que se va a sincronizar.
+ `Tables`: *obligatorio:* matriz de cadenas UTF-8, con una cadena como mínimo.

  Lista de las tablas que se van a sincronizar.
+ `ConnectionName`: cadena UTF-8 con una extensión de 1 byte como mínimo o 2048 bytes como máximo.

  El nombre de la conexión de una tabla del Catálogo de datos respaldada por Amazon S3 que se rastreará al utilizar un tipo de conexión `Catalog` emparejado con un tipo de conexión `NETWORK`.
+ `EventQueueArn`: cadena UTF-8.

  Un ARN de Amazon SQS válido. Por ejemplo, `arn:aws:sqs:region:account:sqs`.
+ `DlqEventQueueArn`: cadena UTF-8.

  Un ARN de Amazon SQS válido con mensajes fallidos. Por ejemplo, `arn:aws:sqs:region:account:deadLetterQueue`.

## Estructura CrawlerMetrics
<a name="aws-glue-api-crawler-crawling-CrawlerMetrics"></a>

Métricas de un rastreador especificado.

**Campos**
+ `CrawlerName` – cadena UTF-8, con 1 byte de largo como mínimo y 255 bytes de largo como máximo, que coincide con el [Single-line string pattern](aws-glue-api-common.md#aws-glue-api-regex-oneLine).

  Nombre del rastreador.
+ `TimeLeftSeconds`: número (doble), cero como máximo.

  Tiempo estimado que queda para completar un rastreo que se está ejecutando.
+ `StillEstimating`: booleano.

  True si el rastreador sigue calculando cuánto tiempo se tardará en completar esta ejecución.
+ `LastRuntimeSeconds`: número (doble), cero como máximo.

  Duración de la ejecución más reciente del rastreador indicada en segundos.
+ `MedianRuntimeSeconds`: número (doble), cero como máximo.

  Duración media de las ejecuciones de este rastreador indicada en segundos.
+ `TablesCreated`: número (entero), cero como máximo.

  Número de tablas creadas por este rastreador.
+ `TablesUpdated`: número (entero), cero como máximo.

  Número de tablas actualizadas por este rastreador.
+ `TablesDeleted`: número (entero), cero como máximo.

  Número de tablas eliminadas por este rastreador.

## Estructura de CrawlerHistory
<a name="aws-glue-api-crawler-crawling-CrawlerHistory"></a>

Contiene la información de la ejecución de un rastreador.

**Campos**
+ `CrawlId`: cadena UTF-8.

  Identificador UUID de cada rastreo.
+ `State` – Cadena UTF-8 (valores válidos: `RUNNING` \$1 `COMPLETED` \$1 `FAILED` \$1 `STOPPED`).

  El estado del rastreo.
+ `StartTime`: marca temporal.

  La fecha y hora en las que se inició el rastreo.
+ `EndTime`: marca temporal.

  La fecha y hora en las que terminó el rastreo.
+ `Summary` – cadena UTF-8, con 1 byte de largo como mínimo y 255 bytes de largo como máximo, que coincide con el [Single-line string pattern](aws-glue-api-common.md#aws-glue-api-regex-oneLine).

  Un resumen de la ejecución del rastreo específico en JSON. Contiene las tablas y particiones del catálogo que se agregaron, actualizaron o eliminaron.
+ `ErrorMessage` – cadena de descripción de un máximo de 2048 bytes de largo, que coincide con el [URI address multi-line string pattern](aws-glue-api-common.md#aws-glue-api-regex-uri).

  Si se produjo un error, el mensaje de error asociado con el rastreo.
+ `LogGroup` – cadena UTF-8, con 1 byte de largo como mínimo y 512 bytes de largo como máximo, que coincide con el [Log group string pattern](aws-glue-api-common.md#aws-glue-api-regex-logGroup-id).

  El grupo de registros asociado al rastreo.
+ `LogStream` – cadena UTF-8, con 1 byte de largo como mínimo y 512 bytes de largo como máximo, que coincide con el [Log-stream string pattern](aws-glue-api-common.md#aws-glue-api-regex-logStream-id).

  El flujo de registros asociado al rastreo.
+ `MessagePrefix` – cadena UTF-8, con 1 byte de largo como mínimo y 255 bytes de largo como máximo, que coincide con el [Single-line string pattern](aws-glue-api-common.md#aws-glue-api-regex-oneLine).

  El prefijo para un mensaje de CloudWatch sobre este rastreo.
+ `DPUHour`: número (doble), cero como máximo.

  El número de unidades de procesamiento de datos (DPU) utilizadas en horas para el rastreo.

## Estructura de CrawlsFilter
<a name="aws-glue-api-crawler-crawling-CrawlsFilter"></a>

Una lista de campos, comparadores y valores que se pueden utilizar para filtrar las ejecuciones de rastreador de un rastreador específico.

**Campos**
+ `FieldName` – Cadena UTF-8 (valores válidos: `CRAWL_ID` \$1 `STATE` \$1 `START_TIME` \$1 `END_TIME` \$1 `DPU_HOUR`).

  Una clave que se utiliza para filtrar las ejecuciones del rastreador para un rastreador específico. Los valores válidos para cada uno de los nombres de campo son:
  + `CRAWL_ID`: cadena que representa el identificador de UUID de un rastreo.
  + `STATE`: una cadena de caracteres que representa el estado del rastreo.
  + `START_TIME` y `END_TIME`: la marca de tiempo Epoch en milisegundos.
  + `DPU_HOUR`: el número de horas de unidad de procesamiento de datos (DPU) utilizadas para el rastreo.
+ `FilterOperator` – Cadena UTF-8 (valores válidos: `GT` \$1 `GE` \$1 `LT` \$1 `LE` \$1 `EQ` \$1 `NE`).

  Un comparador definido que opera con el valor. Los operadores disponibles son:
  + `GT`: mayor que.
  + `GE`: mayor o igual que.
  + `LT`: menor que.
  + `LE`: menor o igual que.
  + `EQ`: igual que.
  + `NE`: no es igual que.
+ `FieldValue`: cadena UTF-8.

  El valor proporcionado para la comparación en el campo de rastreo. 

## Estructura SchemaChangePolicy
<a name="aws-glue-api-crawler-crawling-SchemaChangePolicy"></a>

Una política que especifica los comportamientos de actualización y eliminación del rastreador.

**Campos**
+ `UpdateBehavior` – Cadena UTF-8 (valores válidos: `LOG` \$1 `UPDATE_IN_DATABASE`).

  Comportamiento de actualización cuando el rastreador encuentra un esquema cambiado.
+ `DeleteBehavior` – Cadena UTF-8 (valores válidos: `LOG` \$1 `DELETE_FROM_DATABASE` \$1 `DEPRECATE_IN_DATABASE`).

  Comportamiento de eliminación cuando el rastreador encuentra un objeto eliminado.

## Estructura LastCrawlInfo
<a name="aws-glue-api-crawler-crawling-LastCrawlInfo"></a>

Información de estado y de error sobre el rastreo más reciente.

**Campos**
+ `Status` – Cadena UTF-8 (valores válidos: `SUCCEEDED` \$1 `CANCELLED` \$1 `FAILED`).

  Estado del último rastreo.
+ `ErrorMessage` – cadena de descripción de un máximo de 2048 bytes de largo, que coincide con el [URI address multi-line string pattern](aws-glue-api-common.md#aws-glue-api-regex-uri).

  Si se produjo un error, la información de error sobre el último rastreo.
+ `LogGroup` – cadena UTF-8, con 1 byte de largo como mínimo y 512 bytes de largo como máximo, que coincide con el [Log group string pattern](aws-glue-api-common.md#aws-glue-api-regex-logGroup-id).

  Grupo de registros del último rastreo.
+ `LogStream` – cadena UTF-8, con 1 byte de largo como mínimo y 512 bytes de largo como máximo, que coincide con el [Log-stream string pattern](aws-glue-api-common.md#aws-glue-api-regex-logStream-id).

  Flujo de registros del último rastreo.
+ `MessagePrefix` – cadena UTF-8, con 1 byte de largo como mínimo y 255 bytes de largo como máximo, que coincide con el [Single-line string pattern](aws-glue-api-common.md#aws-glue-api-regex-oneLine).

  Prefijo de un mensaje sobre este rastreo.
+ `StartTime`: marca temporal.

  Hora en la que se inició el rastreo.

## Estructura RecrawlPolicy
<a name="aws-glue-api-crawler-crawling-RecrawlPolicy"></a>

Al rastrear un origen de datos de Amazon S3 después de completar el primer rastreo, especifica si se debe rastrear de nuevo todo el conjunto de datos o si se deben rastrear sólo las carpetas que se agregaron desde la última ejecución del rastreador. Para obtener más información, consulte [Rastreo progresivo en AWS Glue](https://docs.aws.amazon.com/glue/latest/dg/incremental-crawls.html) en la guía para desarrolladores.

**Campos**
+ `RecrawlBehavior` – Cadena UTF-8 (valores válidos: `CRAWL_EVERYTHING` \$1 `CRAWL_NEW_FOLDERS_ONLY` \$1 `CRAWL_EVENT_MODE`).

  Especifica si se debe rastrear de nuevo todo el conjunto de datos o si se deben rastrear sólo las carpetas que se agregaron desde la última ejecución del rastreador.

  Un valor de `CRAWL_EVERYTHING` especifica volver a rastrear todo el conjunto de datos.

  Un valor de `CRAWL_NEW_FOLDERS_ONLY` especifica el rastreo sólo de carpetas que se agregaron desde la última ejecución del rastreador.

  Un valor de `CRAWL_EVENT_MODE` especifica rastrear solo los cambios identificados por los eventos de Amazon S3.

## Estructura LineageConfiguration
<a name="aws-glue-api-crawler-crawling-LineageConfiguration"></a>

Especifica los parámetros de configuración del linaje de datos para el rastreador.

**Campos**
+ `CrawlerLineageSettings` – Cadena UTF-8 (valores válidos: `ENABLE` \$1 `DISABLE`).

  Especifica si el linaje de datos está habilitado para el rastreador. Los valores válidos son:
  + HABILITAR: habilita el linaje de datos para el rastreador
  + DESHABILITAR: deshabilita el linaje de datos para el rastreador

## Estructura LakeFormationConfiguration
<a name="aws-glue-api-crawler-crawling-LakeFormationConfiguration"></a>

Especifica los parámetros de configuración de AWS Lake Formation para el rastreador.

**Campos**
+ `UseLakeFormationCredentials`: booleano.

  Especifica si se debe utilizar credenciales AWS Lake Formation para el rastreador en lugar de las credenciales de rol de IAM.
+ `AccountId`: cadena UTF-8, no más de 12 bytes de largo.

  Necesaria para rastreos de cuentas cruzadas. Para los mismos rastreos de cuentas que los datos de destino, esto se puede dejar como nulo.

## Operaciones
<a name="aws-glue-api-crawler-crawling-actions"></a>
+ [Acción CreateCrawler (Python: create\$1crawler)](#aws-glue-api-crawler-crawling-CreateCrawler)
+ [Acción DeleteCrawler (Python: delete\$1crawler)](#aws-glue-api-crawler-crawling-DeleteCrawler)
+ [Acción GetCrawler (Python: get\$1crawler)](#aws-glue-api-crawler-crawling-GetCrawler)
+ [Acción GetCrawlers (Python: get\$1crawlers)](#aws-glue-api-crawler-crawling-GetCrawlers)
+ [Acción GetCrawlerMetrics (Python: get\$1crawler\$1metrics)](#aws-glue-api-crawler-crawling-GetCrawlerMetrics)
+ [Acción UpdateCrawler (Python: update\$1crawler)](#aws-glue-api-crawler-crawling-UpdateCrawler)
+ [Acción StartCrawler (Python: start\$1crawler)](#aws-glue-api-crawler-crawling-StartCrawler)
+ [Acción StopCrawler (Python: stop\$1crawler)](#aws-glue-api-crawler-crawling-StopCrawler)
+ [Acción BatchGetCrawlers (Python: batch\$1get\$1crawlers)](#aws-glue-api-crawler-crawling-BatchGetCrawlers)
+ [Acción ListCrawlers (Python: list\$1crawlers)](#aws-glue-api-crawler-crawling-ListCrawlers)
+ [Acción ListCrawls (Python: list\$1crawls)](#aws-glue-api-crawler-crawling-ListCrawls)

## Acción CreateCrawler (Python: create\$1crawler)
<a name="aws-glue-api-crawler-crawling-CreateCrawler"></a>

Crea un nuevo rastreador con objetivos, rol, configuración y programación opcional especificados. Se debe especificar al menos un objetivo de rastreo, en el campo `s3Targets`, el campo `jdbcTargets` o el campo `DynamoDBTargets`.

**Solicitud**
+ `Name`: *obligatorio:* cadena UTF-8, con 1 byte de largo como mínimo y 255 bytes de largo como máximo, que coincide con el [Single-line string pattern](aws-glue-api-common.md#aws-glue-api-regex-oneLine).

  Nombre del rastreador nuevo.
+ `Role` – *Obligatorio:* cadena UTF-8.

  El rol de IAM o nombre de recursos de Amazon (ARN) de un rol de IAM que el nuevo rastreador utiliza para obtener acceso a recursos de los clientes.
+ `DatabaseName`: cadena UTF-8.

  La base de datos de AWS Glue donde se escriben los resultados como, por ejemplo, `arn:aws:daylight:us-east-1::database/sometable/*`.
+ `Description` – cadena de descripción de un máximo de 2048 bytes de largo, que coincide con el [URI address multi-line string pattern](aws-glue-api-common.md#aws-glue-api-regex-uri).

  Descripción del nuevo rastreador.
+ `Targets`: *obligatorio:* objeto [CrawlerTargets](#aws-glue-api-crawler-crawling-CrawlerTargets).

  Lista de colecciones de objetivos donde realizar el rastreo.
+ `Schedule`: cadena UTF-8.

  Expresión `cron` utilizada para especificar el programa (consulte [Programaciones basadas en tiempo para trabajos y rastreadores](https://docs.aws.amazon.com/glue/latest/dg/monitor-data-warehouse-schedule.html)). Por ejemplo, para ejecutar algo todos los días a las 12:15 UTC, especifique: `cron(15 12 * * ? *)`.
+ `Classifiers`: matriz de cadenas UTF-8.

  Lista de clasificadores personalizados que el usuario ha registrado. De forma predeterminada, todos los clasificadores integrados se incluyen en un rastreo, pero estos clasificadores personalizados siempre anulan los clasificadores predeterminados de una determinada clasificación.
+ `TablePrefix`: cadena UTF-8 de 128 bytes de largo como máximo.

  Prefijo de tabla utilizado para las tablas de catálogo que se crean.
+ `SchemaChangePolicy`: un objeto [SchemaChangePolicy](#aws-glue-api-crawler-crawling-SchemaChangePolicy).

  La política para el comportamiento de actualización y eliminación del rastreador.
+ `RecrawlPolicy`: un objeto [RecrawlPolicy](#aws-glue-api-crawler-crawling-RecrawlPolicy).

  Política que especifica si se debe rastrear de nuevo todo el conjunto de datos o si se deben rastrear sólo las carpetas que se agregaron desde la última ejecución del rastreador.
+ `LineageConfiguration`: un objeto [LineageConfiguration](#aws-glue-api-crawler-crawling-LineageConfiguration).

  Especifica los parámetros de configuración del linaje de datos para el rastreador.
+ `LakeFormationConfiguration`: un objeto [LakeFormationConfiguration](#aws-glue-api-crawler-crawling-LakeFormationConfiguration).

  Especifica los parámetros de configuración de AWS Lake Formation para el rastreador.
+ `Configuration`: cadena UTF-8.

  Información de configuración del rastreador. Esta cadena JSON con varias versiones permite a los usuarios especificar aspectos del comportamiento de un rastreador. Para obtener más información, consulte [Establecimiento de opciones de configuración de rastreadores](https://docs.aws.amazon.com/glue/latest/dg/crawler-configuration.html).
+ `CrawlerSecurityConfiguration`: cadena UTF-8 de 128 bytes de largo como máximo.

  El nombre de la estructura `SecurityConfiguration` que va a utilizar este rastreador.
+ `Tags`: matriz de mapas de pares de clave-valor, con 50 pares como máximo.

  Cada clave es una cadena UTF-8 con una longitud de entre 1 y 128 bytes.

  Cada valor es una cadena UTF-8 que no tiene más de 256 bytes de largo.

  Etiquetas que se van a utilizar con esta solicitud de rastreador. Puede utilizar etiquetas para limitar el acceso al rastreador. Para obtener más información acerca de las etiquetas en AWS Glue, consulte [Etiquetas de AWS en AWS Glue](https://docs.aws.amazon.com/glue/latest/dg/monitor-tags.html) en la guía para desarrolladores.

**Respuesta**
+ *Sin parámetros de respuesta.*

**Errores**
+ `InvalidInputException`
+ `AlreadyExistsException`
+ `OperationTimeoutException`
+ `ResourceNumberLimitExceededException`

## Acción DeleteCrawler (Python: delete\$1crawler)
<a name="aws-glue-api-crawler-crawling-DeleteCrawler"></a>

Elimina un rastreador especificado de AWS Glue Data Catalog, a menos que el estado del rastreador sea `RUNNING`.

**Solicitud**
+ `Name`: *obligatorio:* cadena UTF-8, con 1 byte de largo como mínimo y 255 bytes de largo como máximo, que coincide con el [Single-line string pattern](aws-glue-api-common.md#aws-glue-api-regex-oneLine).

  El nombre del rastreador que se eliminará.

**Respuesta**
+ *Sin parámetros de respuesta.*

**Errores**
+ `EntityNotFoundException`
+ `CrawlerRunningException`
+ `SchedulerTransitioningException`
+ `OperationTimeoutException`

## Acción GetCrawler (Python: get\$1crawler)
<a name="aws-glue-api-crawler-crawling-GetCrawler"></a>

Recupera metadatos para un rastreador especificado.

**Solicitud**
+ `Name`: *obligatorio:* cadena UTF-8, con 1 byte de largo como mínimo y 255 bytes de largo como máximo, que coincide con el [Single-line string pattern](aws-glue-api-common.md#aws-glue-api-regex-oneLine).

  El nombre del rastreador para el que se recuperarán los metadatos.

**Respuesta**
+ `Crawler`: un objeto [Rastreador](#aws-glue-api-crawler-crawling-Crawler).

  Los metadatos para el rastreador especificado.

**Errores**
+ `EntityNotFoundException`
+ `OperationTimeoutException`

## Acción GetCrawlers (Python: get\$1crawlers)
<a name="aws-glue-api-crawler-crawling-GetCrawlers"></a>

Recupera metadatos para todos los rastreadores definidos en la cuenta del cliente.

**Solicitud**
+ `MaxResults`: número (entero) que no es inferior a 1 ni es superior a 1000.

  Número de rastreadores que se devolverá en cada llamada.
+ `NextToken`: cadena UTF-8.

  Token de continuación, si se trata de una solicitud de continuidad.

**Respuesta**
+ `Crawlers`: matriz de objetos [Rastreador](#aws-glue-api-crawler-crawling-Crawler).

  Lista de metadatos de rastreador.
+ `NextToken`: cadena UTF-8.

  Token de continuación, si la lista devuelta no ha llegado al final de los metadatos definidos en esta cuenta de cliente.

**Errores**
+ `OperationTimeoutException`

## Acción GetCrawlerMetrics (Python: get\$1crawler\$1metrics)
<a name="aws-glue-api-crawler-crawling-GetCrawlerMetrics"></a>

Recupera métricas sobre rastreadores especificados.

**Solicitud**
+ `CrawlerNameList`: matriz de cadenas UTF-8, con 100 cadenas como máximo.

  Lista de los nombres de rastreadores sobre los que se recuperarán métricas.
+ `MaxResults`: número (entero) que no es inferior a 1 ni es superior a 1000.

  Tamaño máximo de una lista que se devolverá.
+ `NextToken`: cadena UTF-8.

  Token de continuación si se trata de una llamada de continuidad.

**Respuesta**
+ `CrawlerMetricsList`: matriz de objetos [CrawlerMetrics](#aws-glue-api-crawler-crawling-CrawlerMetrics).

  Lista de métricas para el rastreador especificado.
+ `NextToken`: cadena UTF-8.

  Token de continuación, si la lista devuelta no contiene la última métrica disponible.

**Errores**
+ `OperationTimeoutException`

## Acción UpdateCrawler (Python: update\$1crawler)
<a name="aws-glue-api-crawler-crawling-UpdateCrawler"></a>

Actualiza un rastreador. Si un rastreador se está ejecutando, debe detenerlo utilizando `StopCrawler` antes de actualizarlo.

**Solicitud**
+ `Name`: *obligatorio:* cadena UTF-8, con 1 byte de largo como mínimo y 255 bytes de largo como máximo, que coincide con el [Single-line string pattern](aws-glue-api-common.md#aws-glue-api-regex-oneLine).

  Nombre del rastreador nuevo.
+ `Role`: cadena UTF-8.

  El rol de IAM o nombre de recurso de Amazon (ARN) de un rol de IAM que utiliza el nuevo rastreador para acceder a los recursos del cliente.
+ `DatabaseName`: cadena UTF-8.

  La base de datos de AWS Glue donde se almacenan los resultados como, por ejemplo, `arn:aws:daylight:us-east-1::database/sometable/*`.
+ `Description` – cadena UTF-8 con un máximo de 2048 bytes de largo, que coincide con el [URI address multi-line string pattern](aws-glue-api-common.md#aws-glue-api-regex-uri).

  Descripción del nuevo rastreador.
+ `Targets`: un objeto [CrawlerTargets](#aws-glue-api-crawler-crawling-CrawlerTargets).

  Lista de objetivos del rastreo.
+ `Schedule`: cadena UTF-8.

  Expresión `cron` utilizada para especificar el programa (consulte [Programaciones basadas en tiempo para trabajos y rastreadores](https://docs.aws.amazon.com/glue/latest/dg/monitor-data-warehouse-schedule.html)). Por ejemplo, para ejecutar algo todos los días a las 12:15 UTC, especifique: `cron(15 12 * * ? *)`.
+ `Classifiers`: matriz de cadenas UTF-8.

  Lista de clasificadores personalizados que el usuario ha registrado. De forma predeterminada, todos los clasificadores integrados se incluyen en un rastreo, pero estos clasificadores personalizados siempre anulan los clasificadores predeterminados de una determinada clasificación.
+ `TablePrefix`: cadena UTF-8 de 128 bytes de largo como máximo.

  Prefijo de tabla utilizado para las tablas de catálogo que se crean.
+ `SchemaChangePolicy`: un objeto [SchemaChangePolicy](#aws-glue-api-crawler-crawling-SchemaChangePolicy).

  La política para el comportamiento de actualización y eliminación del rastreador.
+ `RecrawlPolicy`: un objeto [RecrawlPolicy](#aws-glue-api-crawler-crawling-RecrawlPolicy).

  Política que especifica si se debe rastrear de nuevo todo el conjunto de datos o si se deben rastrear sólo las carpetas que se agregaron desde la última ejecución del rastreador.
+ `LineageConfiguration`: un objeto [LineageConfiguration](#aws-glue-api-crawler-crawling-LineageConfiguration).

  Especifica los parámetros de configuración del linaje de datos para el rastreador.
+ `LakeFormationConfiguration`: un objeto [LakeFormationConfiguration](#aws-glue-api-crawler-crawling-LakeFormationConfiguration).

  Especifica los parámetros de configuración de AWS Lake Formation para el rastreador.
+ `Configuration`: cadena UTF-8.

  Información de configuración del rastreador. Esta cadena JSON con varias versiones permite a los usuarios especificar aspectos del comportamiento de un rastreador. Para obtener más información, consulte [Establecimiento de opciones de configuración de rastreadores](https://docs.aws.amazon.com/glue/latest/dg/crawler-configuration.html).
+ `CrawlerSecurityConfiguration`: cadena UTF-8 de 128 bytes de largo como máximo.

  El nombre de la estructura `SecurityConfiguration` que va a utilizar este rastreador.

**Respuesta**
+ *Sin parámetros de respuesta.*

**Errores**
+ `InvalidInputException`
+ `VersionMismatchException`
+ `EntityNotFoundException`
+ `CrawlerRunningException`
+ `OperationTimeoutException`

## Acción StartCrawler (Python: start\$1crawler)
<a name="aws-glue-api-crawler-crawling-StartCrawler"></a>

Comienza un rastreo utilizando el rastreo especificado, independientemente de lo que esté programado. Si el rastreador ya está en ejecución, devuelve [CrawlerRunningException](https://docs.aws.amazon.com/glue/latest/dg/aws-glue-api-exceptions.html#aws-glue-api-exceptions-CrawlerRunningException).

**Solicitud**
+ `Name`: *obligatorio:* cadena UTF-8, con 1 byte de largo como mínimo y 255 bytes de largo como máximo, que coincide con el [Single-line string pattern](aws-glue-api-common.md#aws-glue-api-regex-oneLine).

  Nombre del rastreador que se iniciará.

**Respuesta**
+ *Sin parámetros de respuesta.*

**Errores**
+ `EntityNotFoundException`
+ `CrawlerRunningException`
+ `OperationTimeoutException`

## Acción StopCrawler (Python: stop\$1crawler)
<a name="aws-glue-api-crawler-crawling-StopCrawler"></a>

Si el rastreador especificado está en ejecución, se detiene el rastreo.

**Solicitud**
+ `Name`: *obligatorio:* cadena UTF-8, con 1 byte de largo como mínimo y 255 bytes de largo como máximo, que coincide con el [Single-line string pattern](aws-glue-api-common.md#aws-glue-api-regex-oneLine).

  Nombre del rastreador que se detendrá.

**Respuesta**
+ *Sin parámetros de respuesta.*

**Errores**
+ `EntityNotFoundException`
+ `CrawlerNotRunningException`
+ `CrawlerStoppingException`
+ `OperationTimeoutException`

## Acción BatchGetCrawlers (Python: batch\$1get\$1crawlers)
<a name="aws-glue-api-crawler-crawling-BatchGetCrawlers"></a>

Devuelve la lista de metadatos de recursos de una determinada lista de nombres de rastreadores. Después de llamar a la operación `ListCrawlers`, puede llamar a esta operación para obtener acceso a los datos a los que ha concedido permisos. Esta operación admite todos los permisos de IAM, incluidas las condiciones de permisos que utilizan etiquetas.

**Solicitud**
+ `CrawlerNames` – *Obligatorio:* matriz de cadenas UTF-8, con 100 cadenas como máximo.

  Una lista de nombres de rastreadores, que pueden ser los nombres devueltos en la operación `ListCrawlers`.

**Respuesta**
+ `Crawlers`: matriz de objetos [Rastreador](#aws-glue-api-crawler-crawling-Crawler).

  Lista de definiciones de rastreadores.
+ `CrawlersNotFound`: matriz de cadenas UTF-8, con 100 cadenas como máximo.

  Una lista de nombres de rastreadores que no se han encontrado.

**Errores**
+ `InvalidInputException`
+ `OperationTimeoutException`

## Acción ListCrawlers (Python: list\$1crawlers)
<a name="aws-glue-api-crawler-crawling-ListCrawlers"></a>

Recupera los nombres de todos los recursos de rastreadores de esta cuenta de AWS o los recursos con la etiqueta especificada. Esta operación permite ver qué recursos están disponibles en la cuenta y sus nombres.

Esta operación toma el campo `Tags` opcional, que se puede utilizar como filtro en la respuesta para que los recursos etiquetados se devuelvan agrupados. Si decide utilizar el filtrado de etiquetas, solo se devolverán los recursos con la etiqueta especificada.

**Solicitud**
+ `MaxResults`: número (entero) que no es inferior a 1 ni es superior a 1000.

  Tamaño máximo de una lista que se devolverá.
+ `NextToken`: cadena UTF-8.

  Token de continuación, si se trata de una solicitud de continuidad.
+ `Tags`: matriz de mapas de pares de clave-valor, con 50 pares como máximo.

  Cada clave es una cadena UTF-8 con una longitud de entre 1 y 128 bytes.

  Cada valor es una cadena UTF-8 que no tiene más de 256 bytes de largo.

  Especifica que se devuelvan solamente los recursos etiquetados.

**Respuesta**
+ `CrawlerNames`: matriz de cadenas UTF-8, con 100 cadenas como máximo.

  Nombres de todos los rastreadores de la cuenta o de los rastreadores con las etiquetas especificadas.
+ `NextToken`: cadena UTF-8.

  Token de continuación, si la lista devuelta no contiene la última métrica disponible.

**Errores**
+ `OperationTimeoutException`

## Acción ListCrawls (Python: list\$1crawls)
<a name="aws-glue-api-crawler-crawling-ListCrawls"></a>

Devuelve todos los rastreos de un rastreador especificado. Devuelve solo los rastreos que se han producido desde la fecha de lanzamiento de la función de historial del rastreador y solo conserva hasta 12 meses de rastreo. No se devolverán los rastreos más antiguos.

Puede utilizar esta API para:
+ Recupera todos los rastreos de un rastreador especificado.
+ Recupera todos los rastreos de un rastreador específico dentro de un recuento limitado.
+ Recupera todos los rastreos de un rastreador específico en un rango de tiempo específico.
+ Recupera todos los rastreos de un rastreador especificado con un estado, un ID de rastreo o un valor de hora de DPU en particular.

**Solicitud**
+ `CrawlerName`: *obligatorio:* cadena UTF-8, con 1 byte de largo como mínimo y 255 bytes de largo como máximo, que coincide con el [Single-line string pattern](aws-glue-api-common.md#aws-glue-api-regex-oneLine).

  El nombre del rastreador cuyo valor desea recuperar.
+ `MaxResults`: número (entero) que no es inferior a 1 ni es superior a 1000.

  El número máximo de resultados que devolver. El valor predeterminado es 20 y el máximo es 100. 
+ `Filters`: matriz de objetos [CrawlsFilter](#aws-glue-api-crawler-crawling-CrawlsFilter).

  Filtra los rastreos de acuerdo con los criterios especificados en una lista de objetos de `CrawlsFilter`.
+ `NextToken`: cadena UTF-8.

  Token de continuación si se trata de una llamada de continuidad.

**Respuesta**
+ `Crawls`: matriz de objetos [CrawlerHistory](#aws-glue-api-crawler-crawling-CrawlerHistory).

  Una lista de objetos de `CrawlerHistory` que representan las ejecuciones de rastreo que cumplen sus criterios.
+ `NextToken`: cadena UTF-8.

  Token de continuación para paginar la lista de tokens obtenida; se devuelve si el segmento actual de la lista no es el último.

**Errores**
+ `EntityNotFoundException`
+ `OperationTimeoutException`
+ `InvalidInputException`

# API de estadísticas de columna
<a name="aws-glue-api-crawler-column-statistics"></a>

La API de estadísticas de columnas describe las API de AWS Glue para devolver las estadísticas de las columnas de una tabla.

## Tipos de datos
<a name="aws-glue-api-crawler-column-statistics-objects"></a>
+ [Estructura ColumnStatisticsTaskRun](#aws-glue-api-crawler-column-statistics-ColumnStatisticsTaskRun)
+ [Estructura ColumnStatisticsTaskSettings](#aws-glue-api-crawler-column-statistics-ColumnStatisticsTaskSettings)
+ [Estructura ExecutionAttempt](#aws-glue-api-crawler-column-statistics-ExecutionAttempt)

## Estructura ColumnStatisticsTaskRun
<a name="aws-glue-api-crawler-column-statistics-ColumnStatisticsTaskRun"></a>

El objeto que muestra los detalles de la ejecución de las estadísticas de la columna.

**Campos**
+ `CustomerId`: cadena UTF-8, no más de 12 bytes de largo.

  El ID de la cuenta de AWS.
+ `ColumnStatisticsTaskRunId`: cadena UTF-8, con 1 byte de largo como mínimo y 255 bytes de largo como máximo, que coincide con el [Single-line string pattern](aws-glue-api-common.md#aws-glue-api-regex-oneLine).

  El identificador de la ejecución de la tarea de estadísticas de columna en particular.
+ `DatabaseName`: cadena UTF-8.

  La base de datos en la que se encuentra la tabla.
+ `TableName`: cadena UTF-8.

  El nombre de la tabla para la que se generan las estadísticas de las columnas.
+ `ColumnNameList`: matriz de cadenas UTF-8.

  Una lista de los nombres de las columnas. Si no se proporciona ninguno, todos los nombres de columna de la tabla se usarán de forma predeterminada.
+ `CatalogID`: cadena de ID de catálogo, con 1 byte de largo como mínimo y 255 bytes de largo como máximo, que coincide con el [Single-line string pattern](aws-glue-api-common.md#aws-glue-api-regex-oneLine).

  El ID del Catálogo de datos donde reside la tabla. Si no se proporciona ninguno, el ID de cuenta de AWS se usará de forma predeterminada.
+ `Role`: cadena UTF-8.

  El rol de IAM que el servicio asume para generar estadísticas.
+ `SampleSize`: número (doble), 100 como máximo.

  El porcentaje de filas que se utilizan para generar estadísticas. Si no se proporciona ninguno, la tabla completa se usará para generar estadísticas.
+ `SecurityConfiguration`: cadena UTF-8 de 128 bytes de largo como máximo.

  Nombre de la configuración de seguridad que se utiliza para cifrar los registros de CloudWatch para la ejecución de la tarea de estadísticas de columnas.
+ `NumberOfWorkers`: número (entero), como mínimo 1.

  El número de empleados utilizados para generar las estadísticas de las columnas. El trabajo está preconfigurado para escalar automáticamente hasta 25 instancias.
+ `WorkerType`: cadena UTF-8, con 1 byte de largo como mínimo y 255 bytes de largo como máximo, que coincide con el [Single-line string pattern](aws-glue-api-common.md#aws-glue-api-regex-oneLine).

  El tipo de trabajadores que se utilizan para generar estadísticas. El valor predeterminado es `g.1x`.
+ `ComputationType`: cadena UTF-8 (valores válidos: `FULL` \$1 `INCREMENTAL`).

  El tipo de computación de las estadísticas de columnas.
+ `Status`: cadena UTF-8 (valores válidos: `STARTING` \$1 `RUNNING` \$1 `SUCCEEDED` \$1 `FAILED` \$1 `STOPPED`).

  El estado de la ejecución de la tarea.
+ `CreationTime`: marca temporal.

  La hora en que se creó esta tarea.
+ `LastUpdated`: marca temporal.

  El último punto temporal en que se modificó esta tarea.
+ `StartTime`: marca temporal.

  La hora de inicio de la tarea.
+ `EndTime`: marca temporal.

  La hora de finalización de la tarea.
+ `ErrorMessage`: cadena de descripción de un máximo de 2048 bytes de largo, que coincide con el [URI address multi-line string pattern](aws-glue-api-common.md#aws-glue-api-regex-uri).

  El mensaje de error del trabajo.
+ `DPUSeconds`: número (doble), cero como máximo.

  El uso de la DPU calculado en segundos para todos los trabajadores con escalado automático.

## Estructura ColumnStatisticsTaskSettings
<a name="aws-glue-api-crawler-column-statistics-ColumnStatisticsTaskSettings"></a>

Configuración de una tarea de estadísticas de columnas.

**Campos**
+ `DatabaseName`: cadena UTF-8.

  El nombre de la base de datos donde reside la tabla.
+ `TableName`: cadena UTF-8.

  El nombre de la tabla para la que se generan las estadísticas de columnas.
+ `Schedule`: un objeto [Programación](aws-glue-api-crawler-scheduler.md#aws-glue-api-crawler-scheduler-Schedule).

  Una programación para ejecutar las estadísticas de columnas, especificado en la sintaxis CRON.
+ `ColumnNameList`: matriz de cadenas UTF-8.

  Una lista de los nombres de columnas en las que se ejecutan las estadísticas.
+ `CatalogID`: cadena de ID de catálogo, con 1 byte de largo como mínimo y 255 bytes de largo como máximo, que coincide con el [Single-line string pattern](aws-glue-api-common.md#aws-glue-api-regex-oneLine).

  El ID del Catálogo de datos donde reside la base de datos.
+ `Role`: cadena UTF-8.

  El rol que se utiliza para ejecutar las estadísticas de columnas.
+ `SampleSize`: número (doble), 100 como máximo.

  El porcentaje de datos que se van a usar como muestra.
+ `SecurityConfiguration`: cadena UTF-8 de 128 bytes de largo como máximo.

  Nombre de la configuración de seguridad que se utiliza para cifrar los registros de CloudWatch.
+ `ScheduleType`: cadena UTF-8 (valores válidos: `CRON` \$1 `AUTO`).

  El tipo de programación de una tarea de estadísticas de columnas. Los valores posibles pueden ser `CRON` o `AUTO`.
+ `SettingSource`: cadena UTF-8 (valores válidos: `CATALOG` \$1 `TABLE`).

  El origen de la configuración de la tarea de estadísticas de columnas. Los valores posibles pueden ser `CATALOG` o `TABLE`.
+ `LastExecutionAttempt`: un objeto [ExecutionAttempt](#aws-glue-api-crawler-column-statistics-ExecutionAttempt).

  El último `ExecutionAttempt` para la ejecución de la tarea de estadísticas de columnas.

## Estructura ExecutionAttempt
<a name="aws-glue-api-crawler-column-statistics-ExecutionAttempt"></a>

Intento de ejecución de una tarea de estadísticas de columnas.

**Campos**
+ `Status`: cadena UTF-8 (valores válidos: `FAILED` \$1 `STARTED`).

  El estado de la última ejecución de la tarea de estadísticas de columnas.
+ `ColumnStatisticsTaskRunId`: cadena UTF-8, con 1 byte de largo como mínimo y 255 bytes de largo como máximo, que coincide con el [Single-line string pattern](aws-glue-api-common.md#aws-glue-api-regex-oneLine).

  ID de ejecución de tarea para la última ejecución de la tarea de estadísticas de columnas.
+ `ExecutionTimestamp`: marca temporal.

  Una marca de tiempo para la última ejecución de la tarea de estadísticas de columnas.
+ `ErrorMessage`: cadena de descripción de un máximo de 2048 bytes de largo, que coincide con el [URI address multi-line string pattern](aws-glue-api-common.md#aws-glue-api-regex-uri).

  Un mensaje de error asociado a la última ejecución de la tarea de estadísticas de columnas.

## Operaciones
<a name="aws-glue-api-crawler-column-statistics-actions"></a>
+ [StartColumnStatisticsTaskRun action (Python: start\$1column\$1statistics\$1task\$1run)](#aws-glue-api-crawler-column-statistics-StartColumnStatisticsTaskRun)
+ [GetColumnStatisticsTaskRun action (Python: get\$1column\$1statistics\$1task\$1run)](#aws-glue-api-crawler-column-statistics-GetColumnStatisticsTaskRun)
+ [GetColumnStatisticsTaskRuns action (Python: get\$1column\$1statistics\$1task\$1runs)](#aws-glue-api-crawler-column-statistics-GetColumnStatisticsTaskRuns)
+ [ListColumnStatisticsTaskRuns action (Python: list\$1column\$1statistics\$1task\$1runs)](#aws-glue-api-crawler-column-statistics-ListColumnStatisticsTaskRuns)
+ [StopColumnStatisticsTaskRun action (Python: stop\$1column\$1statistics\$1task\$1run)](#aws-glue-api-crawler-column-statistics-StopColumnStatisticsTaskRun)
+ [Acción CreateColumnStatisticsTaskSettings (Python: create\$1column\$1statistics\$1task\$1settings)](#aws-glue-api-crawler-column-statistics-CreateColumnStatisticsTaskSettings)
+ [Acción UpdateColumnStatisticsTaskSettings (Python: update\$1column\$1statistics\$1task\$1settings)](#aws-glue-api-crawler-column-statistics-UpdateColumnStatisticsTaskSettings)
+ [Acción GetColumnStatisticsTaskSettings (Python: get\$1column\$1statistics\$1task\$1settings)](#aws-glue-api-crawler-column-statistics-GetColumnStatisticsTaskSettings)
+ [Acción DeleteColumnStatisticsTaskSettings (Python: delete\$1column\$1statistics\$1task\$1settings)](#aws-glue-api-crawler-column-statistics-DeleteColumnStatisticsTaskSettings)
+ [Acción StartColumnStatisticsTaskRunSchedule (Python: start\$1column\$1statistics\$1task\$1run\$1schedule)](#aws-glue-api-crawler-column-statistics-StartColumnStatisticsTaskRunSchedule)
+ [Acción StopColumnStatisticsTaskRunSchedule (Python: stop\$1column\$1statistics\$1task\$1run\$1schedule)](#aws-glue-api-crawler-column-statistics-StopColumnStatisticsTaskRunSchedule)

## StartColumnStatisticsTaskRun action (Python: start\$1column\$1statistics\$1task\$1run)
<a name="aws-glue-api-crawler-column-statistics-StartColumnStatisticsTaskRun"></a>

Inicia la ejecución de una tarea de estadísticas de columnas para una tabla y columnas especificadas.

**Solicitud**
+ `DatabaseName`: *obligatorio:* cadena UTF-8, con 1 byte de largo como mínimo y 255 bytes de largo como máximo, que coincide con el [Single-line string pattern](aws-glue-api-common.md#aws-glue-api-regex-oneLine).

  El nombre de la base de datos donde reside la tabla.
+ `TableName`: *obligatorio:* cadena UTF-8, con 1 byte de largo como mínimo y 255 bytes de largo como máximo, que coincide con el [Single-line string pattern](aws-glue-api-common.md#aws-glue-api-regex-oneLine).

  El nombre de la tabla con que se van a generar estadísticas.
+ `ColumnNameList`: matriz de cadenas UTF-8.

  Una lista de los nombres de las columnas para generar estadísticas. Si no se proporciona ninguno, todos los nombres de columna de la tabla se usarán de forma predeterminada.
+ `Role`: *obligatorio:* cadena UTF-8, con 1 byte de largo como mínimo y 255 bytes de largo como máximo, que coincide con el [Single-line string pattern](aws-glue-api-common.md#aws-glue-api-regex-oneLine).

  El rol de IAM que el servicio asume para generar estadísticas.
+ `SampleSize`: número (doble), 100 como máximo.

  El porcentaje de filas que se utilizan para generar estadísticas. Si no se proporciona ninguno, la tabla completa se usará para generar estadísticas.
+ `CatalogID`: cadena UTF-8, con 1 byte de largo como mínimo y 255 bytes de largo como máximo, que coincide con el [Single-line string pattern](aws-glue-api-common.md#aws-glue-api-regex-oneLine).

  El ID del catálogo de datos donde reside la tabla. Si no se proporciona ninguno, el ID de cuenta de AWS se usará de forma predeterminada.
+ `SecurityConfiguration`: cadena UTF-8, con 1 byte de largo como mínimo y 255 bytes de largo como máximo, que coincide con el [Single-line string pattern](aws-glue-api-common.md#aws-glue-api-regex-oneLine).

  Nombre de la configuración de seguridad que se utiliza para cifrar los registros de CloudWatch para la ejecución de la tarea de estadísticas de columnas.

**Respuesta**
+ `ColumnStatisticsTaskRunId`: cadena UTF-8, con 1 byte de largo como mínimo y 255 bytes de largo como máximo, que coincide con el [Single-line string pattern](aws-glue-api-common.md#aws-glue-api-regex-oneLine).

  El identificador de ejecución de la tarea de estadísticas de las columnas.

**Errores**
+ `AccessDeniedException`
+ `EntityNotFoundException`
+ `ColumnStatisticsTaskRunningException`
+ `OperationTimeoutException`
+ `ResourceNumberLimitExceededException`
+ `InvalidInputException`

## GetColumnStatisticsTaskRun action (Python: get\$1column\$1statistics\$1task\$1run)
<a name="aws-glue-api-crawler-column-statistics-GetColumnStatisticsTaskRun"></a>

Obtenga los metadatos o la información asociados a la ejecución de una tarea, con un identificador de ejecución de la tarea determinado.

**Solicitud**
+ `ColumnStatisticsTaskRunId`: *obligatorio:* cadena UTF-8, con 1 byte de largo como mínimo y 255 bytes de largo como máximo, que coincide con el [Single-line string pattern](aws-glue-api-common.md#aws-glue-api-regex-oneLine).

  El identificador de la ejecución de la tarea de estadísticas de columna en particular.

**Respuesta**
+ `ColumnStatisticsTaskRun`: un objeto [ColumnStatisticsTaskRun](#aws-glue-api-crawler-column-statistics-ColumnStatisticsTaskRun).

  Un objeto de `ColumnStatisticsTaskRun` que representa los detalles de la ejecución de las estadísticas de la columna.

**Errores**
+ `EntityNotFoundException`
+ `OperationTimeoutException`
+ `InvalidInputException`

## GetColumnStatisticsTaskRuns action (Python: get\$1column\$1statistics\$1task\$1runs)
<a name="aws-glue-api-crawler-column-statistics-GetColumnStatisticsTaskRuns"></a>

Recupera información sobre todas las ejecuciones asociadas a la tabla especificada.

**Solicitud**
+ `DatabaseName` – *Obligatorio:* cadena UTF-8.

  El nombre de la base de datos donde reside la tabla.
+ `TableName`: *obligatorio:* cadena UTF-8, con 1 byte de largo como mínimo y 255 bytes de largo como máximo, que coincide con el [Single-line string pattern](aws-glue-api-common.md#aws-glue-api-regex-oneLine).

  El nombre de la tabla.
+ `MaxResults`: número (entero) que no es inferior a 1 ni es superior a 1000.

  Tamaño máximo de la respuesta.
+ `NextToken`: cadena UTF-8.

  Token de continuación si se trata de una llamada de continuidad.

**Respuesta**
+ `ColumnStatisticsTaskRuns`: matriz de objetos [ColumnStatisticsTaskRun](#aws-glue-api-crawler-column-statistics-ColumnStatisticsTaskRun).

  Una lista de las ejecuciones de tareas de estadísticas de las columnas.
+ `NextToken`: cadena UTF-8.

  Un token de continuación, si todavía no se han devuelto todas las ejecuciones de tareas.

**Errores**
+ `OperationTimeoutException`

## ListColumnStatisticsTaskRuns action (Python: list\$1column\$1statistics\$1task\$1runs)
<a name="aws-glue-api-crawler-column-statistics-ListColumnStatisticsTaskRuns"></a>

Enumera todas las ejecuciones de tareas para una cuenta en particular.

**Solicitud**
+ `MaxResults`: número (entero) que no es inferior a 1 ni es superior a 1000.

  Tamaño máximo de la respuesta.
+ `NextToken`: cadena UTF-8.

  Token de continuación si se trata de una llamada de continuidad.

**Respuesta**
+ `ColumnStatisticsTaskRunIds`: matriz de cadenas UTF-8, con 100 cadenas como máximo.

  Una lista de los identificadores de ejecución de las tareas de estadísticas de las columnas.
+ `NextToken`: cadena UTF-8.

  Un token de continuación, si todavía no se han devuelto todos los identificadores de ejecución de tareas.

**Errores**
+ `OperationTimeoutException`

## StopColumnStatisticsTaskRun action (Python: stop\$1column\$1statistics\$1task\$1run)
<a name="aws-glue-api-crawler-column-statistics-StopColumnStatisticsTaskRun"></a>

Detiene la ejecución de una tarea para la tabla especificada.

**Solicitud**
+ `DatabaseName` – *Obligatorio:* cadena UTF-8.

  El nombre de la base de datos donde reside la tabla.
+ `TableName`: *obligatorio:* cadena UTF-8, con 1 byte de largo como mínimo y 255 bytes de largo como máximo, que coincide con el [Single-line string pattern](aws-glue-api-common.md#aws-glue-api-regex-oneLine).

  El nombre de la tabla.

**Respuesta**
+ *Sin parámetros de respuesta.*

**Errores**
+ `EntityNotFoundException`
+ `ColumnStatisticsTaskNotRunningException`
+ `ColumnStatisticsTaskStoppingException`
+ `OperationTimeoutException`

## Acción CreateColumnStatisticsTaskSettings (Python: create\$1column\$1statistics\$1task\$1settings)
<a name="aws-glue-api-crawler-column-statistics-CreateColumnStatisticsTaskSettings"></a>

Crea la configuración de una tarea de estadísticas de columnas.

**Solicitud**
+ `DatabaseName`: *obligatorio:* cadena UTF-8, con 1 byte de largo como mínimo y 255 bytes de largo como máximo, que coincide con el [Single-line string pattern](aws-glue-api-common.md#aws-glue-api-regex-oneLine).

  El nombre de la base de datos donde reside la tabla.
+ `TableName`: *obligatorio:* cadena UTF-8, con 1 byte de largo como mínimo y 255 bytes de largo como máximo, que coincide con el [Single-line string pattern](aws-glue-api-common.md#aws-glue-api-regex-oneLine).

  El nombre de la tabla para la que se generan las estadísticas de columnas.
+ `Role`: *obligatorio:* cadena UTF-8, con 1 byte de largo como mínimo y 255 bytes de largo como máximo, que coincide con el [Single-line string pattern](aws-glue-api-common.md#aws-glue-api-regex-oneLine).

  El rol que se utiliza para ejecutar las estadísticas de columnas.
+ `Schedule`: cadena UTF-8.

  Una programación para ejecutar las estadísticas de columnas, especificado en la sintaxis CRON.
+ `ColumnNameList`: matriz de cadenas UTF-8.

  Una lista de los nombres de columnas en las que se ejecutan las estadísticas.
+ `SampleSize`: número (doble), 100 como máximo.

  El porcentaje de datos que se van a usar como muestra.
+ `CatalogID`: cadena UTF-8, con 1 byte de largo como mínimo y 255 bytes de largo como máximo, que coincide con el [Single-line string pattern](aws-glue-api-common.md#aws-glue-api-regex-oneLine).

  El ID del Catálogo de datos donde reside la base de datos.
+ `SecurityConfiguration`: cadena UTF-8, con 1 byte de largo como mínimo y 255 bytes de largo como máximo, que coincide con el [Single-line string pattern](aws-glue-api-common.md#aws-glue-api-regex-oneLine).

  Nombre de la configuración de seguridad que se utiliza para cifrar los registros de CloudWatch.
+ `Tags`: matriz de mapas de pares de clave-valor, con 50 pares como máximo.

  Cada clave es una cadena UTF-8 con una longitud de entre 1 y 128 bytes.

  Cada valor es una cadena UTF-8 que no tiene más de 256 bytes de largo.

  Mapa de etiquetas.

**Respuesta**
+ *Sin parámetros de respuesta.*

**Errores**
+ `AlreadyExistsException`
+ `AccessDeniedException`
+ `EntityNotFoundException`
+ `InvalidInputException`
+ `OperationTimeoutException`
+ `ResourceNumberLimitExceededException`
+ `ColumnStatisticsTaskRunningException`

## Acción UpdateColumnStatisticsTaskSettings (Python: update\$1column\$1statistics\$1task\$1settings)
<a name="aws-glue-api-crawler-column-statistics-UpdateColumnStatisticsTaskSettings"></a>

Actualiza la configuración de una tarea de estadísticas de columnas.

**Solicitud**
+ `DatabaseName`: *obligatorio:* cadena UTF-8, con 1 byte de largo como mínimo y 255 bytes de largo como máximo, que coincide con el [Single-line string pattern](aws-glue-api-common.md#aws-glue-api-regex-oneLine).

  El nombre de la base de datos donde reside la tabla.
+ `TableName`: *obligatorio:* cadena UTF-8, con 1 byte de largo como mínimo y 255 bytes de largo como máximo, que coincide con el [Single-line string pattern](aws-glue-api-common.md#aws-glue-api-regex-oneLine).

  El nombre de la tabla para la que se generan las estadísticas de columnas.
+ `Role`: cadena UTF-8, con 1 byte de largo como mínimo y 255 bytes de largo como máximo, que coincide con el [Single-line string pattern](aws-glue-api-common.md#aws-glue-api-regex-oneLine).

  El rol que se utiliza para ejecutar las estadísticas de columnas.
+ `Schedule`: cadena UTF-8.

  Una programación para ejecutar las estadísticas de columnas, especificado en la sintaxis CRON.
+ `ColumnNameList`: matriz de cadenas UTF-8.

  Una lista de los nombres de columnas en las que se ejecutan las estadísticas.
+ `SampleSize`: número (doble), 100 como máximo.

  El porcentaje de datos que se van a usar como muestra.
+ `CatalogID`: cadena UTF-8, con 1 byte de largo como mínimo y 255 bytes de largo como máximo, que coincide con el [Single-line string pattern](aws-glue-api-common.md#aws-glue-api-regex-oneLine).

  El ID del Catálogo de datos donde reside la base de datos.
+ `SecurityConfiguration`: cadena UTF-8, con 1 byte de largo como mínimo y 255 bytes de largo como máximo, que coincide con el [Single-line string pattern](aws-glue-api-common.md#aws-glue-api-regex-oneLine).

  Nombre de la configuración de seguridad que se utiliza para cifrar los registros de CloudWatch.

**Respuesta**
+ *Sin parámetros de respuesta.*

**Errores**
+ `AccessDeniedException`
+ `EntityNotFoundException`
+ `InvalidInputException`
+ `VersionMismatchException`
+ `OperationTimeoutException`

## Acción GetColumnStatisticsTaskSettings (Python: get\$1column\$1statistics\$1task\$1settings)
<a name="aws-glue-api-crawler-column-statistics-GetColumnStatisticsTaskSettings"></a>

Obtiene la configuración de una tarea de estadísticas de columnas.

**Solicitud**
+ `DatabaseName`: *obligatorio:* cadena UTF-8, con 1 byte de largo como mínimo y 255 bytes de largo como máximo, que coincide con el [Single-line string pattern](aws-glue-api-common.md#aws-glue-api-regex-oneLine).

  El nombre de la base de datos donde reside la tabla.
+ `TableName`: *obligatorio:* cadena UTF-8, con 1 byte de largo como mínimo y 255 bytes de largo como máximo, que coincide con el [Single-line string pattern](aws-glue-api-common.md#aws-glue-api-regex-oneLine).

  El nombre de la tabla de la que se recuperan las estadísticas de columnas.

**Respuesta**
+ `ColumnStatisticsTaskSettings`: un objeto [ColumnStatisticsTaskSettings](#aws-glue-api-crawler-column-statistics-ColumnStatisticsTaskSettings).

  Un objeto `ColumnStatisticsTaskSettings` que representa la configuración de la tarea de estadísticas de columnas.

**Errores**
+ `EntityNotFoundException`
+ `InvalidInputException`
+ `OperationTimeoutException`

## Acción DeleteColumnStatisticsTaskSettings (Python: delete\$1column\$1statistics\$1task\$1settings)
<a name="aws-glue-api-crawler-column-statistics-DeleteColumnStatisticsTaskSettings"></a>

Elimina la configuración de una tarea de estadísticas de columnas.

**Solicitud**
+ `DatabaseName`: *obligatorio:* cadena UTF-8, con 1 byte de largo como mínimo y 255 bytes de largo como máximo, que coincide con el [Single-line string pattern](aws-glue-api-common.md#aws-glue-api-regex-oneLine).

  El nombre de la base de datos donde reside la tabla.
+ `TableName`: *obligatorio:* cadena UTF-8, con 1 byte de largo como mínimo y 255 bytes de largo como máximo, que coincide con el [Single-line string pattern](aws-glue-api-common.md#aws-glue-api-regex-oneLine).

  El nombre de la tabla de la que se eliminan las estadísticas de columnas.

**Respuesta**
+ *Sin parámetros de respuesta.*

**Errores**
+ `EntityNotFoundException`
+ `InvalidInputException`
+ `OperationTimeoutException`

## Acción StartColumnStatisticsTaskRunSchedule (Python: start\$1column\$1statistics\$1task\$1run\$1schedule)
<a name="aws-glue-api-crawler-column-statistics-StartColumnStatisticsTaskRunSchedule"></a>

Inicia una programación de ejecución de tareas de estadísticas de columnas.

**Solicitud**
+ `DatabaseName`: *obligatorio:* cadena UTF-8, con 1 byte de largo como mínimo y 255 bytes de largo como máximo, que coincide con el [Single-line string pattern](aws-glue-api-common.md#aws-glue-api-regex-oneLine).

  El nombre de la base de datos donde reside la tabla.
+ `TableName`: *obligatorio:* cadena UTF-8, con 1 byte de largo como mínimo y 255 bytes de largo como máximo, que coincide con el [Single-line string pattern](aws-glue-api-common.md#aws-glue-api-regex-oneLine).

  El nombre de la tabla en la que se va a iniciar una programación de ejecución de tareas de estadísticas de columnas.

**Respuesta**
+ *Sin parámetros de respuesta.*

**Errores**
+ `AccessDeniedException`
+ `EntityNotFoundException`
+ `InvalidInputException`
+ `OperationTimeoutException`

## Acción StopColumnStatisticsTaskRunSchedule (Python: stop\$1column\$1statistics\$1task\$1run\$1schedule)
<a name="aws-glue-api-crawler-column-statistics-StopColumnStatisticsTaskRunSchedule"></a>

Detiene la programación de ejecución de una tarea de estadísticas de columnas.

**Solicitud**
+ `DatabaseName`: *obligatorio:* cadena UTF-8, con 1 byte de largo como mínimo y 255 bytes de largo como máximo, que coincide con el [Single-line string pattern](aws-glue-api-common.md#aws-glue-api-regex-oneLine).

  El nombre de la base de datos donde reside la tabla.
+ `TableName`: *obligatorio:* cadena UTF-8, con 1 byte de largo como mínimo y 255 bytes de largo como máximo, que coincide con el [Single-line string pattern](aws-glue-api-common.md#aws-glue-api-regex-oneLine).

  El nombre de la tabla en la que se va a detener una programación de ejecución de tareas de estadísticas de columnas.

**Respuesta**
+ *Sin parámetros de respuesta.*

**Errores**
+ `EntityNotFoundException`
+ `InvalidInputException`
+ `OperationTimeoutException`

## Excepciones
<a name="aws-glue-api-crawler-column-statistics-exceptions"></a>
+ [Estructura ColumnStatisticsTaskRunningException](#aws-glue-api-crawler-column-statistics-ColumnStatisticsTaskRunningException)
+ [Estructura ColumnStatisticsTaskNotRunningException](#aws-glue-api-crawler-column-statistics-ColumnStatisticsTaskNotRunningException)
+ [Estructura ColumnStatisticsTaskStopingException](#aws-glue-api-crawler-column-statistics-ColumnStatisticsTaskStoppingException)
+ [Estructura ColumnStatisticsTaskAutoConcurrencyLimitException](#aws-glue-api-crawler-column-statistics-ColumnStatisticsTaskAutoConcurrencyLimitException)
+ [Estructura InvalidCatalogSettingException](#aws-glue-api-crawler-column-statistics-InvalidCatalogSettingException)

## Estructura ColumnStatisticsTaskRunningException
<a name="aws-glue-api-crawler-column-statistics-ColumnStatisticsTaskRunningException"></a>

Se produce una excepción cuando se intenta iniciar otro trabajo mientras se ejecuta un trabajo de generación de estadísticas de columnas.

**Campos**
+ `Message`: cadena UTF-8.

  Mensaje que describe el problema.

## Estructura ColumnStatisticsTaskNotRunningException
<a name="aws-glue-api-crawler-column-statistics-ColumnStatisticsTaskNotRunningException"></a>

Una excepción que se produce cuando se intenta detener la ejecución de una tarea cuando no hay ninguna tarea en ejecución.

**Campos**
+ `Message`: cadena UTF-8.

  Mensaje que describe el problema.

## Estructura ColumnStatisticsTaskStopingException
<a name="aws-glue-api-crawler-column-statistics-ColumnStatisticsTaskStoppingException"></a>

Una excepción que se produce cuando se intenta detener la ejecución de una tarea.

**Campos**
+ `Message`: cadena UTF-8.

  Mensaje que describe el problema.

## Estructura ColumnStatisticsTaskAutoConcurrencyLimitException
<a name="aws-glue-api-crawler-column-statistics-ColumnStatisticsTaskAutoConcurrencyLimitException"></a>

Se produce una excepción cuando alcanza el límite de trabajos de estadísticas automáticos y simultáneos.

**Campos**
+ `Message`: cadena UTF-8.

  Mensaje que describe el problema.

## Estructura InvalidCatalogSettingException
<a name="aws-glue-api-crawler-column-statistics-InvalidCatalogSettingException"></a>

Se produce una excepción cuando hay un problema con la configuración del catálogo.

**Campos**
+ `Message`: cadena UTF-8.

  Mensaje que describe el problema.

# API del programador del rastreador
<a name="aws-glue-api-crawler-scheduler"></a>

La API del programador de rastreadores describe los tipos de datos de rastreadores de AWS Glue, junto con la API para crear, eliminar, actualizar y ver listas de rastreadores.

## Tipos de datos
<a name="aws-glue-api-crawler-scheduler-objects"></a>
+ [Estructura de programación](#aws-glue-api-crawler-scheduler-Schedule)

## Estructura de programación
<a name="aws-glue-api-crawler-scheduler-Schedule"></a>

Objeto de programación que usa una instrucción `cron` para programar un evento.

**Campos**
+ `ScheduleExpression`: cadena UTF-8.

  Expresión `cron` utilizada para especificar el programa (consulte [Programaciones basadas en tiempo para trabajos y rastreadores](https://docs.aws.amazon.com/glue/latest/dg/monitor-data-warehouse-schedule.html)). Por ejemplo, para ejecutar algo todos los días a las 12:15 UTC, especifique: `cron(15 12 * * ? *)`.
+ `State`: cadena UTF-8 (valores válidos: `SCHEDULED` \$1 `NOT_SCHEDULED` \$1 `TRANSITIONING`).

  Estado del programa.

## Operaciones
<a name="aws-glue-api-crawler-scheduler-actions"></a>
+ [Acción UpdateCrawlerSchedule (Python: update\$1crawler\$1schedule)](#aws-glue-api-crawler-scheduler-UpdateCrawlerSchedule)
+ [Acción StartCrawlerSchedule (Python: start\$1crawler\$1schedule)](#aws-glue-api-crawler-scheduler-StartCrawlerSchedule)
+ [Acción StopCrawlerSchedule (Python: stop\$1crawler\$1schedule)](#aws-glue-api-crawler-scheduler-StopCrawlerSchedule)

## Acción UpdateCrawlerSchedule (Python: update\$1crawler\$1schedule)
<a name="aws-glue-api-crawler-scheduler-UpdateCrawlerSchedule"></a>

Actualiza la programación de un rastreador mediante una expresión `cron`. 

**Solicitud**
+ `CrawlerName`: *obligatorio:* cadena UTF-8, con 1 byte de largo como mínimo y 255 bytes de largo como máximo, que coincide con el [Single-line string pattern](aws-glue-api-common.md#aws-glue-api-regex-oneLine).

  El nombre del rastreador cuya programación se debe actualizar.
+ `Schedule`: cadena UTF-8.

  La expresión `cron` actualizada que se utiliza para especificar el programa (consulte el tema sobre [programaciones basadas en tiempo para trabajos y rastreadores](https://docs.aws.amazon.com/glue/latest/dg/monitor-data-warehouse-schedule.html)). Por ejemplo, para ejecutar algo todos los días a las 12:15 UTC, especifique: `cron(15 12 * * ? *)`.

**Respuesta**
+ *Sin parámetros de respuesta.*

**Errores**
+ `EntityNotFoundException`
+ `InvalidInputException`
+ `VersionMismatchException`
+ `SchedulerTransitioningException`
+ `OperationTimeoutException`

## Acción StartCrawlerSchedule (Python: start\$1crawler\$1schedule)
<a name="aws-glue-api-crawler-scheduler-StartCrawlerSchedule"></a>

Cambia el estado de programación del rastreador especificado para `SCHEDULED`, salvo que el rastreador ya se esté ejecutando o el estado de programación ya esté en `SCHEDULED`.

**Solicitud**
+ `CrawlerName`: *obligatorio:* cadena UTF-8, con 1 byte de largo como mínimo y 255 bytes de largo como máximo, que coincide con el [Single-line string pattern](aws-glue-api-common.md#aws-glue-api-regex-oneLine).

  Nombre del rastreador que se va a programar.

**Respuesta**
+ *Sin parámetros de respuesta.*

**Errores**
+ `EntityNotFoundException`
+ `SchedulerRunningException`
+ `SchedulerTransitioningException`
+ `NoScheduleException`
+ `OperationTimeoutException`

## Acción StopCrawlerSchedule (Python: stop\$1crawler\$1schedule)
<a name="aws-glue-api-crawler-scheduler-StopCrawlerSchedule"></a>

Establece el estado del programador del rastreador especificado en `NOT_SCHEDULED`, pero no detiene el rastreador si ya se está ejecutando.

**Solicitud**
+ `CrawlerName`: *obligatorio:* cadena UTF-8, con 1 byte de largo como mínimo y 255 bytes de largo como máximo, que coincide con el [Single-line string pattern](aws-glue-api-common.md#aws-glue-api-regex-oneLine).

  Nombre del rastreador cuyo estado de programación se va a definir.

**Respuesta**
+ *Sin parámetros de respuesta.*

**Errores**
+ `EntityNotFoundException`
+ `SchedulerNotRunningException`
+ `SchedulerTransitioningException`
+ `OperationTimeoutException`