Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

# API de classifieurs et d'crawlers
<a name="aws-glue-api-crawler"></a>

L'API Crawler and classifiers décrit les types de données du AWS Glue crawler et du classificateur, et inclut l'API permettant de créer, supprimer, mettre à jour et répertorier les crawlers ou les classificateurs.

**Topics**
+ [

# API du classifieur
](aws-glue-api-crawler-classifiers.md)
+ [

# API du crawler
](aws-glue-api-crawler-crawling.md)
+ [

# API de statistiques de colonne
](aws-glue-api-crawler-column-statistics.md)
+ [

# API du planificateur du crawler
](aws-glue-api-crawler-scheduler.md)

# API du classifieur
<a name="aws-glue-api-crawler-classifiers"></a>

L'API Classifier décrit les types de données du AWS Glue classificateur et inclut l'API permettant de créer, de supprimer, de mettre à jour et de répertorier les classificateurs.

## Types de données
<a name="aws-glue-api-crawler-classifiers-objects"></a>
+ [Structure du classifieur](#aws-glue-api-crawler-classifiers-Classifier)
+ [GrokClassifier structure](#aws-glue-api-crawler-classifiers-GrokClassifier)
+ [XMLClassifier structure](#aws-glue-api-crawler-classifiers-XMLClassifier)
+ [JsonClassifier structure](#aws-glue-api-crawler-classifiers-JsonClassifier)
+ [CsvClassifier structure](#aws-glue-api-crawler-classifiers-CsvClassifier)
+ [CreateGrokClassifierRequest structure](#aws-glue-api-crawler-classifiers-CreateGrokClassifierRequest)
+ [UpdateGrokClassifierRequest structure](#aws-glue-api-crawler-classifiers-UpdateGrokClassifierRequest)
+ [Créer une structure XMLClassifier de demande](#aws-glue-api-crawler-classifiers-CreateXMLClassifierRequest)
+ [Structure de XMLClassifier demande de mise à jour](#aws-glue-api-crawler-classifiers-UpdateXMLClassifierRequest)
+ [CreateJsonClassifierRequest structure](#aws-glue-api-crawler-classifiers-CreateJsonClassifierRequest)
+ [UpdateJsonClassifierRequest structure](#aws-glue-api-crawler-classifiers-UpdateJsonClassifierRequest)
+ [CreateCsvClassifierRequest structure](#aws-glue-api-crawler-classifiers-CreateCsvClassifierRequest)
+ [UpdateCsvClassifierRequest structure](#aws-glue-api-crawler-classifiers-UpdateCsvClassifierRequest)

## Structure du classifieur
<a name="aws-glue-api-crawler-classifiers-Classifier"></a>

Les classifieurs sont déclenchés durant une tâche d'analyse. Un classifieur vérifie si un fichier donné est dans un format qu'il peut gérer. Si c'est le cas, le classifieur crée un schéma sous la forme d'un objet `StructType` correspondant à ce format de données.

Vous pouvez utiliser les classificateurs standard AWS Glue fournis, ou vous pouvez écrire vos propres classificateurs pour classer au mieux vos sources de données et spécifier les schémas appropriés à utiliser pour celles-ci. Un classifieur peut être un classifieur `grok`, un classifieur `XML`, un classifieur `JSON` ou un classifieur `CSV` personnalisé, selon ce qui est spécifié dans l'un des champs de l'objet `Classifier`.

**Champs**
+ `GrokClassifier` – Un objet [GrokClassifier](#aws-glue-api-crawler-classifiers-GrokClassifier).

  Classificateur qui utilise `grok`.
+ `XMLClassifier` – Un objet [XMLClassifier](#aws-glue-api-crawler-classifiers-XMLClassifier).

  Classificateur de contenu XML.
+ `JsonClassifier` – Un objet [JsonClassifier](#aws-glue-api-crawler-classifiers-JsonClassifier).

  Classificateur de contenu JSON.
+ `CsvClassifier` – Un objet [CsvClassifier](#aws-glue-api-crawler-classifiers-CsvClassifier).

  Classificateur pour les valeurs séparées par des virgules (CSV).

## GrokClassifier structure
<a name="aws-glue-api-crawler-classifiers-GrokClassifier"></a>

Classifieur qui utilise des modèles `grok`.

**Champs**
+ `Name` – *Obligatoire :* Chaîne UTF-8, d’une longueur comprise entre 1 et 255 octets, correspondant au [Single-line string pattern](aws-glue-api-common.md#aws-glue-api-regex-oneLine).

  Nom du classifieur.
+ `Classification` – *Obligatoire :* chaîne UTF-8.

  Identifiant du format des données auquel le classifieur correspond, comme les journaux Twitter, JSON, Omniture, etc.
+ `CreationTime` – Horodatage.

  Heure à laquelle ce classificateur a été enregistré.
+ `LastUpdated` – Horodatage.

  Heure de la dernière mise à jour de ce classifieur.
+ `Version` – Nombre (long).

  Version de ce classifieur.
+ `GrokPattern` – *Obligatoire :* chaîne UTF-8, d'une longueur comprise entre 1 et 2048 octets, correspondant au [A Logstash Grok string pattern](aws-glue-api-common.md#aws-glue-api-grok-pattern).

  Modèle grok appliqué à un magasin de données par ce classifieur. Pour plus d'informations, consultez les modèles intégrés dans [Writing Custom Classifiers](https://docs.aws.amazon.com/glue/latest/dg/custom-classifier.html) (Écriture de classifieurs personnalisés).
+ `CustomPatterns` – Chaîne UTF-8, d'une longueur maximale de 16 000 octets, correspondant au [URI address multi-line string pattern](aws-glue-api-common.md#aws-glue-api-regex-uri).

  Modèles grok personnalisés facultatifs définis par ce classifieur. Pour plus d'informations, consultez les modèles personnalisés dans [Writing Custom Classifiers](https://docs.aws.amazon.com/glue/latest/dg/custom-classifier.html) (Écriture de classifieurs personnalisés).

## XMLClassifier structure
<a name="aws-glue-api-crawler-classifiers-XMLClassifier"></a>

Classifieur de contenu `XML`.

**Champs**
+ `Name` – *Obligatoire :* Chaîne UTF-8, d’une longueur comprise entre 1 et 255 octets, correspondant au [Single-line string pattern](aws-glue-api-common.md#aws-glue-api-regex-oneLine).

  Nom du classifieur.
+ `Classification` – *Obligatoire :* chaîne UTF-8.

  Identifiant du format des données que le classifieur fait correspondre.
+ `CreationTime` – Horodatage.

  Heure à laquelle ce classificateur a été enregistré.
+ `LastUpdated` – Horodatage.

  Heure de la dernière mise à jour de ce classifieur.
+ `Version` – Nombre (long).

  Version de ce classifieur.
+ `RowTag` – Chaîne UTF-8.

  Balise XML désignant l'élément contenant chaque enregistrement d'un document XML en cours d'analyse. Cela ne permet pas d'identifier un élément à fermeture automatique (fermé par `/>`). Un élément de ligne vide contenant uniquement des attributs peut être analysé tant qu'il se termine par une balise de fermeture (par exemple, `<row item_a="A" item_b="B"></row>` est correct, mais `<row item_a="A" item_b="B" />` ne l'est pas).

## JsonClassifier structure
<a name="aws-glue-api-crawler-classifiers-JsonClassifier"></a>

Classifieur de contenu `JSON`.

**Champs**
+ `Name` – *Obligatoire :* Chaîne UTF-8, d’une longueur comprise entre 1 et 255 octets, correspondant au [Single-line string pattern](aws-glue-api-common.md#aws-glue-api-regex-oneLine).

  Nom du classifieur.
+ `CreationTime` – Horodatage.

  Heure à laquelle ce classificateur a été enregistré.
+ `LastUpdated` – Horodatage.

  Heure de la dernière mise à jour de ce classifieur.
+ `Version` – Nombre (long).

  Version de ce classifieur.
+ `JsonPath` – *Obligatoire :* chaîne UTF-8.

  `JsonPath`Chaîne définissant les données JSON à classer par le classificateur. AWS Glue prend en charge un sous-ensemble de JsonPath, comme décrit dans la section [Écrire des JsonPath classificateurs personnalisés](https://docs.aws.amazon.com/glue/latest/dg/custom-classifier.html#custom-classifier-json).

## CsvClassifier structure
<a name="aws-glue-api-crawler-classifiers-CsvClassifier"></a>

Classifieur de contenu `CSV` personnalisé.

**Champs**
+ `Name` – *Obligatoire :* Chaîne UTF-8, d’une longueur comprise entre 1 et 255 octets, correspondant au [Single-line string pattern](aws-glue-api-common.md#aws-glue-api-regex-oneLine).

  Nom du classifieur.
+ `CreationTime` – Horodatage.

  Heure à laquelle ce classificateur a été enregistré.
+ `LastUpdated` – Horodatage.

  Heure de la dernière mise à jour de ce classifieur.
+ `Version` – Nombre (long).

  Version de ce classifieur.
+ `Delimiter` – Chaîne UTF-8, d'une longueur d'au moins 1 ou de plus de 1 octet, correspondant au [Custom string pattern #26](aws-glue-api-common.md#regex_26).

  Symbole personnalisé pour indiquer ce qui sépare chaque entrée de colonne dans la ligne.
+ `QuoteSymbol` – Chaîne UTF-8, d'une longueur d'au moins 1 ou de plus de 1 octet, correspondant au [Custom string pattern #26](aws-glue-api-common.md#regex_26).

  Symbole personnalisé pour indiquer ce qui combine le contenu en une seule valeur de colonne. Doit être différent du délimiteur de colonne.
+ `ContainsHeader` – Chaîne UTF-8 (valeurs valides : `UNKNOWN` \$1 `PRESENT` \$1 `ABSENT`).

  Indique si le fichier CSV contient un en-tête.
+ `Header` – Tableau de chaînes UTF-8.

  Liste des chaînes représentant les noms des colonnes.
+ `DisableValueTrimming` : booléen.

  Spécifie de ne pas couper les valeurs avant d'identifier le type des valeurs de colonne. La valeur par défaut est `true`.
+ `AllowSingleColumn` : booléen.

  Active le traitement des fichiers qui ne contiennent qu'une seule colonne.
+ `CustomDatatypeConfigured` : booléen.

  Permet de configurer le type de données personnalisé.
+ `CustomDatatypes` – Tableau de chaînes UTF-8.

  Liste de types de données personnalisés, notamment « BINARY », « BOOLEAN », « DATE », « DECIMAL », « DOUBLE », « FLOAT », « INT », « LONG », « SHORT », « STRING », « TIMESTAMP ».
+ `Serde` – Chaîne UTF-8 (valeurs valides : `OpenCSVSerDe` \$1 `LazySimpleSerDe` \$1 `None`).

  Définit le CSV SerDe pour le traitement dans le classificateur, qui sera appliqué dans le catalogue de données. Les valeurs valides sont `OpenCSVSerDe`, `LazySimpleSerDe` et `None`. Vous pouvez spécifier la valeur `None` lorsque vous souhaitez que le Crawler effectue la détection.

## CreateGrokClassifierRequest structure
<a name="aws-glue-api-crawler-classifiers-CreateGrokClassifierRequest"></a>

Spécifie un classifieur `grok` que `CreateClassifier` doit créer.

**Champs**
+ `Classification` – *Obligatoire :* chaîne UTF-8.

  Identifiant du format de données auquel le classificateur correspond, tel que Twitter, JSON, Omniture CloudWatch logs, Amazon Logs, etc.
+ `Name` – *Obligatoire :* Chaîne UTF-8, d’une longueur comprise entre 1 et 255 octets, correspondant au [Single-line string pattern](aws-glue-api-common.md#aws-glue-api-regex-oneLine).

  Nom du nouveau classifieur.
+ `GrokPattern` – *Obligatoire :* chaîne UTF-8, d'une longueur comprise entre 1 et 2048 octets, correspondant au [A Logstash Grok string pattern](aws-glue-api-common.md#aws-glue-api-grok-pattern).

  Modèle grok utilisé par ce classifieur.
+ `CustomPatterns` – Chaîne UTF-8, d'une longueur maximale de 16 000 octets, correspondant au [URI address multi-line string pattern](aws-glue-api-common.md#aws-glue-api-regex-uri).

  Modèles grok personnalisés facultatifs utilisés par ce classifieur.

## UpdateGrokClassifierRequest structure
<a name="aws-glue-api-crawler-classifiers-UpdateGrokClassifierRequest"></a>

Spécifie un classifieur grok à mettre à jour lorsqu'il est transmis à `UpdateClassifier`.

**Champs**
+ `Name` – *Obligatoire :* Chaîne UTF-8, d’une longueur comprise entre 1 et 255 octets, correspondant au [Single-line string pattern](aws-glue-api-common.md#aws-glue-api-regex-oneLine).

  Le nom de l'`GrokClassifier`.
+ `Classification` – Chaîne UTF-8.

  Identifiant du format de données auquel le classificateur correspond, tel que Twitter, JSON, Omniture CloudWatch logs, Amazon Logs, etc.
+ `GrokPattern` – Chaîne UTF-8, d’une longueur comprise entre 1 et 2048 octets, correspondant au [A Logstash Grok string pattern](aws-glue-api-common.md#aws-glue-api-grok-pattern).

  Modèle grok utilisé par ce classifieur.
+ `CustomPatterns` – Chaîne UTF-8, d'une longueur maximale de 16 000 octets, correspondant au [URI address multi-line string pattern](aws-glue-api-common.md#aws-glue-api-regex-uri).

  Modèles grok personnalisés facultatifs utilisés par ce classifieur.

## Créer une structure XMLClassifier de demande
<a name="aws-glue-api-crawler-classifiers-CreateXMLClassifierRequest"></a>

Spécifie un classifieur XML que `CreateClassifier` doit créer.

**Champs**
+ `Classification` – *Obligatoire :* chaîne UTF-8.

  Identifiant du format des données que le classifieur fait correspondre.
+ `Name` – *Obligatoire :* Chaîne UTF-8, d’une longueur comprise entre 1 et 255 octets, correspondant au [Single-line string pattern](aws-glue-api-common.md#aws-glue-api-regex-oneLine).

  Nom du classifieur.
+ `RowTag` – Chaîne UTF-8.

  Balise XML désignant l'élément contenant chaque enregistrement d'un document XML en cours d'analyse. Cela ne permet pas d'identifier un élément à fermeture automatique (fermé par `/>`). Un élément de ligne vide contenant uniquement des attributs peut être analysé tant qu'il se termine par une balise de fermeture (par exemple, `<row item_a="A" item_b="B"></row>` est correct, mais `<row item_a="A" item_b="B" />` ne l'est pas).

## Structure de XMLClassifier demande de mise à jour
<a name="aws-glue-api-crawler-classifiers-UpdateXMLClassifierRequest"></a>

Spécifie un classifieur XML à mettre à jour.

**Champs**
+ `Name` – *Obligatoire :* Chaîne UTF-8, d’une longueur comprise entre 1 et 255 octets, correspondant au [Single-line string pattern](aws-glue-api-common.md#aws-glue-api-regex-oneLine).

  Nom du classifieur.
+ `Classification` – Chaîne UTF-8.

  Identifiant du format des données que le classifieur fait correspondre.
+ `RowTag` – Chaîne UTF-8.

  Balise XML désignant l'élément contenant chaque enregistrement d'un document XML en cours d'analyse. Cela ne permet pas d’identifier un élément à fermeture automatique (fermé par `/>`). Un élément de ligne vide contenant uniquement des attributs peut être analysé tant qu'il se termine par une balise de fermeture (par exemple, `<row item_a="A" item_b="B"></row>` est correct, mais `<row item_a="A" item_b="B" />` ne l'est pas).

## CreateJsonClassifierRequest structure
<a name="aws-glue-api-crawler-classifiers-CreateJsonClassifierRequest"></a>

Spécifie un classifieur JSON que `CreateClassifier` doit créer.

**Champs**
+ `Name` – *Obligatoire :* Chaîne UTF-8, d’une longueur comprise entre 1 et 255 octets, correspondant au [Single-line string pattern](aws-glue-api-common.md#aws-glue-api-regex-oneLine).

  Nom du classifieur.
+ `JsonPath` – *Obligatoire :* chaîne UTF-8.

  `JsonPath`Chaîne définissant les données JSON à classer par le classificateur. AWS Glue prend en charge un sous-ensemble de JsonPath, comme décrit dans la section [Écrire des JsonPath classificateurs personnalisés](https://docs.aws.amazon.com/glue/latest/dg/custom-classifier.html#custom-classifier-json).

## UpdateJsonClassifierRequest structure
<a name="aws-glue-api-crawler-classifiers-UpdateJsonClassifierRequest"></a>

Spécifie un classifieur JSON à mettre à jour.

**Champs**
+ `Name` – *Obligatoire :* Chaîne UTF-8, d’une longueur comprise entre 1 et 255 octets, correspondant au [Single-line string pattern](aws-glue-api-common.md#aws-glue-api-regex-oneLine).

  Nom du classifieur.
+ `JsonPath` – Chaîne UTF-8.

  `JsonPath`Chaîne définissant les données JSON à classer par le classificateur. AWS Glue prend en charge un sous-ensemble de JsonPath, comme décrit dans la section [Écrire des JsonPath classificateurs personnalisés](https://docs.aws.amazon.com/glue/latest/dg/custom-classifier.html#custom-classifier-json).

## CreateCsvClassifierRequest structure
<a name="aws-glue-api-crawler-classifiers-CreateCsvClassifierRequest"></a>

Spécifie un classifieur CSV personnalisé que `CreateClassifier` doit créer.

**Champs**
+ `Name` – *Obligatoire :* Chaîne UTF-8, d’une longueur comprise entre 1 et 255 octets, correspondant au [Single-line string pattern](aws-glue-api-common.md#aws-glue-api-regex-oneLine).

  Nom du classifieur.
+ `Delimiter` – Chaîne UTF-8, d'une longueur d'au moins 1 ou de plus de 1 octet, correspondant au [Custom string pattern #26](aws-glue-api-common.md#regex_26).

  Symbole personnalisé pour indiquer ce qui sépare chaque entrée de colonne dans la ligne.
+ `QuoteSymbol` – Chaîne UTF-8, d'une longueur d'au moins 1 ou de plus de 1 octet, correspondant au [Custom string pattern #26](aws-glue-api-common.md#regex_26).

  Symbole personnalisé pour indiquer ce qui combine le contenu en une seule valeur de colonne. Doit être différent du délimiteur de colonne.
+ `ContainsHeader` – Chaîne UTF-8 (valeurs valides : `UNKNOWN` \$1 `PRESENT` \$1 `ABSENT`).

  Indique si le fichier CSV contient un en-tête.
+ `Header` – Tableau de chaînes UTF-8.

  Liste des chaînes représentant les noms des colonnes.
+ `DisableValueTrimming` : booléen.

  Spécifie de ne pas couper les valeurs avant d'identifier le type des valeurs de colonne. La valeur par défaut est True.
+ `AllowSingleColumn` : booléen.

  Active le traitement des fichiers qui ne contiennent qu'une seule colonne.
+ `CustomDatatypeConfigured` : booléen.

  Permet la configuration du type de données personnalisé.
+ `CustomDatatypes` – Tableau de chaînes UTF-8.

  Crée une liste des types de données personnalisés pris en charge.
+ `Serde` – Chaîne UTF-8 (valeurs valides : `OpenCSVSerDe` \$1 `LazySimpleSerDe` \$1 `None`).

  Définit le CSV SerDe pour le traitement dans le classificateur, qui sera appliqué dans le catalogue de données. Les valeurs valides sont `OpenCSVSerDe`, `LazySimpleSerDe` et `None`. Vous pouvez spécifier la valeur `None` lorsque vous souhaitez que le Crawler effectue la détection.

## UpdateCsvClassifierRequest structure
<a name="aws-glue-api-crawler-classifiers-UpdateCsvClassifierRequest"></a>

Spécifie un classifieur CSV personnalisé à mettre à jour.

**Champs**
+ `Name` – *Obligatoire :* Chaîne UTF-8, d’une longueur comprise entre 1 et 255 octets, correspondant au [Single-line string pattern](aws-glue-api-common.md#aws-glue-api-regex-oneLine).

  Nom du classifieur.
+ `Delimiter` – Chaîne UTF-8, d'une longueur d'au moins 1 ou de plus de 1 octet, correspondant au [Custom string pattern #26](aws-glue-api-common.md#regex_26).

  Symbole personnalisé pour indiquer ce qui sépare chaque entrée de colonne dans la ligne.
+ `QuoteSymbol` – Chaîne UTF-8, d'une longueur d'au moins 1 ou de plus de 1 octet, correspondant au [Custom string pattern #26](aws-glue-api-common.md#regex_26).

  Symbole personnalisé pour indiquer ce qui combine le contenu en une seule valeur de colonne. Doit être différent du délimiteur de colonne.
+ `ContainsHeader` – Chaîne UTF-8 (valeurs valides : `UNKNOWN` \$1 `PRESENT` \$1 `ABSENT`).

  Indique si le fichier CSV contient un en-tête.
+ `Header` – Tableau de chaînes UTF-8.

  Liste des chaînes représentant les noms des colonnes.
+ `DisableValueTrimming` : booléen.

  Spécifie de ne pas couper les valeurs avant d'identifier le type des valeurs de colonne. La valeur par défaut est True.
+ `AllowSingleColumn` : booléen.

  Active le traitement des fichiers qui ne contiennent qu'une seule colonne.
+ `CustomDatatypeConfigured` : booléen.

  Spécifie la configuration du type de données personnalisé.
+ `CustomDatatypes` – Tableau de chaînes UTF-8.

  Spécifie une liste des types de données personnalisés pris en charge.
+ `Serde` – Chaîne UTF-8 (valeurs valides : `OpenCSVSerDe` \$1 `LazySimpleSerDe` \$1 `None`).

  Définit le CSV SerDe pour le traitement dans le classificateur, qui sera appliqué dans le catalogue de données. Les valeurs valides sont `OpenCSVSerDe`, `LazySimpleSerDe` et `None`. Vous pouvez spécifier la valeur `None` lorsque vous souhaitez que le Crawler effectue la détection.

## Opérations
<a name="aws-glue-api-crawler-classifiers-actions"></a>
+ [CreateClassifier action (Python : create\$1classifier)](#aws-glue-api-crawler-classifiers-CreateClassifier)
+ [DeleteClassifier action (Python : delete\$1classifier)](#aws-glue-api-crawler-classifiers-DeleteClassifier)
+ [GetClassifier action (Python : get\$1classifier)](#aws-glue-api-crawler-classifiers-GetClassifier)
+ [GetClassifiers action (Python : get\$1classifiers)](#aws-glue-api-crawler-classifiers-GetClassifiers)
+ [UpdateClassifier action (Python : update\$1classifier)](#aws-glue-api-crawler-classifiers-UpdateClassifier)

## CreateClassifier action (Python : create\$1classifier)
<a name="aws-glue-api-crawler-classifiers-CreateClassifier"></a>

Crée un classifieur dans le compte de l'utilisateur. Cela peut être un `GrokClassifier`, un `XMLClassifier`, un `JsonClassifier` ou un `CsvClassifier`, selon le champ de la demande qui est présent.

**Demande**
+ `GrokClassifier` – Un objet [CreateGrokClassifierRequest](#aws-glue-api-crawler-classifiers-CreateGrokClassifierRequest).

  Un `GrokClassifier` objet spécifiant le classifieur à créer.
+ `XMLClassifier` – Un objet [Créer une XMLClassifier demande](#aws-glue-api-crawler-classifiers-CreateXMLClassifierRequest).

  Un `XMLClassifier` objet spécifiant le classifieur à créer.
+ `JsonClassifier` – Un objet [CreateJsonClassifierRequest](#aws-glue-api-crawler-classifiers-CreateJsonClassifierRequest).

  Un `JsonClassifier` objet spécifiant le classifieur à créer.
+ `CsvClassifier` – Un objet [CreateCsvClassifierRequest](#aws-glue-api-crawler-classifiers-CreateCsvClassifierRequest).

  Un `CsvClassifier` objet spécifiant le classifieur à créer.

**Réponse**
+ *Paramètres d’absence de réponse.*

**Erreurs**
+ `AlreadyExistsException`
+ `InvalidInputException`
+ `OperationTimeoutException`

## DeleteClassifier action (Python : delete\$1classifier)
<a name="aws-glue-api-crawler-classifiers-DeleteClassifier"></a>

Supprime un classifieur du catalogue de données.

**Demande**
+ `Name` – *Obligatoire :* Chaîne UTF-8, d’une longueur comprise entre 1 et 255 octets, correspondant au [Single-line string pattern](aws-glue-api-common.md#aws-glue-api-regex-oneLine).

  Nom du classifieur à supprimer.

**Réponse**
+ *Paramètres d’absence de réponse.*

**Erreurs**
+ `EntityNotFoundException`
+ `OperationTimeoutException`

## GetClassifier action (Python : get\$1classifier)
<a name="aws-glue-api-crawler-classifiers-GetClassifier"></a>

Récupérer un classifieur par son nom.

**Demande**
+ `Name` – *Obligatoire :* Chaîne UTF-8, d’une longueur comprise entre 1 et 255 octets, correspondant au [Single-line string pattern](aws-glue-api-common.md#aws-glue-api-regex-oneLine).

  Nom du classifieur à récupérer.

**Réponse**
+ `Classifier` – Un objet [Classifieur](#aws-glue-api-crawler-classifiers-Classifier).

  Classifieur demandé.

**Erreurs**
+ `EntityNotFoundException`
+ `OperationTimeoutException`

## GetClassifiers action (Python : get\$1classifiers)
<a name="aws-glue-api-crawler-classifiers-GetClassifiers"></a>

Répertorie toutes les objets Classifieur du catalogue de données.

**Demande**
+ `MaxResults` – Nombre (entier), compris entre 1 et 1 000.

  Taille de la liste à renvoyer (facultatif).
+ `NextToken` – Chaîne UTF-8.

  Jeton de continuation facultatif.

**Réponse**
+ `Classifiers` : un tableau d’objets [Classifieur](#aws-glue-api-crawler-classifiers-Classifier).

  Liste des objets Classifier demandée.
+ `NextToken` – Chaîne UTF-8.

  Jeton de continuation.

**Erreurs**
+ `OperationTimeoutException`

## UpdateClassifier action (Python : update\$1classifier)
<a name="aws-glue-api-crawler-classifiers-UpdateClassifier"></a>

Modifie un classifieur existant (`GrokClassifier`, `XMLClassifier`, `JsonClassifier` ou `CsvClassifier`, selon le champ qui est présent).

**Demande**
+ `GrokClassifier` – Un objet [UpdateGrokClassifierRequest](#aws-glue-api-crawler-classifiers-UpdateGrokClassifierRequest).

  Un objet `GrokClassifier` avec des champs mis à jour.
+ `XMLClassifier` – Un objet [XMLClassifierDemande de mise à jour](#aws-glue-api-crawler-classifiers-UpdateXMLClassifierRequest).

  Un objet `XMLClassifier` avec des champs mis à jour.
+ `JsonClassifier` – Un objet [UpdateJsonClassifierRequest](#aws-glue-api-crawler-classifiers-UpdateJsonClassifierRequest).

  Un objet `JsonClassifier` avec des champs mis à jour.
+ `CsvClassifier` – Un objet [UpdateCsvClassifierRequest](#aws-glue-api-crawler-classifiers-UpdateCsvClassifierRequest).

  Un objet `CsvClassifier` avec des champs mis à jour.

**Réponse**
+ *Paramètres d’absence de réponse.*

**Erreurs**
+ `InvalidInputException`
+ `VersionMismatchException`
+ `EntityNotFoundException`
+ `OperationTimeoutException`

# API du crawler
<a name="aws-glue-api-crawler-crawling"></a>

L'API Crawler décrit les types de données des AWS Glue robots d'exploration, ainsi que l'API permettant de créer, de supprimer, de mettre à jour et de répertorier les robots d'exploration.

## Types de données
<a name="aws-glue-api-crawler-crawling-objects"></a>
+ [Structure du crawler](#aws-glue-api-crawler-crawling-Crawler)
+ [Structure du planificateur](#aws-glue-api-crawler-crawling-Schedule)
+ [CrawlerTargets structure](#aws-glue-api-crawler-crawling-CrawlerTargets)
+ [Structure de la S3Target](#aws-glue-api-crawler-crawling-S3Target)
+ [DeltaCatalogTarget Structure S3](#aws-glue-api-crawler-crawling-S3DeltaCatalogTarget)
+ [DeltaDirectTarget Structure S3](#aws-glue-api-crawler-crawling-S3DeltaDirectTarget)
+ [JdbcTarget structure](#aws-glue-api-crawler-crawling-JdbcTarget)
+ [Structure Mongo DBTarget](#aws-glue-api-crawler-crawling-MongoDBTarget)
+ [Structure de la dynamo DBTarget](#aws-glue-api-crawler-crawling-DynamoDBTarget)
+ [DeltaTarget structure](#aws-glue-api-crawler-crawling-DeltaTarget)
+ [IcebergTarget structure](#aws-glue-api-crawler-crawling-IcebergTarget)
+ [HudiTarget structure](#aws-glue-api-crawler-crawling-HudiTarget)
+ [CatalogTarget structure](#aws-glue-api-crawler-crawling-CatalogTarget)
+ [CrawlerMetrics structure](#aws-glue-api-crawler-crawling-CrawlerMetrics)
+ [CrawlerHistory structure](#aws-glue-api-crawler-crawling-CrawlerHistory)
+ [CrawlsFilter structure](#aws-glue-api-crawler-crawling-CrawlsFilter)
+ [SchemaChangePolicy structure](#aws-glue-api-crawler-crawling-SchemaChangePolicy)
+ [LastCrawlInfo structure](#aws-glue-api-crawler-crawling-LastCrawlInfo)
+ [RecrawlPolicy structure](#aws-glue-api-crawler-crawling-RecrawlPolicy)
+ [LineageConfiguration structure](#aws-glue-api-crawler-crawling-LineageConfiguration)
+ [LakeFormationConfiguration structure](#aws-glue-api-crawler-crawling-LakeFormationConfiguration)

## Structure du crawler
<a name="aws-glue-api-crawler-crawling-Crawler"></a>

Spécifie un crawler qui examine une source de données et utilise des classifieurs pour tenter de déterminer son schéma. Si l'action aboutit, l'crawler enregistre les métadonnées relatives à la source de données dans le AWS Glue Data Catalog.

**Champs**
+ `Name` – Chaîne UTF-8, d’une longueur comprise entre 1 et 255 octets, correspondant au [Single-line string pattern](aws-glue-api-common.md#aws-glue-api-regex-oneLine).

  Nom de l'crawler.
+ `Role` – Chaîne UTF-8.

  L'Amazon Resource Name (ARN) d'un rôle IAM utilisé pour accéder aux ressources client, par exemple des données Amazon Simple Storage Service (Amazon S3).
+ `Targets` – Un objet [CrawlerTargets](#aws-glue-api-crawler-crawling-CrawlerTargets).

  Ensemble de cibles à analyser.
+ `DatabaseName` – Chaîne UTF-8.

  Nom de la base de données dans laquelle le résultat de l'crawler est stockée.
+ `Description` – Chaîne de description, d’une longueur maximale de 2 048 octets, correspondant au [URI address multi-line string pattern](aws-glue-api-common.md#aws-glue-api-regex-uri).

  Description du crawler.
+ `Classifiers` – Tableau de chaînes UTF-8.

  Liste de chaînes UTF-8 qui spécifient les classificateurs personnalisés et associés à l'crawler.
+ `RecrawlPolicy` – Un objet [RecrawlPolicy](#aws-glue-api-crawler-crawling-RecrawlPolicy).

  Stratégie qui spécifie s'il faut analyser à nouveau le jeu de données entier ou analyser uniquement les dossiers ajoutés depuis la dernière exécution du crawler.
+ `SchemaChangePolicy` – Un objet [SchemaChangePolicy](#aws-glue-api-crawler-crawling-SchemaChangePolicy).

  Stratégie qui spécifie la mise à jour et la suppression des comportements pour l'crawler.
+ `LineageConfiguration` – Un objet [LineageConfiguration](#aws-glue-api-crawler-crawling-LineageConfiguration).

  Configuration qui spécifie si la lignée de données est activée pour le crawler.
+ `State` – Chaîne UTF-8 (valeurs valides : `READY` \$1 `RUNNING` \$1 `STOPPING`).

  Indique si le crawler est en cours d'exécution, ou si une exécution est en attente.
+ `TablePrefix` – Chaîne UTF-8, d'une longueur maximale de 128 octets.

  Préfixe ajouté aux noms des tables créées.
+ `Schedule` – Un objet [Planificateur](aws-glue-api-crawler-scheduler.md#aws-glue-api-crawler-scheduler-Schedule).

  Pour les crawlers planifiés, planification de l'exécution du crawler.
+ `CrawlElapsedTime` – Nombre (long).

  Si le crawler est en cours d'exécution, contient le temps écoulé total depuis le début de la dernière analyse.
+ `CreationTime` – Horodatage.

  Heure de création du crawler.
+ `LastUpdated` – Horodatage.

  Heure de la dernière mise à jour du crawler.
+ `LastCrawl` – Un objet [LastCrawlInfo](#aws-glue-api-crawler-crawling-LastCrawlInfo).

  État de la dernière analyse, et éventuellement informations d'erreur si une erreur s'est produite.
+ `Version` – Nombre (long).

  Version de l'crawler.
+ `Configuration` – Chaîne UTF-8.

  Informations sur la configuration du crawler. Cette chaîne JSON avec gestion des versions permet aux utilisateurs de spécifier des aspects du comportement d'un crawler. Pour plus d'informations, consultez [Setting Crawler configuration options](https://docs.aws.amazon.com/glue/latest/dg/crawler-configuration.html) (Définition d'options de configuration du crawler).
+ `CrawlerSecurityConfiguration` – Chaîne UTF-8, d'une longueur maximale de 128 octets.

  Nom de la structure `SecurityConfiguration` qui sera utilisée par ce crawler.
+ `LakeFormationConfiguration` – Un objet [LakeFormationConfiguration](#aws-glue-api-crawler-crawling-LakeFormationConfiguration).

  Spécifie si le robot d'exploration doit utiliser les AWS Lake Formation informations d'identification du robot au lieu des informations d'identification du rôle IAM.

## Structure du planificateur
<a name="aws-glue-api-crawler-crawling-Schedule"></a>

Objet de planification utilisant une instruction `cron` pour planifier un événement.

**Champs**
+ `ScheduleExpression` – Chaîne UTF-8.

  Une expression `cron` utilisée pour spécifier la planification (consultez [Time-Based Schedules for Jobs and Crawlers](https://docs.aws.amazon.com/glue/latest/dg/monitor-data-warehouse-schedule.html) (Planifications temporelles pour les tâches et les crawlers)). Par exemple, pour exécuter un élément tous les jours à 12h15 UTC, vous devez spécifier : `cron(15 12 * * ? *)`.
+ `State` – Chaîne UTF-8 (valeurs valides : `SCHEDULED` \$1 `NOT_SCHEDULED` \$1 `TRANSITIONING`).

  État de la planification.

## CrawlerTargets structure
<a name="aws-glue-api-crawler-crawling-CrawlerTargets"></a>

Indique les magasins de données à analyser.

**Champs**
+ `S3Targets` : un tableau d’objets [S3Target](#aws-glue-api-crawler-crawling-S3Target).

  Spécifie des cibles Amazon Simple Storage Service (Amazon S3).
+ `JdbcTargets` : un tableau d’objets [JdbcTarget](#aws-glue-api-crawler-crawling-JdbcTarget).

  Spécifie les cibles JDBC.
+ `MongoDBTargets` – Un tableau d'objets [Mongo DBTarget](#aws-glue-api-crawler-crawling-MongoDBTarget).

  Spécifie les cibles Amazon DocumentDB ou MongoDB.
+ `DynamoDBTargets` – Un tableau d'objets [Dynamo DBTarget](#aws-glue-api-crawler-crawling-DynamoDBTarget).

  Spécifie des cibles Amazon DynamoDB.
+ `CatalogTargets` – Un tableau d'objets [CatalogTarget](#aws-glue-api-crawler-crawling-CatalogTarget).

  Spécifie AWS Glue Data Catalog les cibles.
+ `DeltaTargets` – Un tableau d'objets [DeltaTarget](#aws-glue-api-crawler-crawling-DeltaTarget).

  Spécifie les cibles du stockage de données Delta.
+ `IcebergTargets` : un tableau d’objets [IcebergTarget](#aws-glue-api-crawler-crawling-IcebergTarget).

  Spécifie les cibles du magasin de données Apache Iceberg.
+ `HudiTargets` : un tableau d’objets [HudiTarget](#aws-glue-api-crawler-crawling-HudiTarget).

  Spécifie les cibles du magasin de données Hudi Iceberg.

## Structure de la S3Target
<a name="aws-glue-api-crawler-crawling-S3Target"></a>

Spécifie un magasin de données dans Amazon Simple Storage Service (Amazon S3).

**Champs**
+ `Path` – Chaîne UTF-8.

  Chemin vers la cible Amazon S3.
+ `Exclusions` – Tableau de chaînes UTF-8.

  Liste de modèles glob utilisés à exclure de l'analyse. Pour en savoir plus, consultez [Catalog Tables with a Crawler](https://docs.aws.amazon.com/glue/latest/dg/add-crawler.html) (Tables de catalogues avec un crawler).
+ `ConnectionName` – Chaîne UTF-8, d’une longueur comprise entre 1 et 2 048 octets.

  Nom d'une connexion qui permet à une tâche ou à un crawler d'accéder aux données dans Amazon S3 au sein d'un environnement Amazon Virtual Private Cloud (Amazon VPC).
+ `SampleSize` : nombre (entier).

  Définit le nombre de fichiers dans chaque dossier feuille à analyser lors de l'analyse d'échantillons de fichiers dans un jeu de données. Si ce paramètre n'est pas défini, tous les fichiers sont analysés. Une valeur valide est un entier compris entre 1 et 249.
+ `EventQueueArn` – Chaîne UTF-8.

  Un ARN Amazon SQS valide. Par exemple, `arn:aws:sqs:region:account:sqs`.
+ `DlqEventQueueArn` – Chaîne UTF-8.

  Un ARN SQS de lettres mortes Amazon valide. Par exemple, `arn:aws:sqs:region:account:deadLetterQueue`.

## DeltaCatalogTarget Structure S3
<a name="aws-glue-api-crawler-crawling-S3DeltaCatalogTarget"></a>

Spécifie une cible qui écrit dans une source de données Delta Lake dans le catalogue de AWS Glue données.

**Champs**
+ `Name` – *Obligatoire :* Chaîne UTF-8, correspondant au [Custom string pattern #63](aws-glue-api-common.md#regex_63).

  Le nom de la cible de données.
+ `Inputs` – *Obligatoire :* Tableau de chaînes UTF-8, avec 1 chaîne minimum et 1 chaîne maximum.

  Les nœuds qui constituent des entrées pour la cible de données.
+ `PartitionKeys` – Tableau de chaînes UTF-8.

  Indique le partitionnement natif à l'aide d'une séquence de clés.
+ `Table` – *Obligatoire :* Chaîne UTF-8, correspondant au [Custom string pattern #61](aws-glue-api-common.md#regex_61).

  Le nom de la table de la base de données dans laquelle écrire les données.
+ `Database` – *Obligatoire :* Chaîne UTF-8, correspondant au [Custom string pattern #61](aws-glue-api-common.md#regex_61).

  Le nom de la base de données dans laquelle écrire les données.
+ `AdditionalOptions` – Tableau de mappage de paires valeur-clé.

  Chaque clé est une chaîne UTF-8, correspondant au [Custom string pattern #61](aws-glue-api-common.md#regex_61).

  Chaque valeur est une chaîne UTF-8, correspondant au [Custom string pattern #61](aws-glue-api-common.md#regex_61).

  Indique des options de connexion supplémentaires pour le connecteur.
+ `SchemaChangePolicy` – Un objet [CatalogSchemaChangePolicy](aws-glue-api-visual-job-api.md#aws-glue-api-visual-job-api-CatalogSchemaChangePolicy).

  Une politique qui indique les évolutions de mise à jour pour le crawler.
+ `AutoDataQuality` : un objet [AutoDataQuality](aws-glue-api-visual-job-api.md#aws-glue-api-visual-job-api-AutoDataQuality).

  Indique s’il faut activer automatiquement l’évaluation de la qualité des données pour la cible du catalogue S3 Delta. Lorsque ce paramètre est défini sur `true`, les contrôles de qualité des données sont effectués automatiquement pendant l’opération d’écriture.
+ `OutputSchemas` : un tableau d’objets [GlueSchema](aws-glue-api-visual-job-api.md#aws-glue-api-visual-job-api-GlueSchema).

  Indique le schéma de données de la cible du catalogue S3 Delta.

## DeltaDirectTarget Structure S3
<a name="aws-glue-api-crawler-crawling-S3DeltaDirectTarget"></a>

Spécifie une cible qui écrit dans une source de données de Delta Lake dans Amazon S3.

**Champs**
+ `Name` – *Obligatoire :* Chaîne UTF-8, correspondant au [Custom string pattern #63](aws-glue-api-common.md#regex_63).

  Le nom de la cible de données.
+ `Inputs` – *Obligatoire :* Tableau de chaînes UTF-8, avec 1 chaîne minimum et 1 chaîne maximum.

  Les nœuds qui constituent des entrées pour la cible de données.
+ `PartitionKeys` – Tableau de chaînes UTF-8.

  Indique le partitionnement natif à l'aide d'une séquence de clés.
+ `Path` – *Obligatoire :* Chaîne UTF-8, correspondant au [Custom string pattern #61](aws-glue-api-common.md#regex_61).

  Le chemin d'accès Amazon S3 de votre source de données Delta Lake sur laquelle écrire.
+ `Compression` – *Obligatoire :* Chaîne UTF-8 (valeurs valides : `uncompressed="UNCOMPRESSED"` \$1 `snappy="SNAPPY"`).

  Indique la manière dont les données sont comprimées. Ce n'est généralement pas nécessaire si le fichier de données a une extension standard. Les valeurs possibles sont `"gzip"` et `"bzip"`).
+ `NumberTargetPartitions` – Chaîne UTF-8.

  Indique le nombre de partitions cible pour distribuer les fichiers de jeux de données Delta Lake sur Amazon S3.
+ `Format` – *Obligatoire :* chaîne UTF-8 (valeurs valides : `json="JSON"` \$1 `csv="CSV"` \$1 `avro="AVRO"` \$1 `orc="ORC"` \$1 `parquet="PARQUET"` \$1 `hudi="HUDI"` \$1 `delta="DELTA"` \$1 `iceberg="ICEBERG"` \$1 `hyper="HYPER"` \$1 `xml="XML"`).

  Définit le format de sortie des données pour la cible.
+ `AdditionalOptions` – Tableau de mappage de paires valeur-clé.

  Chaque clé est une chaîne UTF-8, correspondant au [Custom string pattern #61](aws-glue-api-common.md#regex_61).

  Chaque valeur est une chaîne UTF-8, correspondant au [Custom string pattern #61](aws-glue-api-common.md#regex_61).

  Indique des options de connexion supplémentaires pour le connecteur.
+ `SchemaChangePolicy` – Un objet [DirectSchemaChangePolicy](aws-glue-api-visual-job-api.md#aws-glue-api-visual-job-api-DirectSchemaChangePolicy).

  Une politique qui indique les évolutions de mise à jour pour le crawler.
+ `AutoDataQuality` : un objet [AutoDataQuality](aws-glue-api-visual-job-api.md#aws-glue-api-visual-job-api-AutoDataQuality).

  Indique s’il faut activer automatiquement l’évaluation de la qualité des données pour la cible directe S3 Delta. Lorsque ce paramètre est défini sur `true`, les contrôles de qualité des données sont effectués automatiquement pendant l’opération d’écriture.

## JdbcTarget structure
<a name="aws-glue-api-crawler-crawling-JdbcTarget"></a>

Indique les magasins de données JDBC à analyser.

**Champs**
+ `ConnectionName` – Chaîne UTF-8, d’une longueur comprise entre 1 et 2 048 octets.

  Nom de la connexion à utiliser pour se connecter à la cible JDBC.
+ `Path` – Chaîne UTF-8.

  Le chemin de la cible JDBC.
+ `Exclusions` – Tableau de chaînes UTF-8.

  Liste de modèles glob utilisés à exclure de l'analyse. Pour en savoir plus, consultez [Catalog Tables with a Crawler](https://docs.aws.amazon.com/glue/latest/dg/add-crawler.html) (Tables de catalogues avec un crawler).
+ `EnableAdditionalMetadata` – Tableau de chaînes UTF-8.

  Spécifiez une valeur de `RAWTYPES` ou `COMMENTS` pour activer des métadonnées supplémentaires dans les réponses des tables. `RAWTYPES` fournit le type de données de niveau natif. `COMMENTS` fournit des commentaires associés à une colonne ou à une table de la base de données.

  Si vous n'avez pas besoin d'autres métadonnées, laissez le champ vide.

## Structure Mongo DBTarget
<a name="aws-glue-api-crawler-crawling-MongoDBTarget"></a>

Indique les magasins de données Amazon DocumentDB ou MongoDB à analyser.

**Champs**
+ `ConnectionName` – Chaîne UTF-8, d’une longueur comprise entre 1 et 2 048 octets.

  Nom de la connexion à utiliser pour se connecter à la cible Amazon DocumentDB ou MongoDB.
+ `Path` – Chaîne UTF-8.

  Chemin d'accès de la cible Amazon DocumentDB ou MongoDB (base de données/collection).
+ `ScanAll` : booléen.

  Indique s'il faut analyser tous les enregistrements ou échantillonner les lignes de la table. L'analyse de tous les enregistrements peut prendre beaucoup de temps lorsque la table n'est pas à haut débit.

  La valeur `true` implique l'analyse de tous les enregistrements, tandis que la valeur `false` implique l'échantillonnage des enregistrements. Si aucune valeur n'est spécifiée, la valeur par défaut est `true`.

## Structure de la dynamo DBTarget
<a name="aws-glue-api-crawler-crawling-DynamoDBTarget"></a>

Spécifie une table Amazon DynamoDB à analyser.

**Champs**
+ `Path` – Chaîne UTF-8.

  Nom de la table DynamoDB à analyser.
+ `scanAll` : booléen.

  Indique s'il faut analyser tous les enregistrements ou échantillonner les lignes de la table. L'analyse de tous les enregistrements peut prendre beaucoup de temps lorsque la table n'est pas à haut débit.

  La valeur `true` implique l'analyse de tous les enregistrements, tandis que la valeur `false` implique l'échantillonnage des enregistrements. Si aucune valeur n'est spécifiée, la valeur par défaut est `true`.
+ `scanRate` – Nombre (double).

  Pourcentage d'unités de capacité de lecture configurées à utiliser par le AWS Glue robot d'exploration. Unités de capacité de lecture est un terme défini par DynamoDB et est une valeur numérique qui sert de limiteur de vitesse pour le nombre de lectures pouvant être effectuées sur cette table par seconde.

  Les valeurs valides sont nulles ou une valeur comprise entre 0,1 et 1,5. Une valeur NULL est utilisée lorsque l'utilisateur ne fournit pas de valeur et que la valeur par défaut est 0,5 de l'unité de capacité de lecture configurée (pour les tables provisionnées) ou 0,25 de l'unité de capacité de lecture maximale configurée (pour les tables utilisant le mode à la demande).

## DeltaTarget structure
<a name="aws-glue-api-crawler-crawling-DeltaTarget"></a>

Spécifie un stockage de données Delta pour analyser un ou plusieurs tableaux Delta.

**Champs**
+ `DeltaTables` – Tableau de chaînes UTF-8.

  Une liste de chemins Amazon S3 vers les tableaux Delta.
+ `ConnectionName` – Chaîne UTF-8, d’une longueur comprise entre 1 et 2 048 octets.

  Nom de la connexion à utiliser pour se connecter à la cible Delta.
+ `WriteManifest` : booléen.

  Spécifie s'il faut écrire les fichiers manifestes dans le chemin d'accès au tableau Delta.
+ `CreateNativeDeltaTable` : booléen.

  Spécifie si le crawler va créer des tables natives pour permettre l'intégration avec les moteurs de requêtes qui prennent directement en charge l'interrogation du journal de transactions Delta.

## IcebergTarget structure
<a name="aws-glue-api-crawler-crawling-IcebergTarget"></a>

Spécifie une source de données Apache Iceberg où les tables Iceberg sont stockées dans Amazon S3.

**Champs**
+ `Paths` – Tableau de chaînes UTF-8.

  Un ou plusieurs Amazon S3 chemins contenant les dossiers de métadonnées Iceberg en tant que`s3://bucket/prefix`.
+ `ConnectionName` – Chaîne UTF-8, d’une longueur comprise entre 1 et 2 048 octets.

  Nom de la connexion à utiliser pour se connecter à la cible Iceberg.
+ `Exclusions` – Tableau de chaînes UTF-8.

  Liste de modèles glob utilisés à exclure de l'analyse. Pour en savoir plus, consultez [Catalog Tables with a Crawler](https://docs.aws.amazon.com/glue/latest/dg/add-crawler.html) (Tables de catalogues avec un crawler).
+ `MaximumTraversalDepth` : nombre (entier).

  Profondeur maximale des Amazon S3 chemins que le robot d'exploration peut parcourir pour découvrir le dossier de métadonnées Iceberg dans votre Amazon S3 chemin. Utilisé pour limiter le temps d'exécution du Crawler.

## HudiTarget structure
<a name="aws-glue-api-crawler-crawling-HudiTarget"></a>

Spécifie une source de données Apache Hudi.

**Champs**
+ `Paths` – Tableau de chaînes UTF-8.

  Tableau de chaînes de Amazon S3 localisation pour Hudi, chacune indiquant le dossier racine dans lequel se trouvent les fichiers de métadonnées d'une table Hudi. Le dossier Hudi peut se trouver dans un dossier enfant du dossier racine.

  Le Crawler examine tous les dossiers situés sous un chemin à la recherche d'un dossier Hudi.
+ `ConnectionName` – Chaîne UTF-8, d’une longueur comprise entre 1 et 2 048 octets.

  Nom de la connexion à utiliser pour se connecter à la cible Hudi. Si vos fichiers Hudi sont stockés dans des compartiments nécessitant une autorisation VPC, vous pouvez définir leurs propriétés de connexion ici.
+ `Exclusions` – Tableau de chaînes UTF-8.

  Liste de modèles glob utilisés à exclure de l'analyse. Pour en savoir plus, consultez [Catalog Tables with a Crawler](https://docs.aws.amazon.com/glue/latest/dg/add-crawler.html) (Tables de catalogues avec un crawler).
+ `MaximumTraversalDepth` : nombre (entier).

  Profondeur maximale des Amazon S3 chemins que le robot d'exploration peut parcourir pour découvrir le dossier de métadonnées Hudi dans votre Amazon S3 chemin. Utilisé pour limiter le temps d'exécution du Crawler.

## CatalogTarget structure
<a name="aws-glue-api-crawler-crawling-CatalogTarget"></a>

Spécifie une AWS Glue Data Catalog cible.

**Champs**
+ `DatabaseName` – *Obligatoire :* Chaîne UTF-8, d’une longueur comprise entre 1 et 255 octets, correspondant au [Single-line string pattern](aws-glue-api-common.md#aws-glue-api-regex-oneLine).

  Le nom de la base de données à synchroniser.
+ `Tables` – *Obligatoire :* Tableau de chaînes UTF-8, au moins 1 chaîne.

  Une liste des tables à synchroniser.
+ `ConnectionName` – Chaîne UTF-8, d’une longueur comprise entre 1 et 2 048 octets.

  Le nom de la connexion d'une table de catalogue de données basées sur Amazon S3 qui doit être la cible de l'analyse lors de l'utilisation d'un type de connexion `Catalog` associé à un type de connexion `NETWORK`.
+ `EventQueueArn` – Chaîne UTF-8.

  Un ARN Amazon SQS valide. Par exemple, `arn:aws:sqs:region:account:sqs`.
+ `DlqEventQueueArn` – Chaîne UTF-8.

  Un ARN SQS de lettres mortes Amazon valide. Par exemple, `arn:aws:sqs:region:account:deadLetterQueue`.

## CrawlerMetrics structure
<a name="aws-glue-api-crawler-crawling-CrawlerMetrics"></a>

Métriques d'un crawler spécifié.

**Champs**
+ `CrawlerName` – Chaîne UTF-8, d’une longueur comprise entre 1 et 255 octets, correspondant au [Single-line string pattern](aws-glue-api-common.md#aws-glue-api-regex-oneLine).

  Nom de l'crawler.
+ `TimeLeftSeconds` – Nombre (double), pas plus qu'Aucun.

  Estimation du temps restant pour terminer une analyse en cours d'exécution.
+ `StillEstimating` : booléen.

  True si le crawler est toujours en cours d'estimation du temps nécessaire pour terminer cette exécution.
+ `LastRuntimeSeconds` – Nombre (double), pas plus qu'Aucun.

  Durée de l'exécution la plus récente de l'crawler, en secondes.
+ `MedianRuntimeSeconds` – Nombre (double), pas plus qu'Aucun.

  Durée médiane des exécutions de cet crawler, en secondes.
+ `TablesCreated` – Nombre (entier), pas plus qu'Aucun.

  Nombre de tables créées par cet crawler.
+ `TablesUpdated` – Nombre (entier), pas plus qu'Aucun.

  Nombre de tables mises à jour par cet crawler.
+ `TablesDeleted` – Nombre (entier), pas plus qu'Aucun.

  Nombre de tables supprimées par cet crawler.

## CrawlerHistory structure
<a name="aws-glue-api-crawler-crawling-CrawlerHistory"></a>

Contient les informations pour une exécution d'un crawler.

**Champs**
+ `CrawlId` – Chaîne UTF-8.

  Un identifiant UUID pour chaque analyse.
+ `State` – Chaîne UTF-8 (valeurs valides : `RUNNING` \$1 `COMPLETED` \$1 `FAILED` \$1 `STOPPED`).

  État de l'analyse.
+ `StartTime` – Horodatage.

  Date et heure auxquelles le crawler a démarré.
+ `EndTime` – Horodatage.

  Date et heure auxquelles l'analyse s'est achevée.
+ `Summary` – Chaîne UTF-8, d’une longueur comprise entre 1 et 255 octets, correspondant au [Single-line string pattern](aws-glue-api-common.md#aws-glue-api-regex-oneLine).

  Un résumé d'exécution pour l'analyse spécifique dans JSON. Contient les tables de catalogue et les partitions qui ont été ajoutées, mises à jour ou supprimées.
+ `ErrorMessage` – Chaîne de description, d’une longueur maximale de 2 048 octets, correspondant au [URI address multi-line string pattern](aws-glue-api-common.md#aws-glue-api-regex-uri).

  Si une erreur s'est produite, le message d'erreur associé à l'analyse.
+ `LogGroup` – Chaîne UTF-8, d’une longueur comprise entre 1 et 512 octets, correspondant au [Log group string pattern](aws-glue-api-common.md#aws-glue-api-regex-logGroup-id).

  Groupe de journaux associés au crawler.
+ `LogStream` – Chaîne UTF-8, d’une longueur comprise entre 1 et 512 octets, correspondant au [Log-stream string pattern](aws-glue-api-common.md#aws-glue-api-regex-logStream-id).

  Flux de journaux associé au crawler.
+ `MessagePrefix` – Chaîne UTF-8, d’une longueur comprise entre 1 et 255 octets, correspondant au [Single-line string pattern](aws-glue-api-common.md#aws-glue-api-regex-oneLine).

  Le préfixe d'un CloudWatch message concernant ce crawl.
+ `DPUHour` – Nombre (double), pas plus qu'Aucun.

  Nombre d'unités de traitement de données (DPU) utilisées en heures pour l'analyse.

## CrawlsFilter structure
<a name="aws-glue-api-crawler-crawling-CrawlsFilter"></a>

Une liste de champs, de comparateurs et de valeurs que vous pouvez utiliser pour filtrer les exécutions de crawler pour un crawler spécifié.

**Champs**
+ `FieldName` – Chaîne UTF-8 (valeurs valides : `CRAWL_ID` \$1 `STATE` \$1 `START_TIME` \$1 `END_TIME` \$1 `DPU_HOUR`).

  Une clé utilisée pour filtrer les exécutions de Crawler pour un Crawler spécifié. Les valeurs valides pour chacun des noms de champs sont les suivantes :
  + `CRAWL_ID` : une chaîne représentant l'identifiant UUID d'une analyse.
  + `STATE` : une chaîne représentant l'état de l'analyse.
  + `START_TIME` et `END_TIME` : l'horodatage de l'époque en millisecondes.
  + `DPU_HOUR` : le nombre d'heures d'unité de traitement de données (DPU) utilisées pour l'analyse.
+ `FilterOperator` – Chaîne UTF-8 (valeurs valides : `GT` \$1 `GE` \$1 `LT` \$1 `LE` \$1 `EQ` \$1 `NE`).

  Un comparateur défini qui agit sur la valeur. Les opérateurs disponibles sont les suivants :
  + `GT` : Supérieur à.
  + `GE` : Supérieur ou égal à.
  + `LT` : Inférieur à.
  + `LE` : Inférieur ou égal à.
  + `EQ` : Égal à.
  + `NE` : Pas égal à.
+ `FieldValue` – Chaîne UTF-8.

  La valeur fournie pour la comparaison dans le champ d'analyse. 

## SchemaChangePolicy structure
<a name="aws-glue-api-crawler-crawling-SchemaChangePolicy"></a>

Stratégie qui spécifie des comportements de mise à jour et de suppression pour l'crawler.

**Champs**
+ `UpdateBehavior` – Chaîne UTF-8 (valeurs valides : `LOG` \$1 `UPDATE_IN_DATABASE`).

  Comportement de mise à jour lorsque le crawler détecte un schéma modifié.
+ `DeleteBehavior` – Chaîne UTF-8 (valeurs valides : `LOG` \$1 `DELETE_FROM_DATABASE` \$1 `DEPRECATE_IN_DATABASE`).

  Comportement de suppression lorsque le crawler détecte un objet supprimé.

## LastCrawlInfo structure
<a name="aws-glue-api-crawler-crawling-LastCrawlInfo"></a>

Informations d'état et d'erreur sur l'analyse la plus récente.

**Champs**
+ `Status` – Chaîne UTF-8 (valeurs valides : `SUCCEEDED` \$1 `CANCELLED` \$1 `FAILED`).

  État de la dernière analyse.
+ `ErrorMessage` – Chaîne de description, d’une longueur maximale de 2 048 octets, correspondant au [URI address multi-line string pattern](aws-glue-api-common.md#aws-glue-api-regex-uri).

  Si une erreur s'est produite, informations d'erreur sur la dernière analyse.
+ `LogGroup` – Chaîne UTF-8, d’une longueur comprise entre 1 et 512 octets, correspondant au [Log group string pattern](aws-glue-api-common.md#aws-glue-api-regex-logGroup-id).

  Groupe de journaux de la dernière analyse.
+ `LogStream` – Chaîne UTF-8, d’une longueur comprise entre 1 et 512 octets, correspondant au [Log-stream string pattern](aws-glue-api-common.md#aws-glue-api-regex-logStream-id).

  Flux de journal de la dernière analyse.
+ `MessagePrefix` – Chaîne UTF-8, d’une longueur comprise entre 1 et 255 octets, correspondant au [Single-line string pattern](aws-glue-api-common.md#aws-glue-api-regex-oneLine).

  Préfixe d'un message sur cette analyse.
+ `StartTime` – Horodatage.

  Heure à laquelle l'analyse a commencé.

## RecrawlPolicy structure
<a name="aws-glue-api-crawler-crawling-RecrawlPolicy"></a>

Lorsque vous indexez une source de données Amazon S3 après la première indexation, spécifie s'il faut indexer à nouveau l'ensemble du jeu de données ou uniquement les dossiers ajoutés depuis la dernière exécution du crawler. Pour de plus amples informations, veuillez consulter la rubrique [Analyses incrémentielles dans AWS Glue](https://docs.aws.amazon.com/glue/latest/dg/incremental-crawls.html) dans le guide du développeur.

**Champs**
+ `RecrawlBehavior` – Chaîne UTF-8 (valeurs valides : `CRAWL_EVERYTHING` \$1 `CRAWL_NEW_FOLDERS_ONLY` \$1 `CRAWL_EVENT_MODE`).

  Spécifie s'il faut analyser à nouveau le jeu de données ou uniquement les dossiers ajoutés depuis la dernière exécution de l'crawler.

  Une valeur de `CRAWL_EVERYTHING` indique que l'ensemble du jeu de données doit être analysé à nouveau.

  Une valeur de `CRAWL_NEW_FOLDERS_ONLY` indique que seuls les dossiers ajoutés depuis la dernière exécution du crawler doivent être indexés.

  Une valeur de `CRAWL_EVENT_MODE` spécifie uniquement l'analyse des modifications identifiées par les événements Amazon S3.

## LineageConfiguration structure
<a name="aws-glue-api-crawler-crawling-LineageConfiguration"></a>

Spécifie les paramètres de configuration de la lignée de données pour l'crawler.

**Champs**
+ `CrawlerLineageSettings` – Chaîne UTF-8 (valeurs valides : `ENABLE` \$1 `DISABLE`).

  Indique si la lignée de données est activée pour le crawler. Les valeurs valides sont :
  + ENABLE : active la lignée des données pour le crawler
  + DISABLE : désactive la lignée de données pour le crawler

## LakeFormationConfiguration structure
<a name="aws-glue-api-crawler-crawling-LakeFormationConfiguration"></a>

Spécifie les paramètres de AWS Lake Formation configuration du robot d'exploration.

**Champs**
+ `UseLakeFormationCredentials` : booléen.

  Spécifie s'il faut utiliser les AWS Lake Formation informations d'identification du robot d'exploration au lieu des informations d'identification du rôle IAM.
+ `AccountId` – Chaîne UTF-8, d'une longueur maximale de 12 octets.

  Obligatoire pour les analyses de compte croisées. Pour les mêmes analyses de compte que les données cibles, cela peut être laissé nul.

## Opérations
<a name="aws-glue-api-crawler-crawling-actions"></a>
+ [CreateCrawler action (Python : create\$1crawler)](#aws-glue-api-crawler-crawling-CreateCrawler)
+ [DeleteCrawler action (Python : delete\$1crawler)](#aws-glue-api-crawler-crawling-DeleteCrawler)
+ [GetCrawler action (Python : get\$1crawler)](#aws-glue-api-crawler-crawling-GetCrawler)
+ [GetCrawlers action (Python : get\$1crawlers)](#aws-glue-api-crawler-crawling-GetCrawlers)
+ [GetCrawlerMetrics action (Python : get\$1crawler\$1metrics)](#aws-glue-api-crawler-crawling-GetCrawlerMetrics)
+ [UpdateCrawler action (Python : update\$1crawler)](#aws-glue-api-crawler-crawling-UpdateCrawler)
+ [StartCrawler action (Python : start\$1crawler)](#aws-glue-api-crawler-crawling-StartCrawler)
+ [StopCrawler action (Python : stop\$1crawler)](#aws-glue-api-crawler-crawling-StopCrawler)
+ [BatchGetCrawlers action (Python : batch\$1get\$1crawlers)](#aws-glue-api-crawler-crawling-BatchGetCrawlers)
+ [ListCrawlers action (Python : list\$1crawlers)](#aws-glue-api-crawler-crawling-ListCrawlers)
+ [ListCrawls action (Python : list\$1crawls)](#aws-glue-api-crawler-crawling-ListCrawls)

## CreateCrawler action (Python : create\$1crawler)
<a name="aws-glue-api-crawler-crawling-CreateCrawler"></a>

Crée un crawler avec des cibles, un rôle, une configuration, et une éventuelle planification spécifiés. Au moins une cible d'analyse doit être spécifiée dans le champ `s3Targets`, le champ `jdbcTargets` ou le champ `DynamoDBTargets`.

**Demande**
+ `Name` – *Obligatoire :* Chaîne UTF-8, d’une longueur comprise entre 1 et 255 octets, correspondant au [Single-line string pattern](aws-glue-api-common.md#aws-glue-api-regex-oneLine).

  Nom du nouveau crawler.
+ `Role` – *Obligatoire :* chaîne UTF-8.

  Rôle IAM ou Amazon Resource Name (ARN) d'un rôle IAM utilisé par le nouveau crawler pour accéder aux ressources client.
+ `DatabaseName` – Chaîne UTF-8.

  La AWS Glue base de données dans laquelle les résultats sont écrits, par exemple :`arn:aws:daylight:us-east-1::database/sometable/*`.
+ `Description` – Chaîne de description, d’une longueur maximale de 2 048 octets, correspondant au [URI address multi-line string pattern](aws-glue-api-common.md#aws-glue-api-regex-uri).

  Description du nouvel crawler.
+ `Targets` – *Obligatoire :* un objet [CrawlerTargets](#aws-glue-api-crawler-crawling-CrawlerTargets).

  Liste de l'ensemble de cibles à analyser.
+ `Schedule` – Chaîne UTF-8.

  Une expression `cron` utilisée pour spécifier la planification (consultez [Time-Based Schedules for Jobs and Crawlers](https://docs.aws.amazon.com/glue/latest/dg/monitor-data-warehouse-schedule.html) (Planifications temporelles pour les tâches et les crawlers)). Par exemple, pour exécuter un élément tous les jours à 12h15 UTC, vous devez spécifier : `cron(15 12 * * ? *)`.
+ `Classifiers` – Tableau de chaînes UTF-8.

  Liste des classifieurs personnalisés que l'utilisateur a enregistrés. Par défaut, tous les classificateurs intégrés sont inclus dans une analyse, mais ces classificateurs personnalisés se substituent toujours aux classificateurs par défaut pour une classification donnée.
+ `TablePrefix` – Chaîne UTF-8, d'une longueur maximale de 128 octets.

  Préfixe de table utilisé pour les tables catalogue créées.
+ `SchemaChangePolicy` – Un objet [SchemaChangePolicy](#aws-glue-api-crawler-crawling-SchemaChangePolicy).

  Stratégie du comportement de mise à jour et de suppression de l'crawler.
+ `RecrawlPolicy` – Un objet [RecrawlPolicy](#aws-glue-api-crawler-crawling-RecrawlPolicy).

  Stratégie qui spécifie s'il faut analyser à nouveau le jeu de données entier ou analyser uniquement les dossiers ajoutés depuis la dernière exécution du crawler.
+ `LineageConfiguration` – Un objet [LineageConfiguration](#aws-glue-api-crawler-crawling-LineageConfiguration).

  Spécifie les paramètres de configuration de la lignée de données pour le crawler.
+ `LakeFormationConfiguration` – Un objet [LakeFormationConfiguration](#aws-glue-api-crawler-crawling-LakeFormationConfiguration).

  Spécifie les paramètres de AWS Lake Formation configuration du robot d'exploration.
+ `Configuration` – Chaîne UTF-8.

  Informations sur la configuration du crawler. Cette chaîne JSON avec gestion des versions permet aux utilisateurs de spécifier des aspects du comportement d'un crawler. Pour plus d'informations, consultez [Setting Crawler configuration options](https://docs.aws.amazon.com/glue/latest/dg/crawler-configuration.html) (Définition d'options de configuration du crawler).
+ `CrawlerSecurityConfiguration` – Chaîne UTF-8, d'une longueur maximale de 128 octets.

  Nom de la structure `SecurityConfiguration` qui sera utilisée par ce crawler.
+ `Tags` – Tableau de mappage de paires clé-valeur, avec 50 paires au maximum.

  Chaque clé est une chaîne UTF-8, d’une longueur comprise entre 1 et 128 octets.

  Chaque valeur est une chaîne UTF-8, d’une longueur maximale de 256 octets.

  Balises à utiliser avec cette demande d'crawler. Vous pouvez utiliser des balises pour limiter l'accès à l'crawler. Pour plus d'informations sur les tags in AWS Glue, voir [AWS Tags in AWS Glue](https://docs.aws.amazon.com/glue/latest/dg/monitor-tags.html) dans le guide du développeur.

**Réponse**
+ *Paramètres d’absence de réponse.*

**Erreurs**
+ `InvalidInputException`
+ `AlreadyExistsException`
+ `OperationTimeoutException`
+ `ResourceNumberLimitExceededException`

## DeleteCrawler action (Python : delete\$1crawler)
<a name="aws-glue-api-crawler-crawling-DeleteCrawler"></a>

Supprime un robot d'exploration spécifié du AWS Glue Data Catalog, sauf si l'état du robot est. `RUNNING`

**Demande**
+ `Name` – *Obligatoire :* Chaîne UTF-8, d’une longueur comprise entre 1 et 255 octets, correspondant au [Single-line string pattern](aws-glue-api-common.md#aws-glue-api-regex-oneLine).

  Nom de l'crawler à supprimer.

**Réponse**
+ *Paramètres d’absence de réponse.*

**Erreurs**
+ `EntityNotFoundException`
+ `CrawlerRunningException`
+ `SchedulerTransitioningException`
+ `OperationTimeoutException`

## GetCrawler action (Python : get\$1crawler)
<a name="aws-glue-api-crawler-crawling-GetCrawler"></a>

Récupère des métadonnées pour un crawler spécifié.

**Demande**
+ `Name` – *Obligatoire :* Chaîne UTF-8, d’une longueur comprise entre 1 et 255 octets, correspondant au [Single-line string pattern](aws-glue-api-common.md#aws-glue-api-regex-oneLine).

  Nom de l'crawler pour lequel récupérer les métadonnées.

**Réponse**
+ `Crawler` – Un objet [crawler](#aws-glue-api-crawler-crawling-Crawler).

  Métadonnées pour l'crawler spécifié.

**Erreurs**
+ `EntityNotFoundException`
+ `OperationTimeoutException`

## GetCrawlers action (Python : get\$1crawlers)
<a name="aws-glue-api-crawler-crawling-GetCrawlers"></a>

Récupère les métadonnées pour tous les crawlers définis dans le compte client.

**Demande**
+ `MaxResults` – Nombre (entier), compris entre 1 et 1 000.

  Nombre d'crawlers à renvoyer à chaque appel.
+ `NextToken` – Chaîne UTF-8.

  Jeton de continuation, s’il s’agit d’une requête de continuation.

**Réponse**
+ `Crawlers` : un tableau d’objets [crawler](#aws-glue-api-crawler-crawling-Crawler).

  Liste des métadonnées de l'crawler.
+ `NextToken` – Chaîne UTF-8.

  Jeton de continuation, si la liste renvoyée n'a pas atteint la fin de ceux définis dans ce compte client.

**Erreurs**
+ `OperationTimeoutException`

## GetCrawlerMetrics action (Python : get\$1crawler\$1metrics)
<a name="aws-glue-api-crawler-crawling-GetCrawlerMetrics"></a>

Récupère les métriques sur les crawlers spécifiés.

**Demande**
+ `CrawlerNameList` – Tableau de chaînes UTF-8, avec 100 chaînes maximum.

  Liste des noms des crawlers sur lesquels récupérer les métriques.
+ `MaxResults` – Nombre (entier), compris entre 1 et 1 000.

  La taille maximale d’une liste à renvoyer.
+ `NextToken` – Chaîne UTF-8.

  Jeton de continuation, s’il s’agit d’un appel de continuation.

**Réponse**
+ `CrawlerMetricsList` : un tableau d’objets [CrawlerMetrics](#aws-glue-api-crawler-crawling-CrawlerMetrics).

  Liste des métriques pour l'crawler spécifié.
+ `NextToken` – Chaîne UTF-8.

  Jeton continuation, si la liste renvoyée ne contient pas la dernière métrique disponible.

**Erreurs**
+ `OperationTimeoutException`

## UpdateCrawler action (Python : update\$1crawler)
<a name="aws-glue-api-crawler-crawling-UpdateCrawler"></a>

Met à jour un crawler. Si un crawler est en cours d'exécution, vous devez l'arrêter à l'aide de `StopCrawler` avant de le mettre à jour.

**Demande**
+ `Name` – *Obligatoire :* Chaîne UTF-8, d’une longueur comprise entre 1 et 255 octets, correspondant au [Single-line string pattern](aws-glue-api-common.md#aws-glue-api-regex-oneLine).

  Nom du nouvel crawler.
+ `Role` – Chaîne UTF-8.

  Rôle IAM ou Amazon Resource Name (ARN) d'un rôle IAM qui est utilisé par le nouvel crawler pour accéder aux ressources client.
+ `DatabaseName` – Chaîne UTF-8.

  La AWS Glue base de données dans laquelle les résultats sont stockés, par exemple :`arn:aws:daylight:us-east-1::database/sometable/*`.
+ `Description` – Chaîne UTF-8, d'une longueur maximale de 2 048 octets, correspondant au [URI address multi-line string pattern](aws-glue-api-common.md#aws-glue-api-regex-uri).

  Description du nouvel crawler.
+ `Targets` – Un objet [CrawlerTargets](#aws-glue-api-crawler-crawling-CrawlerTargets).

  Liste des cibles à analyser.
+ `Schedule` – Chaîne UTF-8.

  Une expression `cron` utilisée pour spécifier la planification (consultez [Time-Based Schedules for Jobs and Crawlers](https://docs.aws.amazon.com/glue/latest/dg/monitor-data-warehouse-schedule.html) (Planifications temporelles pour les tâches et les crawlers)). Par exemple, pour exécuter un élément tous les jours à 12h15 UTC, vous devez spécifier : `cron(15 12 * * ? *)`.
+ `Classifiers` – Tableau de chaînes UTF-8.

  Liste des classifieurs personnalisés que l'utilisateur a enregistrés. Par défaut, tous les classificateurs intégrés sont inclus dans une analyse, mais ces classificateurs personnalisés se substituent toujours aux classificateurs par défaut pour une classification donnée.
+ `TablePrefix` – Chaîne UTF-8, d'une longueur maximale de 128 octets.

  Préfixe de table utilisé pour les tables catalogue créées.
+ `SchemaChangePolicy` – Un objet [SchemaChangePolicy](#aws-glue-api-crawler-crawling-SchemaChangePolicy).

  Stratégie du comportement de mise à jour et de suppression de l'crawler.
+ `RecrawlPolicy` – Un objet [RecrawlPolicy](#aws-glue-api-crawler-crawling-RecrawlPolicy).

  Stratégie qui spécifie s'il faut analyser à nouveau le jeu de données entier ou analyser uniquement les dossiers ajoutés depuis la dernière exécution du crawler.
+ `LineageConfiguration` – Un objet [LineageConfiguration](#aws-glue-api-crawler-crawling-LineageConfiguration).

  Spécifie les paramètres de configuration de la lignée de données pour le crawler.
+ `LakeFormationConfiguration` – Un objet [LakeFormationConfiguration](#aws-glue-api-crawler-crawling-LakeFormationConfiguration).

  Spécifie les paramètres de AWS Lake Formation configuration du robot d'exploration.
+ `Configuration` – Chaîne UTF-8.

  Informations sur la configuration du crawler. Cette chaîne JSON avec gestion des versions permet aux utilisateurs de spécifier des aspects du comportement d'un crawler. Pour plus d'informations, consultez [Setting Crawler configuration options](https://docs.aws.amazon.com/glue/latest/dg/crawler-configuration.html) (Définition d'options de configuration du crawler).
+ `CrawlerSecurityConfiguration` – Chaîne UTF-8, d'une longueur maximale de 128 octets.

  Nom de la structure `SecurityConfiguration` qui sera utilisée par cet crawler.

**Réponse**
+ *Paramètres d’absence de réponse.*

**Erreurs**
+ `InvalidInputException`
+ `VersionMismatchException`
+ `EntityNotFoundException`
+ `CrawlerRunningException`
+ `OperationTimeoutException`

## StartCrawler action (Python : start\$1crawler)
<a name="aws-glue-api-crawler-crawling-StartCrawler"></a>

Démarre une analyse à l'aide de l'crawler, indépendamment de ce qui est prévu. Si le robot d'exploration est déjà en cours d'exécution, renvoie un [CrawlerRunningException](https://docs.aws.amazon.com/glue/latest/dg/aws-glue-api-exceptions.html#aws-glue-api-exceptions-CrawlerRunningException).

**Demande**
+ `Name` – *Obligatoire :* Chaîne UTF-8, d’une longueur comprise entre 1 et 255 octets, correspondant au [Single-line string pattern](aws-glue-api-common.md#aws-glue-api-regex-oneLine).

  Nom de l'crawler à démarrer.

**Réponse**
+ *Paramètres d’absence de réponse.*

**Erreurs**
+ `EntityNotFoundException`
+ `CrawlerRunningException`
+ `OperationTimeoutException`

## StopCrawler action (Python : stop\$1crawler)
<a name="aws-glue-api-crawler-crawling-StopCrawler"></a>

Si l'crawler spécifié est en cours d'exécution, arrête l'analyse.

**Demande**
+ `Name` – *Obligatoire :* Chaîne UTF-8, d’une longueur comprise entre 1 et 255 octets, correspondant au [Single-line string pattern](aws-glue-api-common.md#aws-glue-api-regex-oneLine).

  Nom de l'crawler à arrêter.

**Réponse**
+ *Paramètres d’absence de réponse.*

**Erreurs**
+ `EntityNotFoundException`
+ `CrawlerNotRunningException`
+ `CrawlerStoppingException`
+ `OperationTimeoutException`

## BatchGetCrawlers action (Python : batch\$1get\$1crawlers)
<a name="aws-glue-api-crawler-crawling-BatchGetCrawlers"></a>

Renvoie la liste des métadonnées de ressource pour une liste donnée de noms d'crawler. Après avoir appelé l’opération `ListCrawlers`, vous pouvez appeler cette opération pour accéder aux données sur lesquelles des autorisations vous ont été octroyées. Cette opération prend en charge toutes les autorisations IAM, y compris les conditions d’autorisation qui utilisent des balises.

**Demande**
+ `CrawlerNames` – *Obligatoire :* Tableau de chaînes UTF-8, avec 100 chaînes maximum.

  Liste des noms d'crawler, qui peuvent être les noms renvoyés à partir de l'opération `ListCrawlers`.

**Réponse**
+ `Crawlers` : un tableau d’objets [crawler](#aws-glue-api-crawler-crawling-Crawler).

  Liste des définitions d'crawler.
+ `CrawlersNotFound` – Tableau de chaînes UTF-8, avec 100 chaînes maximum.

  Liste de noms d'crawler qui n'ont pas été trouvés.

**Erreurs**
+ `InvalidInputException`
+ `OperationTimeoutException`

## ListCrawlers action (Python : list\$1crawlers)
<a name="aws-glue-api-crawler-crawling-ListCrawlers"></a>

Récupère les noms de toutes les ressources du robot d'exploration de ce AWS compte, ou des ressources portant le tag spécifié. Cette opération vous permet de voir quelles ressources sont disponibles dans votre compte, et leurs noms.

Cette opération accepte le champ `Tags` facultatif que vous pouvez utiliser comme filtre sur la réponse, afin que les ressources balisées puissent être récupérées en tant que groupe. Si vous choisissez d'utiliser le filtrage des balises, seules les ressources avec la balise sont récupérées.

**Demande**
+ `MaxResults` – Nombre (entier), compris entre 1 et 1 000.

  La taille maximale d’une liste à renvoyer.
+ `NextToken` – Chaîne UTF-8.

  Jeton de continuation, s’il s’agit d’une requête de continuation.
+ `Tags` – Tableau de mappage de paires clé-valeur, avec 50 paires au maximum.

  Chaque clé est une chaîne UTF-8, d’une longueur comprise entre 1 et 128 octets.

  Chaque valeur est une chaîne UTF-8, d’une longueur maximale de 256 octets.

  Spécifie de renvoyer uniquement les ressources balisées.

**Réponse**
+ `CrawlerNames` – Tableau de chaînes UTF-8, avec 100 chaînes maximum.

  Noms de tous les crawlers dans le compte ou des crawlers avec les balises spécifiées.
+ `NextToken` – Chaîne UTF-8.

  Jeton continuation, si la liste renvoyée ne contient pas la dernière métrique disponible.

**Erreurs**
+ `OperationTimeoutException`

## ListCrawls action (Python : list\$1crawls)
<a name="aws-glue-api-crawler-crawling-ListCrawls"></a>

Renvoie toutes les analyse d'un Crawler spécifié. Renvoie uniquement les analyses qui ont eu lieu depuis la date de lancement de la fonction d'historique du Crawler, et ne retient que jusqu'à 12 mois d'analyse. Les anciennes analyses ne seront pas renvoyées.

Vous pouvez utiliser cette API pour :
+ Récupère toutes les analyse d'un Crawler spécifié.
+ Récupère toutes les analyse d'un Crawler spécifié dans un nombre limité.
+ Récupère toutes les analyse d'un Crawler spécifié dans une plage de temps spécifique.
+ Récupère toutes les analyse d'un Crawler spécifié avec un état, un ID d'analyse ou une valeur d'heure DPU particuliers.

**Demande**
+ `CrawlerName` – *Obligatoire :* Chaîne UTF-8, d’une longueur comprise entre 1 et 255 octets, correspondant au [Single-line string pattern](aws-glue-api-common.md#aws-glue-api-regex-oneLine).

  Nom du Crawler dont vous voulez récupérer les exécutions.
+ `MaxResults` – Nombre (entier), compris entre 1 et 1 000.

  Nombre maximal de résultats à renvoyer. La valeur par défaut est 20 et la valeur maximale est 100.
+ `Filters` : un tableau d’objets [CrawlsFilter](#aws-glue-api-crawler-crawling-CrawlsFilter).

  Filtre les analyse en fonction de critères que vous spécifiez dans une liste objets `CrawlsFilter`.
+ `NextToken` – Chaîne UTF-8.

  Jeton de continuation, s’il s’agit d’un appel de continuation.

**Réponse**
+ `Crawls` : un tableau d’objets [CrawlerHistory](#aws-glue-api-crawler-crawling-CrawlerHistory).

  Une liste d'objets `CrawlerHistory` représentant les cycles d'analyse qui répondent à vos critères.
+ `NextToken` – Chaîne UTF-8.

  Jeton de continuation pour la pagination de la liste des jetons renvoyés, renvoyé si le segment actuel de la liste n’est pas le dernier.

**Erreurs**
+ `EntityNotFoundException`
+ `OperationTimeoutException`
+ `InvalidInputException`

# API de statistiques de colonne
<a name="aws-glue-api-crawler-column-statistics"></a>

L'API de statistiques de colonnes décrit comment renvoyer AWS Glue APIs des statistiques sur les colonnes d'une table.

## Types de données
<a name="aws-glue-api-crawler-column-statistics-objects"></a>
+ [ColumnStatisticsTaskRun structure](#aws-glue-api-crawler-column-statistics-ColumnStatisticsTaskRun)
+ [ColumnStatisticsTaskSettings structure](#aws-glue-api-crawler-column-statistics-ColumnStatisticsTaskSettings)
+ [ExecutionAttempt structure](#aws-glue-api-crawler-column-statistics-ExecutionAttempt)

## ColumnStatisticsTaskRun structure
<a name="aws-glue-api-crawler-column-statistics-ColumnStatisticsTaskRun"></a>

L'objet qui affiche les détails de l'exécution des statistiques de colonne.

**Champs**
+ `CustomerId` – Chaîne UTF-8, d'une longueur maximale de 12 octets.

  L'identifiant AWS du compte.
+ `ColumnStatisticsTaskRunId` – Chaîne UTF-8, d’une longueur comprise entre 1 et 255 octets, correspondant au [Single-line string pattern](aws-glue-api-common.md#aws-glue-api-regex-oneLine).

  L'identifiant d'exécution de la tâche de statistiques de colonne particulière.
+ `DatabaseName` – Chaîne UTF-8.

  La base de données où réside la table.
+ `TableName` – Chaîne UTF-8.

  Le nom de la table pour laquelle les statistiques de colonne sont générées.
+ `ColumnNameList` – Tableau de chaînes UTF-8.

  Une liste des noms de colonnes. Si aucun nom n'est fourni, tous les noms de colonnes de la table seront utilisés par défaut.
+ `CatalogID` – Chaîne d’ID de catalogue, d’une longueur comprise entre 1 et 255 octets, correspondant au [Single-line string pattern](aws-glue-api-common.md#aws-glue-api-regex-oneLine).

  ID du catalogue de données où réside la table. Si aucun identifiant n'est fourni, l'identifiant du AWS compte est utilisé par défaut.
+ `Role` – Chaîne UTF-8.

  Le rôle IAM que le service assume pour générer des statistiques.
+ `SampleSize` – Nombre (double), 100 au maximum.

  Pourcentage de lignes utilisées pour générer des statistiques. Si aucun nom n'est fourni, la table entière sera utilisée pour générer des statistiques.
+ `SecurityConfiguration` – Chaîne UTF-8, d'une longueur maximale de 128 octets.

  Nom de la configuration de sécurité utilisée pour chiffrer les CloudWatch journaux pour la tâche de statistiques de colonne exécutée.
+ `NumberOfWorkers` – Nombre (entier), au moins égal à 1.

  Le nombre d'employés utilisés pour générer les statistiques de colonne. La tâche est préconfigurée pour effectuer une mise à l'échelle automatique jusqu'à 25 instances.
+ `WorkerType` – Chaîne UTF-8, d’une longueur comprise entre 1 et 255 octets, correspondant au [Single-line string pattern](aws-glue-api-common.md#aws-glue-api-regex-oneLine).

  Type de travailleurs utilisés pour générer des statistiques. La valeur par défaut est `g.1x`.
+ `ComputationType` – Chaîne UTF-8 (valeurs valides : `FULL` \$1 `INCREMENTAL`).

  Type de calcul de statistiques de colonne.
+ `Status` – Chaîne UTF-8 (valeurs valides : `STARTING` \$1 `RUNNING` \$1 `SUCCEEDED` \$1 `FAILED` \$1 `STOPPED`).

  L'état d'exécution de la tâche.
+ `CreationTime` – Horodatage.

  Heure à laquelle cette tâche a été créée.
+ `LastUpdated` – Horodatage.

  Dernier moment où cette tâche a été modifiée.
+ `StartTime` – Horodatage.

  L'heure de début de la tâche.
+ `EndTime` – Horodatage.

  L'heure de fin de la tâche.
+ `ErrorMessage` – Chaîne de description, d’une longueur maximale de 2 048 octets, correspondant au [URI address multi-line string pattern](aws-glue-api-common.md#aws-glue-api-regex-uri).

  Le message d'erreur pour la tâche.
+ `DPUSeconds` – Nombre (double), pas plus qu'Aucun.

  L'utilisation de la DPU calculée en secondes pour tous les travailleurs mis à l'échelle automatique.

## ColumnStatisticsTaskSettings structure
<a name="aws-glue-api-crawler-column-statistics-ColumnStatisticsTaskSettings"></a>

Paramètres d’une tâche de statistiques de colonne.

**Champs**
+ `DatabaseName` – Chaîne UTF-8.

  Le nom de la base de données où réside la table.
+ `TableName` – Chaîne UTF-8.

  Nom de la table pour laquelle les statistiques de colonne sont générées.
+ `Schedule` – Un objet [Planificateur](aws-glue-api-crawler-scheduler.md#aws-glue-api-crawler-scheduler-Schedule).

  Calendrier d’exécution des statistiques de colonne, spécifié dans la syntaxe CRON.
+ `ColumnNameList` – Tableau de chaînes UTF-8.

  Liste des noms de colonnes pour lesquelles les statistiques doivent être exécutées.
+ `CatalogID` – Chaîne d’ID de catalogue, d’une longueur comprise entre 1 et 255 octets, correspondant au [Single-line string pattern](aws-glue-api-common.md#aws-glue-api-regex-oneLine).

  ID du catalogue de données dans lequel réside la base de données.
+ `Role` – Chaîne UTF-8.

  Rôle utilisé pour l’exécution des statistiques de colonne.
+ `SampleSize` – Nombre (double), 100 au maximum.

  Pourcentage de données à échantillonner.
+ `SecurityConfiguration` – Chaîne UTF-8, d'une longueur maximale de 128 octets.

  Nom de la configuration de sécurité utilisée pour chiffrer les CloudWatch journaux.
+ `ScheduleType` – Chaîne UTF-8 (valeurs valides : `CRON` \$1 `AUTO`).

  Type de planification pour une tâche de statistiques de colonne. Les valeurs possibles peuvent être `CRON` ou `AUTO`.
+ `SettingSource` – Chaîne UTF-8 (valeurs valides : `CATALOG` \$1 `TABLE`).

  Source de définition de la tâche de statistiques de colonne. Les valeurs possibles peuvent être `CATALOG` ou `TABLE`.
+ `LastExecutionAttempt` : un objet [ExecutionAttempt](#aws-glue-api-crawler-column-statistics-ExecutionAttempt).

  Dernière `ExecutionAttempt` pour l’exécution de la tâche de statistiques de colonne.

## ExecutionAttempt structure
<a name="aws-glue-api-crawler-column-statistics-ExecutionAttempt"></a>

Tentative d’exécution d’une tâche de statistiques de colonne.

**Champs**
+ `Status` – Chaîne UTF-8 (valeurs valides : `FAILED` \$1 `STARTED`).

  Statut d’exécution de la dernière tâche de statistiques de colonne.
+ `ColumnStatisticsTaskRunId` – Chaîne UTF-8, d’une longueur comprise entre 1 et 255 octets, correspondant au [Single-line string pattern](aws-glue-api-common.md#aws-glue-api-regex-oneLine).

  Identifiant d’exécution de tâche de la dernière exécution de tâche de statistiques de colonne.
+ `ExecutionTimestamp` – Horodatage.

  Horodatage de la dernière exécution de tâche de statistiques de colonne.
+ `ErrorMessage` – Chaîne de description, d’une longueur maximale de 2 048 octets, correspondant au [URI address multi-line string pattern](aws-glue-api-common.md#aws-glue-api-regex-uri).

  Message d’erreur associé à la dernière exécution de tâche de statistiques de colonne.

## Opérations
<a name="aws-glue-api-crawler-column-statistics-actions"></a>
+ [StartColumnStatisticsTaskRun action (Python : start\$1column\$1statistics\$1task\$1run)](#aws-glue-api-crawler-column-statistics-StartColumnStatisticsTaskRun)
+ [GetColumnStatisticsTaskRun action (Python : get\$1column\$1statistics\$1task\$1run)](#aws-glue-api-crawler-column-statistics-GetColumnStatisticsTaskRun)
+ [GetColumnStatisticsTaskRuns action (Python : get\$1column\$1statistics\$1task\$1runs)](#aws-glue-api-crawler-column-statistics-GetColumnStatisticsTaskRuns)
+ [ListColumnStatisticsTaskRuns action (Python : list\$1column\$1statistics\$1task\$1runs)](#aws-glue-api-crawler-column-statistics-ListColumnStatisticsTaskRuns)
+ [StopColumnStatisticsTaskRun action (Python : stop\$1column\$1statistics\$1task\$1run)](#aws-glue-api-crawler-column-statistics-StopColumnStatisticsTaskRun)
+ [CreateColumnStatisticsTaskSettings action (Python : create\$1column\$1statistics\$1task\$1settings)](#aws-glue-api-crawler-column-statistics-CreateColumnStatisticsTaskSettings)
+ [UpdateColumnStatisticsTaskSettings action (Python : update\$1column\$1statistics\$1task\$1settings)](#aws-glue-api-crawler-column-statistics-UpdateColumnStatisticsTaskSettings)
+ [GetColumnStatisticsTaskSettings action (Python : get\$1column\$1statistics\$1task\$1settings)](#aws-glue-api-crawler-column-statistics-GetColumnStatisticsTaskSettings)
+ [DeleteColumnStatisticsTaskSettings action (Python : delete\$1column\$1statistics\$1task\$1settings)](#aws-glue-api-crawler-column-statistics-DeleteColumnStatisticsTaskSettings)
+ [StartColumnStatisticsTaskRunSchedule action (Python : start\$1column\$1statistics\$1task\$1run\$1schedule)](#aws-glue-api-crawler-column-statistics-StartColumnStatisticsTaskRunSchedule)
+ [StopColumnStatisticsTaskRunSchedule action (Python : stop\$1column\$1statistics\$1task\$1run\$1schedule)](#aws-glue-api-crawler-column-statistics-StopColumnStatisticsTaskRunSchedule)

## StartColumnStatisticsTaskRun action (Python : start\$1column\$1statistics\$1task\$1run)
<a name="aws-glue-api-crawler-column-statistics-StartColumnStatisticsTaskRun"></a>

Démarre une exécution de tâche de statistiques de colonne pour une table et des colonnes spécifiées.

**Demande**
+ `DatabaseName` – *Obligatoire :* Chaîne UTF-8, d’une longueur comprise entre 1 et 255 octets, correspondant au [Single-line string pattern](aws-glue-api-common.md#aws-glue-api-regex-oneLine).

  Le nom de la base de données où réside la table.
+ `TableName` – *Obligatoire :* Chaîne UTF-8, d’une longueur comprise entre 1 et 255 octets, correspondant au [Single-line string pattern](aws-glue-api-common.md#aws-glue-api-regex-oneLine).

  Le nom de la table pour générer des statistiques.
+ `ColumnNameList` – Tableau de chaînes UTF-8.

  Une liste des noms de colonnes pour générer des statistiques. Si aucun nom n'est fourni, tous les noms de colonnes de la table seront utilisés par défaut.
+ `Role` – *Obligatoire :* Chaîne UTF-8, d’une longueur comprise entre 1 et 255 octets, correspondant au [Single-line string pattern](aws-glue-api-common.md#aws-glue-api-regex-oneLine).

  Le rôle IAM que le service assume pour générer des statistiques.
+ `SampleSize` – Nombre (double), 100 au maximum.

  Pourcentage de lignes utilisées pour générer des statistiques. Si aucun nom n'est fourni, la table entière sera utilisée pour générer des statistiques.
+ `CatalogID` – Chaîne UTF-8, d’une longueur comprise entre 1 et 255 octets, correspondant au [Single-line string pattern](aws-glue-api-common.md#aws-glue-api-regex-oneLine).

  L'ID du catalogue de données où réside la table. Si aucun nom n'est fourni, l'ID de compte AWS est utilisé par défaut.
+ `SecurityConfiguration` – Chaîne UTF-8, d’une longueur comprise entre 1 et 255 octets, correspondant au [Single-line string pattern](aws-glue-api-common.md#aws-glue-api-regex-oneLine).

  Nom de la configuration de sécurité utilisée pour chiffrer les CloudWatch journaux pour la tâche de statistiques de colonne exécutée.

**Réponse**
+ `ColumnStatisticsTaskRunId` – Chaîne UTF-8, d’une longueur comprise entre 1 et 255 octets, correspondant au [Single-line string pattern](aws-glue-api-common.md#aws-glue-api-regex-oneLine).

  L'identifiant d'exécution de la tâche de statistiques de colonne.

**Erreurs**
+ `AccessDeniedException`
+ `EntityNotFoundException`
+ `ColumnStatisticsTaskRunningException`
+ `OperationTimeoutException`
+ `ResourceNumberLimitExceededException`
+ `InvalidInputException`

## GetColumnStatisticsTaskRun action (Python : get\$1column\$1statistics\$1task\$1run)
<a name="aws-glue-api-crawler-column-statistics-GetColumnStatisticsTaskRun"></a>

Obtenez le code associé metadata/information à une exécution de tâche, en fonction d'un ID d'exécution de tâche.

**Demande**
+ `ColumnStatisticsTaskRunId` – *Obligatoire :* Chaîne UTF-8, d’une longueur comprise entre 1 et 255 octets, correspondant au [Single-line string pattern](aws-glue-api-common.md#aws-glue-api-regex-oneLine).

  L'identifiant d'exécution de la tâche de statistiques de colonne particulière.

**Réponse**
+ `ColumnStatisticsTaskRun` – Un objet [ColumnStatisticsTaskRun](#aws-glue-api-crawler-column-statistics-ColumnStatisticsTaskRun).

  Un objet `ColumnStatisticsTaskRun` représentant les détails de l'exécution des statistiques de colonne.

**Erreurs**
+ `EntityNotFoundException`
+ `OperationTimeoutException`
+ `InvalidInputException`

## GetColumnStatisticsTaskRuns action (Python : get\$1column\$1statistics\$1task\$1runs)
<a name="aws-glue-api-crawler-column-statistics-GetColumnStatisticsTaskRuns"></a>

Récupère des informations sur toutes les exécutions associées à la table spécifiée.

**Demande**
+ `DatabaseName` – *Obligatoire :* chaîne UTF-8.

  Le nom de la base de données où réside la table.
+ `TableName` – *Obligatoire :* Chaîne UTF-8, d’une longueur comprise entre 1 et 255 octets, correspondant au [Single-line string pattern](aws-glue-api-common.md#aws-glue-api-regex-oneLine).

  Nom de la table.
+ `MaxResults` – Nombre (entier), compris entre 1 et 1 000.

  Taille maximale de la réponse.
+ `NextToken` – Chaîne UTF-8.

  Jeton de continuation, s’il s’agit d’un appel de continuation.

**Réponse**
+ `ColumnStatisticsTaskRuns` : un tableau d’objets [ColumnStatisticsTaskRun](#aws-glue-api-crawler-column-statistics-ColumnStatisticsTaskRun).

  Une liste des exécutions de tâches de statistiques de colonne.
+ `NextToken` – Chaîne UTF-8.

  Un jeton de continuation, si toutes les exécutions de tâches n'ont pas encore été renvoyées.

**Erreurs**
+ `OperationTimeoutException`

## ListColumnStatisticsTaskRuns action (Python : list\$1column\$1statistics\$1task\$1runs)
<a name="aws-glue-api-crawler-column-statistics-ListColumnStatisticsTaskRuns"></a>

Répertoriez toutes les exécutions de tâches pour un compte spécifique.

**Demande**
+ `MaxResults` – Nombre (entier), compris entre 1 et 1 000.

  Taille maximale de la réponse.
+ `NextToken` – Chaîne UTF-8.

  Jeton de continuation, s’il s’agit d’un appel de continuation.

**Réponse**
+ `ColumnStatisticsTaskRunIds` – Tableau de chaînes UTF-8, avec 100 chaînes maximum.

  Liste des tâches de statistiques de colonnes exécutées IDs.
+ `NextToken` – Chaîne UTF-8.

  Un jeton de continuation, si toutes les tâches exécutées n' IDs ont pas encore été renvoyées.

**Erreurs**
+ `OperationTimeoutException`

## StopColumnStatisticsTaskRun action (Python : stop\$1column\$1statistics\$1task\$1run)
<a name="aws-glue-api-crawler-column-statistics-StopColumnStatisticsTaskRun"></a>

Arrête l'exécution d'une tâche pour la table spécifiée.

**Demande**
+ `DatabaseName` – *Obligatoire :* chaîne UTF-8.

  Le nom de la base de données où réside la table.
+ `TableName` – *Obligatoire :* Chaîne UTF-8, d’une longueur comprise entre 1 et 255 octets, correspondant au [Single-line string pattern](aws-glue-api-common.md#aws-glue-api-regex-oneLine).

  Nom de la table.

**Réponse**
+ *Paramètres d’absence de réponse.*

**Erreurs**
+ `EntityNotFoundException`
+ `ColumnStatisticsTaskNotRunningException`
+ `ColumnStatisticsTaskStoppingException`
+ `OperationTimeoutException`

## CreateColumnStatisticsTaskSettings action (Python : create\$1column\$1statistics\$1task\$1settings)
<a name="aws-glue-api-crawler-column-statistics-CreateColumnStatisticsTaskSettings"></a>

Crée les paramètres d’une tâche de statistiques de colonne.

**Demande**
+ `DatabaseName` – *Obligatoire :* Chaîne UTF-8, d’une longueur comprise entre 1 et 255 octets, correspondant au [Single-line string pattern](aws-glue-api-common.md#aws-glue-api-regex-oneLine).

  Le nom de la base de données où réside la table.
+ `TableName` – *Obligatoire :* Chaîne UTF-8, d’une longueur comprise entre 1 et 255 octets, correspondant au [Single-line string pattern](aws-glue-api-common.md#aws-glue-api-regex-oneLine).

  Nom de la table pour laquelle les statistiques de colonne sont générées.
+ `Role` – *Obligatoire :* Chaîne UTF-8, d’une longueur comprise entre 1 et 255 octets, correspondant au [Single-line string pattern](aws-glue-api-common.md#aws-glue-api-regex-oneLine).

  Rôle utilisé pour l’exécution des statistiques de colonne.
+ `Schedule` – Chaîne UTF-8.

  Calendrier d’exécution des statistiques de colonne, spécifié dans la syntaxe CRON.
+ `ColumnNameList` – Tableau de chaînes UTF-8.

  Liste des noms de colonnes pour lesquelles les statistiques doivent être exécutées.
+ `SampleSize` – Nombre (double), 100 au maximum.

  Pourcentage de données à échantillonner.
+ `CatalogID` – Chaîne UTF-8, d’une longueur comprise entre 1 et 255 octets, correspondant au [Single-line string pattern](aws-glue-api-common.md#aws-glue-api-regex-oneLine).

  ID du catalogue de données dans lequel réside la base de données.
+ `SecurityConfiguration` – Chaîne UTF-8, d’une longueur comprise entre 1 et 255 octets, correspondant au [Single-line string pattern](aws-glue-api-common.md#aws-glue-api-regex-oneLine).

  Nom de la configuration de sécurité utilisée pour chiffrer les CloudWatch journaux.
+ `Tags` – Tableau de mappage de paires clé-valeur, avec 50 paires au maximum.

  Chaque clé est une chaîne UTF-8, d’une longueur comprise entre 1 et 128 octets.

  Chaque valeur est une chaîne UTF-8, d’une longueur maximale de 256 octets.

  Carte de balises.

**Réponse**
+ *Paramètres d’absence de réponse.*

**Erreurs**
+ `AlreadyExistsException`
+ `AccessDeniedException`
+ `EntityNotFoundException`
+ `InvalidInputException`
+ `OperationTimeoutException`
+ `ResourceNumberLimitExceededException`
+ `ColumnStatisticsTaskRunningException`

## UpdateColumnStatisticsTaskSettings action (Python : update\$1column\$1statistics\$1task\$1settings)
<a name="aws-glue-api-crawler-column-statistics-UpdateColumnStatisticsTaskSettings"></a>

Met à jour les paramètres d’une tâche de statistiques de colonne.

**Demande**
+ `DatabaseName` – *Obligatoire :* Chaîne UTF-8, d’une longueur comprise entre 1 et 255 octets, correspondant au [Single-line string pattern](aws-glue-api-common.md#aws-glue-api-regex-oneLine).

  Le nom de la base de données où réside la table.
+ `TableName` – *Obligatoire :* Chaîne UTF-8, d’une longueur comprise entre 1 et 255 octets, correspondant au [Single-line string pattern](aws-glue-api-common.md#aws-glue-api-regex-oneLine).

  Nom de la table pour laquelle les statistiques de colonne sont générées.
+ `Role` – Chaîne UTF-8, d’une longueur comprise entre 1 et 255 octets, correspondant au [Single-line string pattern](aws-glue-api-common.md#aws-glue-api-regex-oneLine).

  Rôle utilisé pour l’exécution des statistiques de colonne.
+ `Schedule` – Chaîne UTF-8.

  Calendrier d’exécution des statistiques de colonne, spécifié dans la syntaxe CRON.
+ `ColumnNameList` – Tableau de chaînes UTF-8.

  Liste des noms de colonnes pour lesquelles les statistiques doivent être exécutées.
+ `SampleSize` – Nombre (double), 100 au maximum.

  Pourcentage de données à échantillonner.
+ `CatalogID` – Chaîne UTF-8, d’une longueur comprise entre 1 et 255 octets, correspondant au [Single-line string pattern](aws-glue-api-common.md#aws-glue-api-regex-oneLine).

  ID du catalogue de données dans lequel réside la base de données.
+ `SecurityConfiguration` – Chaîne UTF-8, d’une longueur comprise entre 1 et 255 octets, correspondant au [Single-line string pattern](aws-glue-api-common.md#aws-glue-api-regex-oneLine).

  Nom de la configuration de sécurité utilisée pour chiffrer les CloudWatch journaux.

**Réponse**
+ *Paramètres d’absence de réponse.*

**Erreurs**
+ `AccessDeniedException`
+ `EntityNotFoundException`
+ `InvalidInputException`
+ `VersionMismatchException`
+ `OperationTimeoutException`

## GetColumnStatisticsTaskSettings action (Python : get\$1column\$1statistics\$1task\$1settings)
<a name="aws-glue-api-crawler-column-statistics-GetColumnStatisticsTaskSettings"></a>

Obtient les paramètres d’une tâche de statistiques de colonne.

**Demande**
+ `DatabaseName` – *Obligatoire :* Chaîne UTF-8, d’une longueur comprise entre 1 et 255 octets, correspondant au [Single-line string pattern](aws-glue-api-common.md#aws-glue-api-regex-oneLine).

  Le nom de la base de données où réside la table.
+ `TableName` – *Obligatoire :* Chaîne UTF-8, d’une longueur comprise entre 1 et 255 octets, correspondant au [Single-line string pattern](aws-glue-api-common.md#aws-glue-api-regex-oneLine).

  Nom de la table pour laquelle les statistiques de colonne sont extraites.

**Réponse**
+ `ColumnStatisticsTaskSettings` – Un objet [ColumnStatisticsTaskSettings](#aws-glue-api-crawler-column-statistics-ColumnStatisticsTaskSettings).

  Objet `ColumnStatisticsTaskSettings` représentant les paramètres de la tâche de statistiques de colonne.

**Erreurs**
+ `EntityNotFoundException`
+ `InvalidInputException`
+ `OperationTimeoutException`

## DeleteColumnStatisticsTaskSettings action (Python : delete\$1column\$1statistics\$1task\$1settings)
<a name="aws-glue-api-crawler-column-statistics-DeleteColumnStatisticsTaskSettings"></a>

Supprime les paramètres d’une tâche de statistiques de colonne.

**Demande**
+ `DatabaseName` – *Obligatoire :* Chaîne UTF-8, d’une longueur comprise entre 1 et 255 octets, correspondant au [Single-line string pattern](aws-glue-api-common.md#aws-glue-api-regex-oneLine).

  Le nom de la base de données où réside la table.
+ `TableName` – *Obligatoire :* Chaîne UTF-8, d’une longueur comprise entre 1 et 255 octets, correspondant au [Single-line string pattern](aws-glue-api-common.md#aws-glue-api-regex-oneLine).

  Nom de la table pour laquelle les statistiques de colonne sont supprimées.

**Réponse**
+ *Paramètres d’absence de réponse.*

**Erreurs**
+ `EntityNotFoundException`
+ `InvalidInputException`
+ `OperationTimeoutException`

## StartColumnStatisticsTaskRunSchedule action (Python : start\$1column\$1statistics\$1task\$1run\$1schedule)
<a name="aws-glue-api-crawler-column-statistics-StartColumnStatisticsTaskRunSchedule"></a>

Démarre la planification d’exécution d’une tâche de statistiques de colonne.

**Demande**
+ `DatabaseName` – *Obligatoire :* Chaîne UTF-8, d’une longueur comprise entre 1 et 255 octets, correspondant au [Single-line string pattern](aws-glue-api-common.md#aws-glue-api-regex-oneLine).

  Le nom de la base de données où réside la table.
+ `TableName` – *Obligatoire :* Chaîne UTF-8, d’une longueur comprise entre 1 et 255 octets, correspondant au [Single-line string pattern](aws-glue-api-common.md#aws-glue-api-regex-oneLine).

  Nom de la table pour laquelle un calendrier d’exécution des tâches de statistiques de colonne doit être lancé.

**Réponse**
+ *Paramètres d’absence de réponse.*

**Erreurs**
+ `AccessDeniedException`
+ `EntityNotFoundException`
+ `InvalidInputException`
+ `OperationTimeoutException`

## StopColumnStatisticsTaskRunSchedule action (Python : stop\$1column\$1statistics\$1task\$1run\$1schedule)
<a name="aws-glue-api-crawler-column-statistics-StopColumnStatisticsTaskRunSchedule"></a>

Arrête un calendrier d’exécution d’une tâche de statistiques de colonne.

**Demande**
+ `DatabaseName` – *Obligatoire :* Chaîne UTF-8, d’une longueur comprise entre 1 et 255 octets, correspondant au [Single-line string pattern](aws-glue-api-common.md#aws-glue-api-regex-oneLine).

  Le nom de la base de données où réside la table.
+ `TableName` – *Obligatoire :* Chaîne UTF-8, d’une longueur comprise entre 1 et 255 octets, correspondant au [Single-line string pattern](aws-glue-api-common.md#aws-glue-api-regex-oneLine).

  Nom de la table pour laquelle un calendrier d’exécution des tâches de statistiques de colonne doit être arrêté.

**Réponse**
+ *Paramètres d’absence de réponse.*

**Erreurs**
+ `EntityNotFoundException`
+ `InvalidInputException`
+ `OperationTimeoutException`

## Exceptions
<a name="aws-glue-api-crawler-column-statistics-exceptions"></a>
+ [ColumnStatisticsTaskRunningException structure](#aws-glue-api-crawler-column-statistics-ColumnStatisticsTaskRunningException)
+ [ColumnStatisticsTaskNotRunningException structure](#aws-glue-api-crawler-column-statistics-ColumnStatisticsTaskNotRunningException)
+ [ColumnStatisticsTaskStoppingException structure](#aws-glue-api-crawler-column-statistics-ColumnStatisticsTaskStoppingException)
+ [ColumnStatisticsTaskAutoConcurrencyLimitException structure](#aws-glue-api-crawler-column-statistics-ColumnStatisticsTaskAutoConcurrencyLimitException)
+ [InvalidCatalogSettingException structure](#aws-glue-api-crawler-column-statistics-InvalidCatalogSettingException)

## ColumnStatisticsTaskRunningException structure
<a name="aws-glue-api-crawler-column-statistics-ColumnStatisticsTaskRunningException"></a>

Exception renvoyée lorsque vous essayez de démarrer une autre tâche lors de l'exécution d'une tâche de génération de statistiques de colonne.

**Champs**
+ `Message` – Chaîne UTF-8.

  Un message décrivant le problème.

## ColumnStatisticsTaskNotRunningException structure
<a name="aws-glue-api-crawler-column-statistics-ColumnStatisticsTaskNotRunningException"></a>

Exception renvoyée lorsque vous essayez d'arrêter l'exécution d'une tâche alors qu'aucune tâche n'est en cours d'exécution.

**Champs**
+ `Message` – Chaîne UTF-8.

  Un message décrivant le problème.

## ColumnStatisticsTaskStoppingException structure
<a name="aws-glue-api-crawler-column-statistics-ColumnStatisticsTaskStoppingException"></a>

Exception renvoyée lorsque vous essayez d'arrêter l'exécution d'une tâche.

**Champs**
+ `Message` – Chaîne UTF-8.

  Un message décrivant le problème.

## ColumnStatisticsTaskAutoConcurrencyLimitException structure
<a name="aws-glue-api-crawler-column-statistics-ColumnStatisticsTaskAutoConcurrencyLimitException"></a>

Une exception est déclenchée lorsque vous avez déjà atteint la limite des tâches de statistiques automatiques simultanées.

**Champs**
+ `Message` – Chaîne UTF-8.

  Un message décrivant le problème.

## InvalidCatalogSettingException structure
<a name="aws-glue-api-crawler-column-statistics-InvalidCatalogSettingException"></a>

Une exception déclenchée en cas de problème avec les paramètres du catalogue.

**Champs**
+ `Message` – Chaîne UTF-8.

  Un message décrivant le problème.

# API du planificateur du crawler
<a name="aws-glue-api-crawler-scheduler"></a>

L'API du planificateur de robots décrit les types de données des robots d' AWS Glue exploration, ainsi que l'API permettant de créer, de supprimer, de mettre à jour et de répertorier les robots d'exploration.

## Types de données
<a name="aws-glue-api-crawler-scheduler-objects"></a>
+ [Structure du planificateur](#aws-glue-api-crawler-scheduler-Schedule)

## Structure du planificateur
<a name="aws-glue-api-crawler-scheduler-Schedule"></a>

Objet de planification utilisant une instruction `cron` pour planifier un événement.

**Champs**
+ `ScheduleExpression` – Chaîne UTF-8.

  Une expression `cron` utilisée pour spécifier la planification (consultez [Time-Based Schedules for Jobs and Crawlers](https://docs.aws.amazon.com/glue/latest/dg/monitor-data-warehouse-schedule.html) (Planifications temporelles pour les tâches et les crawlers)). Par exemple, pour exécuter un élément tous les jours à 12h15 UTC, vous devez spécifier : `cron(15 12 * * ? *)`.
+ `State` – Chaîne UTF-8 (valeurs valides : `SCHEDULED` \$1 `NOT_SCHEDULED` \$1 `TRANSITIONING`).

  État de la planification.

## Opérations
<a name="aws-glue-api-crawler-scheduler-actions"></a>
+ [UpdateCrawlerSchedule action (Python : update\$1crawler\$1schedule)](#aws-glue-api-crawler-scheduler-UpdateCrawlerSchedule)
+ [StartCrawlerSchedule action (Python : start\$1crawler\$1schedule)](#aws-glue-api-crawler-scheduler-StartCrawlerSchedule)
+ [StopCrawlerSchedule action (Python : stop\$1crawler\$1schedule)](#aws-glue-api-crawler-scheduler-StopCrawlerSchedule)

## UpdateCrawlerSchedule action (Python : update\$1crawler\$1schedule)
<a name="aws-glue-api-crawler-scheduler-UpdateCrawlerSchedule"></a>

Met à jour la planification d'un crawler à l'aide d'une expression `cron`. 

**Demande**
+ `CrawlerName` – *Obligatoire :* Chaîne UTF-8, d’une longueur comprise entre 1 et 255 octets, correspondant au [Single-line string pattern](aws-glue-api-common.md#aws-glue-api-regex-oneLine).

  Nom de l'crawler dont la planification doit être mise à jour.
+ `Schedule` – Chaîne UTF-8.

  L'expression `cron` mise à jour utilisée pour spécifier la planification (voir [Planifications temporelles pour les tâches et les crawlers](https://docs.aws.amazon.com/glue/latest/dg/monitor-data-warehouse-schedule.html)). Par exemple, pour exécuter un élément tous les jours à 12h15 UTC, vous devez spécifier : `cron(15 12 * * ? *)`.

**Réponse**
+ *Paramètres d’absence de réponse.*

**Erreurs**
+ `EntityNotFoundException`
+ `InvalidInputException`
+ `VersionMismatchException`
+ `SchedulerTransitioningException`
+ `OperationTimeoutException`

## StartCrawlerSchedule action (Python : start\$1crawler\$1schedule)
<a name="aws-glue-api-crawler-scheduler-StartCrawlerSchedule"></a>

Modifie l'état de la planification pour l'crawler spécifié par `SCHEDULED`, sauf si l'crawler est déjà en cours d'exécution ou si l'état de la planification est déjà `SCHEDULED`.

**Demande**
+ `CrawlerName` – *Obligatoire :* Chaîne UTF-8, d’une longueur comprise entre 1 et 255 octets, correspondant au [Single-line string pattern](aws-glue-api-common.md#aws-glue-api-regex-oneLine).

  Nom de l'crawler à planifier.

**Réponse**
+ *Paramètres d’absence de réponse.*

**Erreurs**
+ `EntityNotFoundException`
+ `SchedulerRunningException`
+ `SchedulerTransitioningException`
+ `NoScheduleException`
+ `OperationTimeoutException`

## StopCrawlerSchedule action (Python : stop\$1crawler\$1schedule)
<a name="aws-glue-api-crawler-scheduler-StopCrawlerSchedule"></a>

Définit l'état de la planification de l'crawler spécifié sur `NOT_SCHEDULED`, mais n'arrête pas l'crawler s'il est déjà en cours d'exécution.

**Demande**
+ `CrawlerName` – *Obligatoire :* Chaîne UTF-8, d’une longueur comprise entre 1 et 255 octets, correspondant au [Single-line string pattern](aws-glue-api-common.md#aws-glue-api-regex-oneLine).

  Nom de l'crawler dont l'état de la planification doit être défini.

**Réponse**
+ *Paramètres d’absence de réponse.*

**Erreurs**
+ `EntityNotFoundException`
+ `SchedulerNotRunningException`
+ `SchedulerTransitioningException`
+ `OperationTimeoutException`