

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

# Hyperparamètres XGBoost
<a name="xgboost_hyperparameters"></a>

Le tableau suivant contient le sous-ensemble d'hyperparamètres requis ou les plus couramment utilisés pour l'algorithme Amazon SageMaker AI XGBoost. Il s'agit des paramètres qui sont définis par les utilisateurs pour faciliter l'estimation des paramètres modèles issus des données. Les hyperparamètres requis qui doivent être définies sont les premiers répertoriés, dans l'ordre alphabétique. Les hyperparamètres facultatifs qui peuvent être définis sont répertoriés ensuite, également dans l'ordre alphabétique. L'algorithme SageMaker AI XGBoost est une implémentation du package open source DMLC XGBoost. Pour plus d’informations sur l’ensemble complet des hyperparamètres qui peuvent être configurés pour cette version de XGBoost, consultez [ Paramètres XGBoost](https://xgboost.readthedocs.io/en/release_1.2.0/).


| Nom du paramètre | Description | 
| --- | --- | 
| num\_class | Nombre de classes.<br />**Obligatoire** si `objective` a la valeur *multi:softmax* ou *multi:softprob*.<br />Valeurs valides : nombre entier. | 
| num\_round | Le nombre de séries pour exécuter l'entraînement.<br />**Obligatoire**<br />Valeurs valides : nombre entier. | 
| alpha | Condition de régularisation L1 sur les pondérations. L'augmentation de cette valeur rend les modèles plus prudents.<br />**Facultatif**<br />Valeurs valides : float.<br />Valeur par défaut : 0 | 
| base\_score | Score de prédiction initiale de toutes les instances, biais global.<br />**Facultatif**<br />Valeurs valides : float.<br />Valeur par défaut : 0.5 | 
| booster | Quel booster utiliser. Les valeurs `gbtree` et `dart` utilisent un modèle basé sur un arbre, tandis que `gblinear` utilise une fonction linéaire.<br />**Facultatif**<br />Valeurs valides : string. `"gbtree"`, `"gblinear"` ou `"dart"`.<br />Valeur par défaut : `"gbtree"` | 
| colsample\_bylevel | Ration de sous-échantillon des colonnes pour chaque fractionnement, dans chaque niveau.<br />**Facultatif**<br />Valeurs valides : float. Plage : [0,1].<br />Valeur par défaut : 1 | 
| colsample\_bynode | Rapport des colonnes de sous-échantillon de chaque nœud.<br />**Facultatif**<br />Valeurs valides : float. Plage : (0,1].<br />Valeur par défaut : 1 | 
| colsample\_bytree | Ratio de sous-échantillon des colonnes lors de la construction de chaque arbre.<br />**Facultatif**<br />Valeurs valides : float. Plage : [0,1].<br />Valeur par défaut : 1 | 
| csv\_weights | Lorsque cette option est activée, XGBoost différencie l'importance des instances pour l'entrée csv en prenant la deuxième colonne (la colonne après les étiquettes) dans les données d'entraînement, comme les pondérations d'instance.<br />**Facultatif**<br />Valeurs valides : 0 ou 1<br />Valeur par défaut : 0 | 
| deterministic\_histogram | Lorsque cet indicateur est activé, XGBoost crée l'histogramme sur le GPU de manière déterministe. Utilisé uniquement si `tree_method` a la valeur `gpu_hist`.<br />Pour obtenir la liste complète des entrées valides, reportez-vous à [XGBoost Parameters](https://github.com/dmlc/xgboost/blob/master/doc/parameter.rst).<br />**Facultatif**<br />Valeurs valides : string. Plage : `"true"` ou `"false"`.<br />Valeur par défaut : `"true"` | 
| early\_stopping\_rounds | Le modèle entraîne jusqu'à ce que le score de validation arrête l'amélioration. L'erreur de validation doit être réduite au moins à chaque fois `early_stopping_rounds` pour poursuivre l'entraînement. SageMaker L'hébergement AI utilise le meilleur modèle d'inférence.<br />**Facultatif**<br />Valeurs valides : nombre entier.<br />Valeur par défaut: - | 
| eta | Réduction de la taille de l'étape utilisée dans les mises à jour pour empêcher le surajustement. Après chaque étape du renforcement, vous pouvez obtenir directement les poids des nouvelles caractéristiques. Le paramètre `eta` diminue réellement les pondérations des caractéristiques pour rendre le processus de renforcement plus prudent.<br />**Facultatif**<br />Valeurs valides : float. Plage : [0,1].<br />Valeur par défaut : 0.3 | 
| eval\_metric | Métriques d'évaluation pour les données de validation. Une métrique est attribué par défaut en fonction de l'objectif :[See the AWS documentation website for more details](http://docs.aws.amazon.com/fr_fr/sagemaker/latest/dg/xgboost_hyperparameters.html)<br />Pour obtenir la liste des entrées valides, consultez [XGBoost Learning Task Parameters](https://github.com/dmlc/xgboost/blob/master/doc/parameter.rst#learning-task-parameters).<br />**Facultatif**<br />Valeurs valides : string.<br />Valeur par défaut : valeur par défaut selon l'objectif. | 
| gamma | Diminution de perte minimale requise pour effectuer une partition supplémentaire sur un nœud terminal de l'arbre. Plus la valeur est grande, plus l'algorithme est prudent.<br />**Facultatif**<br />Valeurs valides : float. Plage : [0,∞).<br />Valeur par défaut : 0 | 
| grow\_policy | Contrôle la façon dont les nouveaux nœuds sont ajoutés à l'arbre. Actuellement pris en charge uniquement si `tree_method` a la valeur `hist`.<br />**Facultatif**<br />Valeurs valides : string. `"depthwise"` ou `"lossguide"`.<br />Valeur par défaut : `"depthwise"` | 
| interaction\_constraints | Spécifiez les groupes de variables qui sont autorisés à interagir.<br />**Facultatif**<br />Valeurs valides : liste imbriquée d'entiers. Chaque entier représente une fonction, et chaque liste imbriquée contient des fonctions qui sont autorisées à interagir, par exemple, [[1,2], [3,4,5]].<br />Valeur par défaut : None (Aucune) | 
| lambda | Condition de régularisation L2 sur les pondérations. L'augmentation de cette valeur rend les modèles plus prudents.<br />**Facultatif**<br />Valeurs valides : float.<br />Valeur par défaut : 1 | 
| lambda\_bias | Condition de régularisation L2 sur un biais.<br />**Facultatif**<br />Valeurs valides : float. Plage : [0.0, 1.0].<br />Valeur par défaut : 0 | 
| max\_bin | Nombre maximal de compartiments distincts pour compartimenter les fonctions continues. Utilisé uniquement si `tree_method` a la valeur `hist`. <br />**Facultatif**<br />Valeurs valides : nombre entier.<br />Valeur par défaut : 256 | 
| max\_delta\_step | Étape delta maximale autorisée pour chaque estimation de pondération d'arbre. Quand un nombre entier positif est utilisé, il permet que la mise à jour soit encore plus prudente. L'option privilégiée consiste à l'utiliser dans une régression logistique. Définissez-la entre 1-10 pour aider à contrôler la mise à jour. <br />**Facultatif**<br />Valeurs valides : nombre entier. Plage : [0,∞).<br />Valeur par défaut : 0 | 
| max\_depth | Profondeur maximale d'un arbre. L'augmentation de cette valeur rend le modèle plus complexe et susceptible d'être surajusté. 0 indique l'absence de limite. Une limite est requise quand `grow_policy`=`depth-wise`.<br />**Facultatif**<br />Valeurs valides : nombre entier. Plage : [0,∞)<br />Valeur par défaut : 6 | 
| max\_leaves | Nombre maximal de nœuds à ajouter. Pertinent uniquement si `grow_policy` a la valeur `lossguide`.<br />**Facultatif**<br />Valeurs valides : nombre entier.<br />Valeur par défaut : 0 | 
| min\_child\_weight | Somme minimale de la pondération (Hessian) d'instance nécessaire dans un enfant. Si l'étape de partition de l'arbre se traduit par un nœud terminal avec la somme de pondération d'instance inférieure à `min_child_weight`, le processus de développement abandonne tout partitionnement supplémentaire. Dans les modèles de régression linéaire, cela correspond simplement à un nombre minimal d'instances requis dans chaque nœud. Plus la valeur est grande, plus l'algorithme est prudent.<br />**Facultatif**<br />Valeurs valides : float. Plage : [0,∞).<br />Valeur par défaut : 1 | 
| monotone\_constraints | Spécifie les limites de monotonicité sur n'importe quelle fonction.<br />**Facultatif**<br />Valeurs valides : Tuple d'entiers. Entiers valides : -1 (limite décroissante), 0 (aucune limite), 1 (limite croissante). <br />E.g., (0, 1) : Aucune contrainte sur le premier prédicteur, et une contrainte croissante sur le second. (-1, 1) : limite décroissante sur le premier prédicteur, et limite croissante sur le second.<br />Valeur par défaut : (0, 0) | 
| normalize\_type | Type d'algorithme de normalisation.<br />**Facultatif**<br />Valeurs valides : *tree* ou *forest*.<br />Valeur par défaut : *tree* | 
| nthread | Nombre de threads parallèles utilisés pour exécuter *xgboost*.<br />**Facultatif**<br />Valeurs valides : nombre entier.<br />Valeur par défaut : nombre maximal de threads. | 
| objective | Spécifie la tâche d'apprentissage et l'objectif d'apprentissage correspondant. Exemples : `reg:logistic`, `multi:softmax`, `reg:squarederror`. Pour obtenir la liste complète des entrées valides, reportez-vous à [XGBoost Learning Task Parameters](https://github.com/dmlc/xgboost/blob/master/doc/parameter.rst#learning-task-parameters).<br />**Facultatif**<br />Valeurs valides : string<br />Valeur par défaut : `"reg:squarederror"` | 
| one\_drop | Lorsque cet indicateur est activé, au moins un arbre est toujours supprimé pendant l'opération de dropout.<br />**Facultatif**<br />Valeurs valides : 0 ou 1<br />Valeur par défaut : 0 | 
| process\_type | Type de processus de renforcement à exécuter.<br />**Facultatif**<br />Valeurs valides : string. `"default"` ou `"update"`.<br />Valeur par défaut : `"default"` | 
| rate\_drop | Taux de dropout qui spécifie la fraction des arbres précédents à supprimer pendant le dropout.<br />**Facultatif**<br />Valeurs valides : float. Plage : [0.0, 1.0].<br />Valeur par défaut : 0.0 | 
| refresh\_leaf | Il s'agit d'un paramètre du plug-in de mise à jour « refresh ». Lorsque ce paramètre est défini sur`true` (1), les feuilles de l'arbre et les statistiques des nœuds de l'arbre sont mises à jour. Lorsque la valeur est définie sur `false`(0), seules les statistiques des nœuds de l'arbre sont mises à jour.<br />**Facultatif**<br />Valeurs valides : 0/1<br />Valeur par défaut : 1 | 
| sample\_type | Type d'algorithme d'échantillonnage.<br />**Facultatif**<br />Valeurs valides : `uniform` ou `weighted`.<br />Valeur par défaut : `uniform` | 
| scale\_pos\_weight | Contrôle le solde de pondérations positives et négatives. Utile pour les classes non équilibrées. Valeur typique à prendre en compte : `sum(negative cases)` / `sum(positive cases)`.<br />**Facultatif**<br />Valeurs valides : float<br />Valeur par défaut : 1 | 
| seed | Nombre d'amorçage aléatoire.<br />**Facultatif**<br />Valeurs valides : nombre entier<br />Valeur par défaut : 0 | 
| single\_precision\_histogram | Lorsque cet indicateur est activé, XGBoost utilise une précision unique pour créer des histogrammes au lieu de la double précision. Utilisé uniquement si `tree_method` a la valeur `hist` ou `gpu_hist`.<br />Pour obtenir la liste complète des entrées valides, reportez-vous à [XGBoost Parameters](https://github.com/dmlc/xgboost/blob/master/doc/parameter.rst).<br />**Facultatif**<br />Valeurs valides : string. Plage : `"true"` ou `"false"`<br />Valeur par défaut : `"false"` | 
| sketch\_eps | Utilisé uniquement pour l'algorithme gourmand (glouton) approximatif. Cela se traduit en O(1/ `sketch_eps`) nombre de compartiments. Par comparaison avec la sélection directe du nombre de compartiments, celui-ci s'accompagne d'une garantie théorique avec précision d'esquisse.<br />**Facultatif**<br />Valeurs valides : Float, Plage : [0, 1].<br />Valeur par défaut : 0.03 | 
| skip\_drop | Probabilité d’ignorer la procédure de dropout pendant une itération de renforcement.<br />**Facultatif**<br />Valeurs valides : float. Plage : [0.0, 1.0].<br />Valeur par défaut : 0.0 | 
| subsample | Ratio de sous-échantillon de l'instance d'entraînement. La valeur 0,5 signifie que XGBoost recueille de façon aléatoire la moitié des instances de données pour développer les arbres. Cela empêche le surajustement.<br />**Facultatif**<br />Valeurs valides : float. Plage : [0,1].<br />Valeur par défaut : 1 | 
| tree\_method | Algorithme de construction des arbres utilisé dans XGBoost.<br />**Facultatif**<br />Valeurs valides : `auto`, `exact`, `approx`, `hist` ou `gpu_hist`.<br />Valeur par défaut : `auto` | 
| tweedie\_variance\_power | Paramètre qui contrôle la variance de la distribution Tweedie.<br />**Facultatif**<br />Valeurs valides : float. Plage : (1, 2).<br />Valeur par défaut : 1.5 | 
| updater | Chaîne séparée par des virgules qui définit la séquence des programmes de mise à jour des arbres à exécuter. Cela fournit une solution modulaire pour créer et modifier les arbres.<br />Pour obtenir la liste complète des entrées valides, reportez-vous à [XGBoost Parameters](https://github.com/dmlc/xgboost/blob/master/doc/parameter.rst).<br />**Facultatif**<br />Valeurs valides : chaîne séparée par des virgules.<br />Valeur par défaut : `grow_colmaker`, prune. | 
| use\_dask\_gpu\_training | Définissez `use_dask_gpu_training` sur `"true"` si vous souhaitez exécuter l'entraînement GPU distribué avec Dask. L'entraînement GPU avec Dask est pris en charge uniquement pour les versions 1.5-1 et ultérieures. Ne définissez pas cette valeur sur `"true"` pour les versions antérieures à 1.5-1. Pour de plus amples informations, veuillez consulter [Entraînement GPU distribué](xgboost.md#Instance-XGBoost-distributed-training-gpu).<br />**Facultatif**<br />Valeurs valides : string. Plage : `"true"` ou `"false"`<br />Valeur par défaut : `"false"` | 
| verbosity | Niveau de détail de l'impression des messages.<br />Valeurs valides : 0 (silencieux), 1 (avertissement), 2 (info), 3 (débogage).<br />**Facultatif**<br />Valeur par défaut : 1 | 