

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

# Hyperparamètres pour k-moyennes (k-means)
<a name="k-means-api-config"></a>

Dans la demande [https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_CreateTrainingJob.html](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_CreateTrainingJob.html), vous spécifiez l'algorithme de formation que vous voulez utiliser. Vous pouvez également spécifier des hyperparamètres spécifiques à l'algorithme sous forme de cartes. string-to-string Le tableau suivant répertorie les hyperparamètres de l'algorithme d'entraînement k-means fourni par Amazon SageMaker AI. Pour plus d'informations sur le fonctionnement du clustering à l'aide de l'algorithme des k-moyennes (k-means), consultez [Fonctionnement du clustering des données à l'aide de l'algorithme de k-moyennes (k-means)](algo-kmeans-tech-notes.md).


| Nom du paramètre | Description | 
| --- | --- | 
| feature\$1dim | Nombre de caractéristiques des données d'entrée. **Obligatoire** Valeurs valides : nombre entier positif  | 
| k |  Nombre de clusters requis. **Obligatoire** Valeurs valides : nombre entier positif  | 
| epochs | Nombre de passages effectués sur les données d'entraînement. **Facultatif** Valeurs valides : nombre entier positif Valeur par défaut : 1  | 
| eval\$1metrics | Liste JSON des types de métriques utilisés pour présenter un score pour le modèle. Les valeurs autorisées sont `msd` pour la distance quadratique moyenne (MSD, Means Square Distance) et `ssd` pour la somme des carrés des distances (SSD, Sum of Square Distance). Si les données de test sont fournies, le score est calculé pour chacune des métriques demandées. **Facultatif** Valeurs valides : `[\"msd\"]`, `[\"ssd\"]` ou `[\"msd\",\"ssd\"]`. Valeur par défaut : `[\"msd\"]`  | 
| extra\$1center\$1factor | L'algorithme crée K centres = `num_clusters` \$1 `extra_center_factor` lorsqu'il s'exécute et réduit le nombre de centres de K à `k` lors de la finalisation du modèle. **Facultatif** Valeurs valides : nombre entier positif ou `auto`. Valeur par défaut : `auto`  | 
| half\$1life\$1time\$1size | Permet de déterminer le poids accordé à une observation lors du calcul d'une moyenne de cluster. Ce poids décroit de façon exponentielle au fur et à mesure que de plus en plus de points sont observés. Lorsqu'un point est observé pour la première fois, il se voit attribuer un poids 1 lors du calcul de la moyenne du cluster. La constante decay de la fonction exponentielle decay est choisie afin que son poids soit 1/2 après l'observation des points `half_life_time_size`. S'il est défini sur 0, il n'y a pas de diminution. **Facultatif** Valeurs valides : entier non négatif Valeur par défaut : 0  | 
| init\$1method | Méthode par laquelle l'algorithme choisit les centres de cluster initiaux. L'approche standard des k-moyennes les choisit de façon aléatoire. Une autre méthode, k-moyennes\$1\$1 (k-means\$1\$1), sélectionne le premier centre de cluster de façon aléatoire. Ensuite, elle répartit la position des clusters initiaux restants en pondérant la sélection des centres avec une distribution de probabilité proportionnelle au carré de la distance des points de données restants des centres existants. **Facultatif** Valeurs valides : `random` ou `kmeans++`. Valeur par défaut : `random`  | 
| local\$1lloyd\$1init\$1method | Méthode d'initialisation de la procédure espérance-maximisation (EM) de Lloyd utilisée pour créer le modèle final contenant `k` centres. **Facultatif** Valeurs valides : `random` ou `kmeans++`. Valeur par défaut : `kmeans++`  | 
| local\$1lloyd\$1max\$1iter | Nombre maximal d'itérations de la procédure espérance-maximisation (EM) de Lloyd utilisée pour créer le modèle final contenant `k` centres. **Facultatif** Valeurs valides : nombre entier positif Valeur par défaut : 300  | 
| local\$1lloyd\$1num\$1trials | Nombre de fois où la procédure espérance-maximisation (EM) avec la moindre perte est exécutée lors de la création du modèle final contenant `k` centres. **Facultatif** Valeurs valides : nombre entier positif ou `auto`. Valeur par défaut : `auto`  | 
| local\$1lloyd\$1tol | Tolérance de modification dans la fonction perte pour un arrêt anticipé de la procédure espérance-maximisation (EM) de Lloyd utilisée lors de la création du modèle final contenant `k` centres. **Facultatif** Valeurs valides : float. Plage [0, 1]. Valeur par défaut : 0.0001  | 
| mini\$1batch\$1size | Nombre d'observations par mini-lot pour l'itérateur de données. **Facultatif** Valeurs valides : nombre entier positif Valeur par défaut : 5000  | 