

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

# K-Means Hyperparameter
<a name="k-means-api-config"></a>

In der [https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_CreateTrainingJob.html](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_CreateTrainingJob.html)-Anforderung geben Sie den Trainingsalgorithmus an, den Sie verwenden möchten. Sie können außerdem algorithmusspezifische Hyperparameter als Zeichenfolge-zu-Zeichenfolge-Zuweisungen angeben. In der folgenden Tabelle sind die Hyperparameter für den K-Means-TrainingsalGORITHmus aufgeführt, der von Amazon SageMaker AI bereitgestellt wird. Weitere Informationen zur Funktionsweise von k-Means-Clustering finden Sie unter [Wie K-Means funktioniert Clustering](algo-kmeans-tech-notes.md).


| Name des Parameters | Description | 
| --- | --- | 
| feature\_dim | Die Anzahl der Merkmale der Eingabedaten.<br />**Erforderlich**<br />Gültige Werte: Positive Ganzzahl | 
| k | Die Anzahl der erforderlichen Cluster.<br />**Erforderlich**<br />Gültige Werte: Positive Ganzzahl | 
| epochs | Die Anzahl der mit den Trainingsdaten durchgeführten Durchläufe.<br />**Optional**<br />Gültige Werte: Positive Ganzzahl<br />Standardwert: 1 | 
| eval\_metrics | Eine JSON-Liste der Metriktypen, die zum Melden einer Punktzahl für das Modell verwendet werden. Zulässige Werte sind `msd` für den mittleren quadratischen Abweichung und `ssd` für die Summe der quadrierten Abstände. Wenn Testdaten angegeben werden, die Punktzahl für jede der angeforderten Metriken gemeldet.<br />**Optional**<br />Gültige Werte: entweder `[\"msd\"]`, `[\"ssd\"]` oder `[\"msd\",\"ssd\"]`.<br />Standardwert: `[\"msd\"]` | 
| extra\_center\_factor | Der Algorithmus erstellt K Zentren = `num_clusters` \* `extra_center_factor` während der Ausführung und reduziert die Anzahl der Zentren bei der Fertigstellung des Modells von K auf `k`.<br />**Optional**<br />Gültige Werte: entweder eine positive Ganzzahl oder `auto`.<br />Standardwert: `auto` | 
| half\_life\_time\_size | Wird verwendet, um die Gewichtung zu bestimmen, die einer Beobachtung beim Berechnen eines Clustermittelwerts zugeteilt wird. Die Gewichtung zerfällt exponentiell, sobald mehrere Punkte beobachtet werden. Bei der ersten Beobachtung eines Punkts wird ihm eine Gewichtung von 1 bei der Berechnung des Clustermittelwerts zugeteilt. Die Zerfallskonstante für die exponentielle Zerfallsfunktion wird so gewählt, dass nach der Beobachtung von `half_life_time_size` Punkten ihr Gewicht beträgt. 1/2 Wenn er auf 0 festgelegt ist, erfolgt kein Verfall.<br />**Optional**<br />Gültige Werte: Ganzzahl Non-negative <br />Standardwert: 0 | 
| init\_method | Die Methode, mit der der Algorithmus die anfänglichen Clusterzentren auswählt. Der k-Means-Standardansatz wählt sie nach dem Zufallsprinzip aus. Eine alternative k-Means\+\+-Methode wählt das erste Clusterzentrum nach dem Zufallsprinzip aus. Anschließend wird eine bessere Verteilung der Position des verbleibenden anfänglichen Cluster erzielt, indem die Auswahl von Zentren mit einer Wahrscheinlichkeitsverteilung gewichtet wird, die proportional zum Quadrat der Entfernung der verbleibenden Datenpunkte aus vorhandenen Zentren ist.<br />**Optional**<br />Gültige Werte: Entweder `random` oder `kmeans++`.<br />Standardwert: `random` | 
| local\_lloyd\_init\_method | Die Initialisierungsmethode für das Expectation Maximization (EM)-Verfahren nach Lloyd, die zum Erstellen des endgültigen Modells mit `k`-Zentren verwendet wird.<br />**Optional**<br />Gültige Werte: Entweder `random` oder `kmeans++`.<br />Standardwert: `kmeans++` | 
| local\_lloyd\_max\_iter | Die maximale Anzahl der Iterationen für das Expectation Maximization (EM)-Verfahren nach Lloyd, die zum Erstellen des endgültigen Modells mit `k`-Zentren verwendet wird.<br />**Optional**<br />Gültige Werte: Positive Ganzzahl<br />Standardwert: 300 | 
| local\_lloyd\_num\_trials | Gibt an, wie oft das Expectation Maximization (EM)-Verfahren nach Lloyd mit dem geringsten Verlust ausgeführt wird beim Erstellen des endgültigen Modells mit `k`-Zentren.<br />**Optional**<br />Gültige Werte: entweder eine positive Ganzzahl oder `auto`.<br />Standardwert: `auto` | 
| local\_lloyd\_tol | Die Toleranz für die Änderung in Verlust zum frühzeitigen Beenden des Expectation Maximization (EM)-Verfahrens nach Lloyd, das zum Erstellen des endgültigen Modells mit `k`-Zentren verwendet wird.<br />**Optional**<br />Gültige Werte: Gleitkommazahl. Bereich [0, 1].<br />Standardwert: 0.0001 | 
| mini\_batch\_size | Die Anzahl der Beobachtungen pro Mini-Stapel für den Dateniterator.<br />**Optional**<br />Gültige Werte: Positive Ganzzahl<br />Standardwert: 5000 | 