

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

# K-Means Algoritmo
<a name="k-means"></a>

K-means è un algoritmo di apprendimento non supervisionato. Cerca di trovare raggruppamenti discreti all'interno di dati, dove i membri di un gruppo sono il più possibile simili l'uno all'altro e il più possibile diversi dai membri di altri gruppi. Definisci gli attributi che desideri che l'algoritmo utilizzi per determinare la somiglianza. 

Amazon SageMaker AI utilizza una versione modificata dell'algoritmo di clustering k-means su scala web. Rispetto alla versione originale dell'algoritmo, la versione utilizzata da Amazon SageMaker AI è più accurata. Come l'algoritmo originale, si adatta alle grandi quantità di set di dati e fornisce miglioramenti al momento dell’addestramento. A tale scopo, la versione utilizzata da Amazon SageMaker AI trasmette in streaming mini-batch (piccoli sottoinsiemi casuali) dei dati di addestramento. [Per ulteriori informazioni sui mini-batch k-means, consulta k-means Clustering. Web-scale ](https://dl.acm.org/doi/10.1145/1772690.1772862)

L'algoritmo k-means si aspetta i dati tabulari, dove le righe rappresentano le osservazioni da raggruppare e le colonne rappresentano gli attributi delle osservazioni. Gli attributi *n* in ogni riga rappresentano un punto in spazio dimensionale-*n*. La distanza euclidea tra questi punti rappresenta la somiglianza delle osservazioni corrispondente. L'algoritmo raggruppa le osservazioni con valori di attributo simili (i punti corrispondenti a tali osservazioni sono raggruppati). Per ulteriori informazioni su come funziona k-means in Amazon SageMaker AI, consulta[Come funziona il K-Means clustering](algo-kmeans-tech-notes.md).

**Topics**
+ [Input/Output Interfaccia per l'algoritmo K-Means](#km-inputoutput)
+ [Raccomandazione dell'istanza EC2 per l'algoritmo K-Means](#km-instances)
+ [K-Means Notebook di esempio](#kmeans-sample-notebooks)
+ [Come funziona il K-Means clustering](algo-kmeans-tech-notes.md)
+ [K-Means Iperparametri](k-means-api-config.md)
+ [Ottimizza un modello K-Means](k-means-tuning.md)
+ [K-Means Formati di risposta](km-in-formats.md)

## Input/Output Interfaccia per l'algoritmo K-Means
<a name="km-inputoutput"></a>

L'algoritmo k-means si aspetta che i dati da fornire nel canale di *addestramento* (consigliato `S3DataDistributionType=ShardedByS3Key`), con un canale di *test* opzionale (consigliato `S3DataDistributionType=FullyReplicated`) su cui registrare i dati. I formati `recordIO-wrapped-protobuf` e `CSV` sono supportati per l’addestramento. Puoi utilizzare la modalità file o la modalità pipe per addestrare i modelli sui dati formattati come `recordIO-wrapped-protobuf` o `CSV`.

Per l'inferenza, sono supportati `text/csv`, `application/json` e `application/x-recordio-protobuf`. k-means restituisce un'etichetta `closest_cluster`e la `distance_to_cluster` per ogni osservazione.

Per ulteriori informazioni sui formati di file di input e output, consulta [K-Means Formati di risposta](km-in-formats.md) per l'inferenza e i [K-Means Notebook di esempio](#kmeans-sample-notebooks). L'algoritmo k-means non supporta più istanze di apprendimento, in cui il set di addestramento è costituito da etichette “bags”, ciascuna delle quali è una raccolta di istanze non etichettate.

## Raccomandazione dell'istanza EC2 per l'algoritmo K-Means
<a name="km-instances"></a>

Consigliamo di eseguire l’addestramento di k-means sulle istanze di CPU. Puoi eseguire l’addestramento sulle istanze GPU, ma devi limitare l’addestramento di GPU a singole istanze GPU (ad esempio, ml.g4dn.xlarge) perché viene utilizzata solo una GPU per ogni istanza. L'algoritmo k-means supporta istanze P2, P3, G4dn e G5 per l'addestramento e l'inferenza.

## K-Means Notebook di esempio
<a name="kmeans-sample-notebooks"></a>

Per un taccuino di esempio che utilizza l' K-means algoritmo di SageMaker intelligenza artificiale per segmentare la popolazione delle contee degli Stati Uniti in base ad attributi identificati utilizzando l'analisi dei componenti principali, consulta [Analizzare i dati del censimento degli Stati Uniti per la segmentazione della popolazione utilizzando Amazon](https://sagemaker-examples.readthedocs.io/en/latest/introduction_to_applying_machine_learning/US-census_population_segmentation_PCA_Kmeans/sagemaker-countycensusclustering.html) AI. SageMaker Per istruzioni su come creare e accedere alle istanze di notebook Jupyter da utilizzare per eseguire l'esempio in AI, consulta. SageMaker [Istanze SageMaker per notebook Amazon](nbi.md) Dopo aver creato un'istanza di notebook e averla aperta, seleziona la scheda **Esempi di SageMaker AI** per visualizzare un elenco di tutti gli esempi di IA. SageMaker Per aprire un notebook, fai clic sulla relativa scheda **Use (Utilizza)** e seleziona **Create copy (Crea copia)**.