

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

# Profilazione e ottimizzazione delle prestazioni di calcolo
<a name="train-profile-computational-performance"></a>

Quando si addestrano modelli di deep learning all'avanguardia che crescono rapidamente di dimensioni, scalare il processo di addestramento di tali modelli su un cluster di GPU di grandi dimensioni e identificare i problemi di prestazioni di calcolo di miliardi e trilioni di operazioni e comunicazioni in ogni iterazione del processo di discesa del gradiente diventa una sfida.

SageMaker L'intelligenza artificiale fornisce strumenti di profilazione per visualizzare e diagnosticare problemi di calcolo così complessi derivanti dall'esecuzione di lavori di formazione su risorse di cloud computing. AWS Esistono due opzioni di profilazione offerte dall' SageMaker intelligenza artificiale: Amazon SageMaker Profiler e un monitoraggio dell'utilizzo delle risorse in Amazon Studio Classic. SageMaker Guarda le seguenti introduzioni delle due funzionalità per approfondimenti rapidi e scoprire quale usare in base alle tue esigenze.

**Amazon SageMaker Profiler**

Amazon SageMaker Profiler è una funzionalità di profilazione dell' SageMaker intelligenza artificiale con cui puoi approfondire le risorse di calcolo fornite durante l'addestramento dei modelli di deep learning e ottenere visibilità sui dettagli a livello operativo. SageMaker Profiler fornisce moduli Python per aggiungere annotazioni TensorFlow o addestrare gli script e PyTorch attivare Profiler. SageMaker Puoi accedere ai moduli tramite SageMaker Python SDK e AWS Deep Learning Containers. 

Con SageMaker Profiler, puoi tenere traccia di tutte le attività su CPU e GPU, come l'utilizzo di CPU e GPU, l'esecuzione del kernel su GPU, l'avvio del kernel su CPU, le operazioni di sincronizzazione, le operazioni di memoria tra CPU e GPU, le latenze tra i lanci del kernel e le esecuzioni corrispondenti e il trasferimento di dati tra CPU e GPU. 

SageMaker Profiler offre anche un'interfaccia utente (UI) che visualizza il *profilo*, un riepilogo statistico degli eventi profilati e la cronologia di un processo di formazione per tracciare e comprendere la relazione temporale degli eventi tra GPU e CPU.

Per ulteriori informazioni su Profiler, consulta. SageMaker [Amazon SageMaker Profiler](train-use-sagemaker-profiler.md)

**Monitoraggio delle risorse di AWS calcolo in Amazon SageMaker Studio Classic**

SageMaker L'intelligenza artificiale fornisce anche un'interfaccia utente in Studio Classic per monitorare l'utilizzo delle risorse ad alto livello, ma con maggiore granularità rispetto alle metriche di utilizzo predefinite raccolte dall'IA per. SageMaker CloudWatch

Per qualsiasi attività di formazione eseguita sull' SageMaker intelligenza artificiale utilizzando SageMaker Python SDK, l'intelligenza SageMaker artificiale inizia a profilare le metriche di utilizzo delle risorse di base, come l'utilizzo della CPU, l'utilizzo della GPU, l'utilizzo della memoria GPU, la rete e il tempo di attesa. I/O Raccoglie questi parametri di utilizzo delle risorse ogni 500 millisecondi. 

Rispetto ai CloudWatch parametri di Amazon, che raccolgono i parametri a intervalli di 1 secondo, la funzionalità di monitoraggio dell' SageMaker intelligenza artificiale fornisce una granularità più precisa dei parametri di utilizzo delle risorse fino a intervalli di 100 millisecondi (0,1 secondi), in modo da poter approfondire le metriche a livello di un'operazione o di una fase.

Per accedere alla dashboard per il monitoraggio delle metriche di utilizzo delle risorse di un lavoro di formazione, consulta l'[interfaccia utente SageMaker AI Debugger in SageMaker Studio Experiments](https://docs.aws.amazon.com/sagemaker/latest/dg/debugger-on-studio.html).



**Topics**
+ [Amazon SageMaker Profiler](train-use-sagemaker-profiler.md)
+ [Monitoraggio AWS utilizzo delle risorse di calcolo in Amazon Studio Classic SageMaker](debugger-profile-training-jobs.md)
+ [Note di rilascio per le funzionalità di profilazione di Amazon SageMaker AI](profiler-release-notes.md)