View a markdown version of this page

Implementazione del modello su larga scala - Amazon SageMaker AI

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Implementazione del modello su larga scala

Configura l'auto-scaling CloudWatch e il monitoraggio per il SageMaker tuo endpoint AI per renderlo pronto per la produzione.

Perché il monitoraggio della produzione è importante per la classificazione del testo

I carichi di lavoro di classificazione del testo richiedono il monitoraggio perché:

  • Sono soggetti a modelli di traffico variabili con picchi di elaborazione.

  • Richiedono tempi di risposta inferiori al secondo.

  • Hanno bisogno di ottimizzare i costi attraverso il dimensionamento automatico.

Prerequisiti

Prima di iniziare, assicurati di avere:

  • Il tuo endpoint di SageMaker intelligenza artificiale implementato nella sezione precedente.

  • Il nome dell’endpoint (ad esempio, jumpstart-dft-hf-tc).

  • Il tuo Regione AWS (ad esempio, us-east-2).

Per la creazione o la risoluzione dei problemi degli endpoint, consulta Inferenza. Real-time

Configurazione del monitoraggio in produzione

Configura CloudWatch il monitoraggio per monitorare le prestazioni del modello in produzione.

  1. Nel tuo JupyterLab spazio, apri il sagemaker_production_monitoring.ipynb taccuino dal pacchetto di valutazione che hai caricato in precedenza.

  2. Aggiorna il nome e la Regione dell’endpoint nella sezione di configurazione.

  3. Per la configurazione, segui le istruzioni del notebook:

    • Auto-scaling (1-10 istanze in base al traffico).

    • CloudWatch allarmi per le soglie di latenza e invocazione.

    • Dashboard di metriche per il monitoraggio visivo.

Verifica della configurazione

Dopo aver completato le fasi del notebook, verifica di avere:

  • Stato dell’endpoint: InService.

  • Auto-scaling: 1-10 istanze configurate.

  • CloudWatch Allarmi: monitoraggio di 2 allarmi.

  • Metriche: oltre 15 metriche registrate.

Nota

All’inizio, gli allarmi possono visualizzare INSUFFICIENT_DATA. È un comportamento normale e il campo diventerà OK con l’utilizzo.

Monitoraggio dell’endpoint

Accedi al monitoraggio visivo tramite la console di AWS gestione:

Per ulteriori informazioni, consulta Monitor SageMaker AI.

Gestione dei costi e pulizia delle risorse

La configurazione di monitoraggio fornisce preziose informazioni sulla produzione, ma comporta anche AWS costi continui attraverso CloudWatch metriche, allarmi e politiche di auto-scaling. Comprendere come gestire questi costi è essenziale per operazioni economicamente convenienti. Elimina le risorse quando non sono più necessarie.

avvertimento

L’endpoint continua a comportare costi anche quando non elabora le richieste. Per arrestare tutti gli addebiti, è necessario eliminare l’endpoint. Per istruzioni, consulta Eliminazione di endpoint e risorse.

Per configurazioni di monitoraggio avanzate, consulta Metrics for AI. CloudWatch SageMaker