

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

# Endpoints
<a name="realtime-endpoints-manage"></a>

Dopo aver implementato il modello in un endpoint, potresti voler visualizzare e gestire l’endpoint. Con SageMaker AI puoi visualizzare lo stato e i dettagli del tuo endpoint, controllare metriche e log per monitorare le prestazioni dell’endpoint, aggiornare i modelli implementati al suo interno e altro ancora.

Le sezioni seguenti mostrano come gestire gli endpoint all’interno di Amazon SageMaker Studio o della Console di gestione AWS.

La pagina seguente descrive come visualizzare e apportare modifiche in modo interattivo agli endpoint utilizzando la console di Amazon SageMaker AI o SageMaker Studio.

**Topics**
+ [Visualizzare i dettagli degli endpoint in SageMaker Studio](manage-endpoints-studio.md)
+ [Visualizzare i dettagli dell’endpoint nella console di SageMaker AI](manage-endpoints-console.md)

# Visualizzare i dettagli degli endpoint in SageMaker Studio
<a name="manage-endpoints-studio"></a>

In Amazon SageMaker Studio è possibile visualizzare e gestire gli endpoint di SageMaker AI Hosting. Per ulteriori informazioni su Studio, consulta [Amazon SageMaker Studio](https://docs.aws.amazon.com/sagemaker/latest/dg/studio.html).

Per trovare l’elenco degli endpoint in SageMaker Studio, segui questa procedura:

1. Apri l’applicazione Studio.

1. Nel riquadro di navigazione sinistro scegli **Implementazioni**.

1. Dal menu a discesa seleziona **Endpoint**.

Viene visualizzata la pagina **Endpoint**, che elenca tutti gli endpoint di SageMaker AI Hosting. Da questa pagina è possibile visualizzare gli endpoint e il relativo **stato**. È anche possibile creare un nuovo endpoint, modificarne uno esistente o eliminarlo.

Per visualizzare i dettagli di un endpoint specifico, scegline uno dall’elenco. Nella pagina dei dettagli dell’endpoint viene visualizzata una panoramica simile al seguente screenshot.

![\[Screenshot della pagina principale di un endpoint che mostra un riepilogo dei dettagli in Studio.\]](http://docs.aws.amazon.com/it_it/sagemaker/latest/dg/images/inference/studio-endpoint-details-page.png)


La pagina dei dettagli di ogni endpoint contiene le seguenti schede di informazioni:

# Visualizzare Varianti (o Modelli)
<a name="manage-endpoints-studio-variants"></a>

La scheda **Varianti** (chiamata anche scheda **Modelli** se l’endpoint ha più modelli implementati) mostra l’elenco delle [varianti del modello](https://docs.aws.amazon.com/sagemaker/latest/dg/model-ab-testing.html) o i modelli attualmente implementati nell’endpoint. Lo screenshot seguente mostra l’aspetto della panoramica e della sezione **Modelli** per un endpoint con più modelli implementati.

![\[Screenshot della pagina principale di un endpoint con più modelli implementati.\]](http://docs.aws.amazon.com/it_it/sagemaker/latest/dg/images/inference/studio-goldfinch-multi-model-endpoint.png)


È possibile aggiungere o modificare le impostazioni per ogni variante o modello, nonché selezionare una variante e abilitare una policy di dimensionamento automatico predefinita, modificabile in un secondo momento nella scheda **Dimensionamento automatico**.

# Visualizzare le impostazioni
<a name="manage-endpoints-studio-settings"></a>

Nella scheda **Impostazioni** è possibile visualizzare il ruolo IAM AWS associato all’endpoint, la chiave AWS KMS utilizzata per la crittografia (se applicabile), il nome del VPC e le impostazioni di isolamento della rete.

# Test di inferenza
<a name="manage-endpoints-studio-test"></a>

Nella scheda **Test di inferenza** è possibile inviare una richiesta di test di inferenza a un modello implementato. È utile per verificare che l’endpoint risponda alle richieste come previsto.

Per testare l’inferenza, segui questa procedura:

1. Nella scheda **Test di inferenza** del modello scegli una delle seguenti opzioni:

   1. Seleziona **Inserisci il corpo della richiesta** se desideri testare l’endpoint e ricevere una risposta tramite l’interfaccia di Studio.

   1. Seleziona **Copia codice di esempio (Python)** se desideri copiare un esempio AWS SDK per Python (Boto3) da utilizzare per invocare l’endpoint da un ambiente locale e ricevere una risposta a livello di programmazione.

1. Per **Modello**, seleziona il modello che desideri testare sull’endpoint.

1. Se hai scelto il metodo di test dell’interfaccia di Studio, puoi anche scegliere il **tipo di contenuto** desiderato per la risposta dal menu a discesa.

Dopo aver configurato la richiesta, puoi scegliere **Invia richiesta** (per ricevere una risposta tramite l’interfaccia di Studio) o **Copia** per copiare l’esempio Python.

Se ricevi una risposta tramite l’interfaccia di Studio, è simile allo screenshot seguente.

![\[Screenshot di una richiesta di test di inferenza riuscita su un endpoint in Studio.\]](http://docs.aws.amazon.com/it_it/sagemaker/latest/dg/images/inference/endpoint-test-inference.png)


# Dimensionamento automatico
<a name="manage-endpoints-studio-autoscaling"></a>

Nella scheda **Dimensionamento automatico** è possibile visualizzare tutte le policy di dimensionamento automatico configurate per i modelli ospitati sull’endpoint. Lo screenshot seguente mostra la scheda **Dimensionamento automatico**.

![\[Screenshot della scheda Dimensionamento automatico che mostra una policy attiva.\]](http://docs.aws.amazon.com/it_it/sagemaker/latest/dg/images/inference/studio-endpoint-autoscaling.png)


È possibile scegliere **Modifica dimensionamento automatico** per modificare qualsiasi policy e attivare o disattivare la policy di dimensionamento automatico predefinita.

Per ulteriori informazioni sul dimensionamento automatico per gli endpoint in tempo reale, consulta [Dimensionamento automatico dei modelli di Amazon SageMaker AI](https://docs.aws.amazon.com/sagemaker/latest/dg/endpoint-auto-scaling.html). Se non sai come configurare una policy di dimensionamento automatico per il tuo endpoint, puoi utilizzare un [processo di suggerimenti per il dimensionamento automatico di Inference Recommender](https://docs.aws.amazon.com/sagemaker/latest/dg/inference-recommender-autoscaling.html) per ottenere suggerimenti relativi a una policy di dimensionamento automatico.

# Visualizzare i dettagli dell’endpoint nella console di SageMaker AI
<a name="manage-endpoints-console"></a>

Per visualizzare gli endpoint nella console di SageMaker AI, segui questa procedura:

1. Vai alla console di SageMaker AI all’indirizzo [https://console.aws.amazon.com/sagemaker/](https://console.aws.amazon.com/sagemaker/).

1. Nel riquadro di navigazione a sinistra, scegli **Inferenza**.

1. Dal menu a discesa, scegli **Endpoint**.

1. Nella pagina **Endpoint**, scegli il tuo endpoint.

Dovrebbe aprirsi la pagina dei dettagli dell'endpoint, che mostra un riepilogo dell'endpoint e delle metriche raccolte per l'endpoint.

Le sezioni seguenti descrivono le schede nella pagina dei dettagli dell’endpoint.

# Monitoraggio degli endpoint
<a name="manage-endpoints-console-monitoring"></a>

Dopo aver creato un endpoint di SageMaker AI Hosting, è possibile monitorare l’endpoint utilizzando Amazon CloudWatch, che raccoglie i dati non elaborati e li elabora trasformandoli in metriche leggibili quasi in tempo reale. Utilizzando questi parametri, puoi accedere alle informazioni cronologiche e avere una migliore percezione delle performance del tuo endpoint. Per ulteriori informazioni, consultare la *[Guida per l'utente di Amazon CloudWatch](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/)*.

Dalla scheda **Monitoraggio** nella pagina dei dettagli dell'endpoint, puoi visualizzare i dati dei parametri di CloudWatch raccolti dal tuo endpoint.

La scheda **Monitoraggio** include le seguenti sezioni:
+ **Parametri operativi**: visualizza i parametri che tengono traccia dell'utilizzo delle risorse dell'endpoint, come l'utilizzo della CPU e l'utilizzo della memoria.
+ **Parametri di chiamata**: visualizza i parametri che tengono traccia del numero, dello stato e dello stato delle richieste `InvokeEndpoint` che arrivano all'endpoint, come gli errori del modello di invocazione e la latenza del modello.
+ **Parametri sanitari**: visualizza i parametri che tengono traccia dello stato generale dell'endpoint, come gli errori di chiamata e gli errori di notifica.

Per descrizioni dettagliate di ogni metrica, consulta [Monitor SageMaker AI with CloudWatch](https://docs.aws.amazon.com/sagemaker/latest/dg/monitoring-cloudwatch.html).

La schermata seguente mostra la sezione **Parametri operativi** per un endpoint serverless.

![\[Schermata dei grafici dei parametri nella sezione Parametri operativi della pagina dei dettagli dell'endpoint.\]](http://docs.aws.amazon.com/it_it/sagemaker/latest/dg/images/hosting-operational-metrics.png)




Puoi modificare il **periodo** e la **statistica** che desideri monitorare per i parametri in una determinata sezione, nonché il periodo di tempo per il quale desideri visualizzare i dati dei parametri. Puoi anche aggiungere e rimuovere i widget dei parametri dalla vista per ogni sezione scegliendo **Aggiungi widget**. Nella finestra di dialogo **Aggiungi widget**, puoi selezionare e deselezionare i parametri che desideri visualizzare.

I parametri disponibili possono dipendere dal tipo di endpoint. Ad esempio, gli endpoint serverless hanno alcuni parametri che non sono disponibili per gli endpoint in tempo reale. Per informazioni più specifiche sui parametri per tipo di endpoint, consulta le pagine seguenti:
+ [Monitora un endpoint serverless](https://docs.aws.amazon.com/sagemaker/latest/dg/serverless-endpoints-monitoring.html)
+ [Monitora un endpoint asincrono](https://docs.aws.amazon.com/sagemaker/latest/dg/async-inference-monitor.html)
+ [Parametri CW per le distribuzioni di endpoint a più modelli](https://docs.aws.amazon.com/sagemaker/latest/dg/multi-model-endpoint-cloudwatch-metrics.html)
+ [Log e parametri della pipeline di inferenza](https://docs.aws.amazon.com/sagemaker/latest/dg/inference-pipeline-logs-metrics.html)

# Impostazioni
<a name="manage-endpoints-console-settings"></a>

Puoi scegliere la scheda **Impostazioni** per visualizzare informazioni aggiuntive sull'endpoint, come le impostazioni di acquisizione dei dati, la configurazione dell'endpoint e i tag.

# Creare e visualizzare allarmi
<a name="manage-endpoints-console-alarms"></a>

Dalla scheda **Allarmi** nella pagina dei dettagli dell’endpoint, è possibile visualizzare e creare semplici allarmi di metriche di soglia statici, in cui è possibile specificare un valore di soglia per una metrica. Se il parametro supera il valore di soglia, l'allarme entra nello stato `ALARM`. Per ulteriori informazioni sugli allarmi CloudWatch, consulta [Using Amazon CloudWatch alarms](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/AlarmThatSendsEmail.html).

Nella sezione di **Riepilogo dell'endpoint**, puoi visualizzare il campo **Allarmi**, che indica quanti allarmi sono attualmente attivi sul tuo endpoint.

Per visualizzare quali allarmi sono presenti nello stato `ALARM`, scegli la scheda **Allarmi**. La scheda **Allarmi** mostra un elenco completo degli allarmi degli endpoint, insieme a dettagli sul loro stato e sulle loro condizioni. La schermata seguente mostra un elenco degli allarmi di questa sezione che sono stati configurati per un endpoint.

![\[Schermata della scheda degli allarmi nella pagina dei dettagli degli endpoint che mostra un elenco di allarmi CloudWatch.\]](http://docs.aws.amazon.com/it_it/sagemaker/latest/dg/images/hosting-alarms-tab.png)


Lo stato di un allarme può essere `In alarm`, `OK` o `Insufficient data` se non vengono raccolti abbastanza dati sui parametri.

Per creare un nuovo allarme per l'endpoint, eseguire le seguenti operazioni:

1. Nella scheda **Allarmi**, scegliere **Crea allarme**.

1. Si apre la pagina **Crea allarme**. In **Nome allarme**, specificare un nome per l'allarme.

1. (Facoltativo) Immetti un nome e una descrizione per l'allarme.

1. Per **Parametro**, scegli il parametro CloudWatch che desideri visualizzare dall'allarme.

1. Per **Nome della variante**, scegli la variante del modello di endpoint che desideri monitorare.

1. Per **Statistica**, scegli una delle statistiche disponibili per il parametro selezionato.

1. Per **Periodo**, scegli il periodo di tempo da utilizzare per il calcolo di ogni valore statistico. Ad esempio, se scegli la statistica Media e un periodo di 5 minuti, ogni punto dati monitorato dall'allarme è la media dei punti dati del parametro a intervalli di 5 minuti.

1. Per **Periodi di valutazione**, inserisci il numero di punti dati che desideri che l'allarme consideri quando valuta se inserire o meno lo stato di allarme.

1. Per **Condizione**, scegli il condizionale che desideri utilizzare per la soglia di allarme.

1. Per **Valore di soglia**, inserisci il valore desiderato per la soglia.

1. (Facoltativo) Per **Notifica**, puoi scegliere **Aggiungi notifica** per creare o specificare un argomento Amazon SNS che riceva una notifica quando lo stato dell'allarme cambia.

1. Scegli **Crea allarme**.

Dopo aver creato l'allarme, puoi tornare alla scheda **Allarmi** per visualizzarne lo stato in qualsiasi momento. Da questa sezione, puoi anche selezionare l'allarme e **modificarlo** o **eliminarlo**.