

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

# Endpoints
<a name="realtime-endpoints-manage"></a>

Depois de implantar o modelo em um endpoint, talvez você queira visualizar e gerenciar o endpoint. Com o SageMaker AI, você pode visualizar o status e os detalhes do endpoint, verificar métricas e logs para monitorar o desempenho do endpoint, atualizar os modelos implantados no endpoint e muito mais.

As seções a seguir mostram como você pode gerenciar endpoints no Amazon SageMaker Studio ou no Console de gerenciamento da AWS.

A página a seguir descreve como visualizar e fazer alterações interativamente nos endpoints usando o console do Amazon SageMaker AI ou o SageMaker Studio.

**Topics**
+ [Visualizar detalhes do endpoint no SageMaker Studio](manage-endpoints-studio.md)
+ [Visualizar detalhes do endpoint no console do SageMaker AI](manage-endpoints-console.md)

# Visualizar detalhes do endpoint no SageMaker Studio
<a name="manage-endpoints-studio"></a>

No Amazon SageMaker Studio, você pode visualizar e gerenciar os endpoints de hospedagem do SageMaker AI. Para saber mais sobre o Studio, consulte [Amazon SageMaker Studio](https://docs.aws.amazon.com/sagemaker/latest/dg/studio.html).

Para localizar a lista de endpoints no SageMaker, faça o seguinte:

1. Abra a aplicação Studio.

1. No painel de navegação à esquerda, selecione **Implantações**.

1. No menu suspenso, escolha **Endpoints**.

A página **Endpoints** é aberta, listando todos os endpoints de hospedagem do SageMaker AI. Nessa página, você pode ver os endpoints e seu **Status**. Você também pode criar um novo endpoint, editar um endpoint existente ou excluir um endpoint.

Para ver os detalhes de um endpoint específico, escolha um endpoint na lista. Na página de detalhes do endpoint, você tem uma visão geral como na captura de tela a seguir.

![\[Captura de tela da página principal de um endpoint mostrando um resumo dos detalhes do endpoint no Studio.\]](http://docs.aws.amazon.com/pt_br/sagemaker/latest/dg/images/inference/studio-endpoint-details-page.png)


Cada página de detalhes do endpoint contém as seguintes guias de informações:

# Exibir variantes (ou modelos)
<a name="manage-endpoints-studio-variants"></a>

A guia **Variantes** [também chamada de guia **(Modelos)** se o seu endpoint tiver vários modelos implantados] mostra a lista de [variantes de modelo](https://docs.aws.amazon.com/sagemaker/latest/dg/model-ab-testing.html) ou modelos atualmente implantados no endpoint. A captura de tela a seguir mostra a aparência da visão geral e da seção **Modelos** de um endpoint com vários modelos implantados.

![\[Captura de tela da página principal de um endpoint mostrando vários modelos implantados.\]](http://docs.aws.amazon.com/pt_br/sagemaker/latest/dg/images/inference/studio-goldfinch-multi-model-endpoint.png)


É possível adicionar ou editar configurações para cada variante ou modelo. Você também pode selecionar uma variante e habilitar uma política de ajuste de escala automático padrão, que pode ser editada posteriormente na guia **Ajuste de escala automático**.

# Visualizar configurações
<a name="manage-endpoints-studio-settings"></a>

Na guia **Configurações**, você pode ver o perfil do IAM da AWS associado ao endpoint, a chave do AWS KMS usada para criptografia (se aplicável), o nome da VPC e as configurações de isolamento de rede.

# Testar inferência
<a name="manage-endpoints-studio-test"></a>

Na guia **Testar inferência**, você pode enviar uma solicitação de teste de inferência para um modelo implantado. Isso é útil se você quiser verificar se o endpoint responde às solicitações conforme o esperado.

Para testar inferência, faça o seguinte:

1. Na guia **Testar inferência** do modelo, escolha uma das seguintes opções:

   1. Selecione **Inserir o corpo da solicitação** se quiser testar o endpoint e receber uma resposta por meio da interface do Studio.

   1. Selecione **Copiar código de exemplo (Python)** se quiser copiar um exemplo do AWS SDK para Python (Boto3) que possa ser usado para invocar o endpoint por meio de um ambiente local e receber uma resposta programaticamente.

1. Em **Modelo**, selecione o modelo que você deseja testar no endpoint.

1. Se você escolheu o método de teste da interface do Studio, também poderá escolher o **Tipo de conteúdo** desejado para a resposta no menu suspenso.

Depois de configurar a solicitação, você pode escolher **Enviar solicitação** (para receber uma resposta por meio da interface do Studio) ou **Copiar** para copiar o exemplo do Python.

Se você receber uma resposta por meio da interface do Studio, ela se parecerá com a captura de tela a seguir.

![\[Captura de tela de uma solicitação de teste de inferência bem-sucedida em um endpoint no Studio.\]](http://docs.aws.amazon.com/pt_br/sagemaker/latest/dg/images/inference/endpoint-test-inference.png)


# Ajuste de escala automático
<a name="manage-endpoints-studio-autoscaling"></a>

Na guia **Ajuste de escala automático**, você pode visualizar todas as políticas de ajuste de escala automático configuradas para os modelos hospedados no endpoint. A captura de tela a seguir mostra a guia **Ajuste de escala automático**.

![\[Captura de tela da guia Ajuste de escala automático, mostrando uma política ativa.\]](http://docs.aws.amazon.com/pt_br/sagemaker/latest/dg/images/inference/studio-endpoint-autoscaling.png)


Você pode escolher **Editar ajuste de escala automático** para alterar qualquer uma das políticas e ativar ou desativar a política de ajuste de escala automático padrão.

Para saber mais sobre o ajuste de escala automático para endpoints em tempo real, consulte [Ajuste de escala automático de modelos do Amazon SageMaker AI](https://docs.aws.amazon.com/sagemaker/latest/dg/endpoint-auto-scaling.html). Se você não tiver certeza de como configurar uma política de ajuste de escala automático para o endpoint, você pode usar um [trabalho de recomendações de ajuste de escala automático do Inference Recommender](https://docs.aws.amazon.com/sagemaker/latest/dg/inference-recommender-autoscaling.html) para obter recomendações para uma política de ajuste de escala automático.

# Visualizar detalhes do endpoint no console do SageMaker AI
<a name="manage-endpoints-console"></a>

Para visualizar os endpoints no console do SageMaker AI, faça o seguinte:

1. Acesse o console do SageMaker AI em [https://console.aws.amazon.com/sagemaker/](https://console.aws.amazon.com/sagemaker/).

1. No painel de navegação à esquerda, selecione **Inferência**.

1. Na lista suspensa, escolha **Endpoints**.

1. Na página **Endpoints**, escolha o seu endpoints.

A página de detalhes do endpoint deve ser aberta, mostrando um resumo do seu endpoint e das métricas que foram coletadas para seu endpoint.

As seções a seguir descrevem as guias na página de detalhes de endpoints.

# Monitoramento de endpoints
<a name="manage-endpoints-console-monitoring"></a>

Depois de criar um endpoint de hospedagem do SageMaker AI, você pode monitorar monitorá-lo usando o Amazon CloudWatch, que coleta dados brutos e os processa em métricas legíveis quase em tempo real. Ao usar essas métricas, você pode acessar informações históricas e obter uma melhor visão do desempenho do endpoint. Para obter mais informações, consulte o *[Guia do usuário do Amazon CloudWatch](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/)*.

Na guia **Monitoramento** na página de detalhes do endpoint, você pode visualizar os dados de métricas do CloudWatch que foram coletados do seu endpoint.

A aba **Monitoramento** inclui as seguintes seções:
+ **Métricas operacionais**: Visualize métricas que rastreiam a utilização dos recursos do seu endpoint, como a utilização da CPU e a utilização da memória.
+ **Métricas de invocação**: visualize métricas que rastreiam o número, a integridade e o status das solicitações `InvokeEndpoint` que chegam ao seu endpoint, como erros do modelo de invocação e latência do modelo.
+ **Métricas de saúde**: visualize métricas que monitoram a integridade geral do seu endpoint, como falhas de invocação e falhas de notificação.

Para ver a descrição detalhada de cada métrica, consulte [Métricas do Amazon SageMaker AI no Amazon CloudWatch](https://docs.aws.amazon.com/sagemaker/latest/dg/monitoring-cloudwatch.html).

A captura de tela a seguir mostra a seção **Métricas operacionais** para um endpoint sem servidor.

![\[Captura de tela dos gráficos de métricas na seção de métricas operacionais da página de detalhes do endpoint.\]](http://docs.aws.amazon.com/pt_br/sagemaker/latest/dg/images/hosting-operational-metrics.png)




Você pode ajustar o **período** e a **estatística** que deseja rastrear para as métricas em uma determinada seção, bem como o período durante o qual deseja visualizar os dados das métricas. Você também pode adicionar e remover widgets de métrica da visualização de cada seção escolhendo **Adicionar widget**. Na caixa de diálogo **Adicionar widget**, você pode selecionar e desmarcar as métricas que deseja ver.

As métricas disponíveis podem depender do seu tipo de endpoint. Por exemplo, endpoints sem servidor têm algumas métricas que não estão disponíveis para endpoints em tempo real. Para mais informações de métricas específicas por tipo de endpoint, consulte as páginas a seguir.
+ [Monitore um endpoint sem servidor](https://docs.aws.amazon.com/sagemaker/latest/dg/serverless-endpoints-monitoring.html)
+ [Monitore um endpoint assíncrono](https://docs.aws.amazon.com/sagemaker/latest/dg/async-inference-monitor.html)
+ [Métricas do CW para implantações de endpoint multimodelo](https://docs.aws.amazon.com/sagemaker/latest/dg/multi-model-endpoint-cloudwatch-metrics.html)
+ [Logs e métricas de pipeline de inferência](https://docs.aws.amazon.com/sagemaker/latest/dg/inference-pipeline-logs-metrics.html)

# Configurações
<a name="manage-endpoints-console-settings"></a>

Você pode escolher a guia **Configurações** para visualizar informações adicionais sobre seu endpoint, como as configurações da captura de dados, a configuração de endpoint e as tags.

# Criar, excluir e visualizar alarmes
<a name="manage-endpoints-console-alarms"></a>

Na guia **Alarmes** na página de detalhes do endpoint, você pode visualizar e criar alarmes de métricas de limite estático simples nos quais você especifica um valor limite para uma métrica. Se a métrica violar o valor limite, o alarme entrará no estado `ALARM`. Para obter mais informações sobre alarmes do CloudWatch, consulte [Usando alarmes do Amazon CloudWatch](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/AlarmThatSendsEmail.html).

Na seção **Resumo do Endpoint** você pode visualizar o campo **Alarmes**, que informa quantos alarmes estão ativos atualmente em seu endpoint.

Para ver quais alarmes estão no estado `ALARM`, escolha a guia **Alarmes**. A guia **Alarmes** mostra uma lista completa dos alarmes do endpoint com detalhes sobre seu status e condições. A captura de tela a seguir mostra uma lista de alarmes nesta seção que foram configurados para um endpoint.

![\[Captura de tela da guia de alarmes na página de detalhes do endpoint, que mostra uma lista de alarmes do CloudWatch.\]](http://docs.aws.amazon.com/pt_br/sagemaker/latest/dg/images/hosting-alarms-tab.png)


O status de um alarme pode ser `In alarm`, `OK` ou `Insufficient data` se não houver dados de métricas suficientes sendo coletados.

Para criar um novo alarme para o endpoint, faça o seguinte:

1. Na guia **Alarmes**, escolha **Criar alarme**.

1. A página **Criar alarme** será aberta. Em **Nome do alarme**, digite um nome para o alarme.

1. (Opcional) Insira uma descrição do alarme.

1. Em **Métrica**, escolha a métrica do CloudWatch que você quer que o alarme monitore.

1. Em **Nome da variante**, escolha a variante do modelo de endpoint que você deseja monitorar.

1. Em **Estatística**, escolha uma das estatísticas disponíveis para a métrica selecionada.

1. Em **Período**, escolha o período a ser usado para calcular cada valor de estatísticas. Por exemplo, se você escolher a estatística Média e um período de 5 minutos, cada ponto de dados monitorado pelo alarme é a média dos pontos de dados da métrica em intervalos de 5 minutos.

1. Em **Períodos de avaliação**, insira o número de pontos de dados que você deseja que o alarme considere ao avaliar se deve entrar no estado do alarme ou não.

1. Em **Condição**, escolha a condicional que você deseja usar para o limite de alarme.

1. Em **Valor limite**, insira o valor desejado para seu limite.

1. (Opcional) Para **Notificação**, você pode escolher **Adicionar notificação** para criar ou especificar um tópico do Amazon SNS que receba uma notificação quando o estado do alarme mudar.

1. Selecione **Criar alarme**.

Depois de criar seu alarme, você pode retornar à guia **Alarmes** para ver seu status a qualquer momento. Nesta seção, você também pode selecionar o alarme e **Editar** ou **Excluir** o alarme.