

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

# Métricas aprimoradas da Amazon SageMaker AI para endpoints de inferência
<a name="monitoring-cloudwatch-enhanced-metrics"></a>

As métricas aprimoradas fornecem dados de monitoramento em nível de instância e de contêiner para endpoints em tempo real da Amazon AI. SageMaker Quando você ativa métricas aprimoradas, as CloudWatch métricas da Amazon podem incluir `InstanceId``ContainerId`, e `AcceleratorId` dimensões (a disponibilidade varia de acordo com o namespace) para visibilidade granular por instância, por contêiner e por GPU. Métricas aprimoradas estão disponíveis para endpoints de modelo único e componentes de inferência. Multi-Container Os endpoints (MCE) oferecem suporte a métricas aprimoradas em nível de instância, mas não a métricas em nível de contêiner.

Principais características das métricas aprimoradas:
+ **Instance-level granularidade**. As métricas de utilização e invocação incluem uma `InstanceId` dimensão que identifica a instância específica que hospeda o endpoint. Isso está disponível para todos os endpoints em tempo real.
+ **Container-level granularidade**. Para endpoints que usam componentes de inferência, as métricas incluem uma `ContainerId` dimensão que identifica o contêiner específico que executa o modelo. Container-level as dimensões aparecem no `AWS/SageMaker` namespace (métricas de invocação) e no `/aws/sagemaker/InferenceComponents` namespace (métricas de utilização).
+ **Per-GPU granularidade**. As métricas de utilização da GPU incluem uma `AcceleratorId` dimensão que identifica a GPU específica em uma instância.
+ **Frequência de publicação configurável**. Você pode configurar o intervalo de publicação da métrica para 10, 30, 60, 120, 180, 240 ou 300 segundos. O padrão é 60 segundos. Esse intervalo se aplica às métricas de utilização, independentemente de as métricas aprimoradas estarem habilitadas. Com as métricas aprimoradas ativadas, isso também se aplica às métricas de invocação.

## Habilitando métricas aprimoradas
<a name="enhanced-metrics-enabling"></a>

Você ativa as métricas aprimoradas definindo `EnableEnhancedMetrics` [MetricsConfig](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_MetricsConfig.html)como `True` no parâmetro ao chamar a [CreateEndpointConfig](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_CreateEndpointConfig.html)API.

O `MetricsConfig` parâmetro tem os seguintes campos:


**MetricsConfig parâmetros**  

| Parâmetro | Tipo | Obrigatório | Padrão | Description | 
| --- | --- | --- | --- | --- | 
| EnableEnhancedMetrics | Booleano | Não | False | Ativa dimensões métricas em nível de instância e em nível de contêiner. | 
| MetricPublishFrequencyInSeconds | Inteiro | Não | 60 | O intervalo, em segundos, no qual as métricas são publicadas na Amazon CloudWatch. O padrão é `60`. Valores válidos:`10`,`30`,`60`,`120`,`180`,`240`,`300`. Quando `EnableEnhancedMetrics` definido como`False`, esse intervalo se aplica somente às métricas de utilização; as métricas de invocação continuam sendo publicadas no intervalo padrão de 60 segundos. Quando definido como`True`, esse intervalo se aplica às métricas de utilização e invocação. | 

**nota**  
`MetricsConfig`é definido no nível de configuração do endpoint. Você não pode definir configurações diferentes para componentes de inferência individuais no mesmo endpoint.

Para habilitar métricas aprimoradas em um endpoint existente, crie uma nova configuração de endpoint com as `MetricsConfig` configurações desejadas e, em seguida, chame [UpdateEndpoint](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_UpdateEndpoint.html)com o novo nome da configuração do endpoint. Isso aciona uma blue/green implantação contínua. As métricas aprimoradas não aparecem até que a implantação seja concluída. O mesmo processo se aplica ao alterar `MetricsConfig` as configurações em um endpoint já configurado.

Quando você configura`MetricsConfig`, ambos [DescribeEndpoint](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_DescribeEndpoint.html)e [DescribeEndpointConfig](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_DescribeEndpointConfig.html)retorna `MetricsConfig` na resposta.

Quando você ativa métricas aprimoradas, a SageMaker IA adiciona dimensões adicionais às métricas em três CloudWatch namespaces: `/aws/sagemaker/Endpoints` para métricas de utilização, `AWS/SageMaker` métricas de invocação e métricas de utilização de componentes `/aws/sagemaker/InferenceComponents` de inferência.

## Instance-level métricas de utilização
<a name="enhanced-metrics-instance-utilization"></a>

O `/aws/sagemaker/Endpoints` namespace inclui métricas de utilização para todos os endpoints em tempo real, incluindo aqueles que usam componentes de inferência. Quando você ativa as métricas aprimoradas, as dimensões `InstanceId` e `AcceleratorId` (somente métricas da GPU) ficam disponíveis junto com as dimensões de namespace existentes. Para obter uma lista completa de métricas e dimensões, consulte[SageMaker Métricas de endpoint de IA](monitoring-cloudwatch.md#cloudwatch-metrics-endpoints).

Quando você ativa as métricas aprimoradas, as seguintes dimensões adicionais estão disponíveis:


**Dimensões adicionais para métricas de utilização em nível de instância**  

| Dimensão | Description | 
| --- | --- | 
| InstanceId | Filtra as métricas de utilização de uma instância específica. | 
| AcceleratorId | (Somente métricas da GPU) Filtra as métricas de utilização de uma GPU específica. | 

## Métricas de invocação em nível de instância e contêiner
<a name="enhanced-metrics-invocation"></a>

O `AWS/SageMaker` namespace inclui métricas de invocação. Quando você ativa as métricas aprimoradas, as dimensões `InstanceId` e `ContainerId` (somente componentes de inferência) ficam disponíveis junto com as dimensões de namespace existentes. Para obter uma lista completa de métricas e dimensões, consulte[SageMaker Métricas de invocação de endpoints de IA](monitoring-cloudwatch.md#cloudwatch-metrics-endpoint-invocation).

Quando você ativa as métricas aprimoradas, as seguintes dimensões adicionais estão disponíveis:


**Dimensões adicionais para métricas de invocação**  

| Dimensão | Description | 
| --- | --- | 
| InstanceId | Filtra métricas de invocação para uma instância específica. | 
| ContainerId | (Somente componentes de inferência) Filtra métricas de invocação para um contêiner específico. | 

## Container-level métricas de utilização
<a name="enhanced-metrics-container"></a>

O `/aws/sagemaker/InferenceComponents` namespace inclui métricas de utilização para endpoints que usam componentes de inferência. Quando você ativa as métricas aprimoradas, as dimensões `InstanceId``ContainerId`, e `AcceleratorId` (somente métricas da GPU) ficam disponíveis junto com as dimensões de namespace existentes. Para obter uma lista completa de métricas e dimensões, consulte[SageMaker Métricas do componente de inferência de IA](monitoring-cloudwatch.md#cloudwatch-metrics-inference-component).

Quando você ativa as métricas aprimoradas, as seguintes dimensões adicionais estão disponíveis:


**Dimensões adicionais para métricas de utilização em nível de contêiner**  

| Dimensão | Description | 
| --- | --- | 
| InstanceId | Filtra as métricas de utilização de uma instância específica. | 
| ContainerId | Filtra as métricas de utilização de um contêiner específico. | 
| AcceleratorId | (Somente métricas da GPU) Filtra as métricas de utilização de uma GPU específica. | 

## Frequência métrica configurável
<a name="enhanced-metrics-frequency"></a>

Você pode configurar o intervalo no qual as métricas são publicadas CloudWatch. A frequência padrão é de 60 segundos.

**Valores válidos:** 10, 30, 60, 120, 180, 240 ou 300 segundos.

Quando `EnableEnhancedMetrics` definida como`False`, essa frequência se aplica somente às métricas de utilização; as métricas de invocação continuam sendo publicadas no intervalo padrão de 60 segundos. Quando definida como`True`, essa frequência se aplica às métricas de utilização e invocação.

**nota**  
As métricas publicadas em intervalos inferiores a 60 segundos (alta resolução) são retidas por 3 horas.

 CloudWatch O preço padrão se aplica por métrica por combinação única de dimensões. As métricas aprimoradas aumentam o número de fluxos de métricas porque cada instância, contêiner e GPU cria combinações de dimensões adicionais. Para obter detalhes sobre preços, consulte os [ CloudWatch preços da Amazon](https://aws.amazon.com/cloudwatch/pricing/).

## Exemplos de código: configure métricas aprimoradas
<a name="enhanced-metrics-code-examples"></a>

Os exemplos a seguir mostram como criar uma configuração de endpoint com métricas aprimoradas ativadas e como verificar a configuração.

### Crie uma configuração de endpoint com métricas aprimoradas
<a name="enhanced-metrics-create-example"></a>

------
#### [ AWS SDK for Python (Boto3) ]

**Example Crie uma configuração de endpoint com métricas aprimoradas**  

```
import boto3

sagemaker_client = boto3.client('sagemaker')

response = sagemaker_client.create_endpoint_config(
    EndpointConfigName='{{my-enhanced-metrics-config}}',
    ProductionVariants=[
        {
            'VariantName': '{{AllTraffic}}',
            'ModelName': '{{my-model}}',
            'InstanceType': '{{ml.m5.xlarge}}',
            'InitialInstanceCount': {{2}},
        }
    ],
    MetricsConfig={
        'EnableEnhancedMetrics': True,
        'MetricPublishFrequencyInSeconds': {{60}}
    }
)
```

------
#### [ AWS CLI ]

**Example Crie uma configuração de endpoint com métricas aprimoradas**  

```
aws sagemaker create-endpoint-config \
    --endpoint-config-name {{my-enhanced-metrics-config}} \
    --production-variants file://production-variants.json \
    --metrics-config file://metrics-config.json
```
Onde `metrics-config.json` contém:  

```
{
    "EnableEnhancedMetrics": true,
    "MetricPublishFrequencyInSeconds": {{60}}
}
```

------

### Verifique a configuração aprimorada das métricas
<a name="enhanced-metrics-verify-example"></a>

------
#### [ AWS SDK for Python (Boto3) ]

**Example Verifique a configuração aprimorada das métricas**  

```
response = sagemaker_client.describe_endpoint_config(
    EndpointConfigName='{{my-enhanced-metrics-config}}'
)
print(response['MetricsConfig'])
# {'EnableEnhancedMetrics': True, 'MetricPublishFrequencyInSeconds': 60}

response = sagemaker_client.describe_endpoint(
    EndpointName='{{my-endpoint}}'
)
print(response['MetricsConfig'])
```

------
#### [ AWS CLI ]

**Example Verifique a configuração aprimorada das métricas**  

```
aws sagemaker describe-endpoint-config \
    --endpoint-config-name {{my-enhanced-metrics-config}} \
    --query 'MetricsConfig'
```

```
aws sagemaker describe-endpoint \
    --endpoint-name {{my-endpoint}} \
    --query 'MetricsConfig'
```

------