

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

# Métricas mejoradas de Amazon SageMaker AI para puntos finales de inferencia
<a name="monitoring-cloudwatch-enhanced-metrics"></a>

Las métricas mejoradas proporcionan datos de monitoreo a nivel de instancia y contenedor para los puntos de conexión en tiempo real de Amazon AI. SageMaker Cuando habilitas las métricas mejoradas, las CloudWatch métricas de Amazon pueden incluir `InstanceId` y `AcceleratorId` dimensiones (la disponibilidad varía según el espacio de nombres) para una visibilidad granular por instancia, por contenedor y por GPU. `ContainerId` Hay métricas mejoradas disponibles para los puntos finales y los componentes de inferencia de un solo modelo. Multi-Container Los puntos finales (MCE) admiten métricas mejoradas a nivel de instancia, pero no a nivel de contenedor.

Características clave de las métricas mejoradas:
+ **Instance-level granularidad**. Las métricas de utilización e invocación incluyen una `InstanceId` dimensión que identifica la instancia específica que aloja el punto final. Está disponible para todos los puntos finales en tiempo real.
+ **Container-level granularidad**. En el caso de los puntos finales que utilizan componentes de inferencia, las métricas incluyen una `ContainerId` dimensión que identifica el contenedor específico que ejecuta el modelo. Container-level las dimensiones aparecen tanto en el espacio de `AWS/SageMaker` nombres (métricas de invocación) como en el espacio de `/aws/sagemaker/InferenceComponents` nombres (métricas de utilización).
+ **Per-GPU granularidad.** Las métricas de uso de la GPU incluyen una `AcceleratorId` dimensión que identifica la GPU específica de una instancia.
+ **Frecuencia de publicación configurable**. Puede configurar el intervalo de publicación métrico en 10, 30, 60, 120, 180, 240 o 300 segundos. El valor predeterminado es de 60 segundos. Este intervalo se aplica a las métricas de uso independientemente de si las métricas mejoradas están habilitadas. Con las métricas mejoradas habilitadas, también se aplica a las métricas de invocación.

## Habilitar métricas mejoradas
<a name="enhanced-metrics-enabling"></a>

Para habilitar las métricas mejoradas, `EnableEnhancedMetrics` `True` establézcalas en el [MetricsConfig](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_MetricsConfig.html)parámetro al llamar a la [CreateEndpointConfig](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_CreateEndpointConfig.html)API.

El `MetricsConfig` parámetro tiene los siguientes campos:


**MetricsConfig parámetros**  

| Parámetro | Tipo | Obligatorio/a | Predeterminado | Description (Descripción) | 
| --- | --- | --- | --- | --- | 
| EnableEnhancedMetrics | Booleano | No | False | Permite dimensiones métricas a nivel de instancia y de contenedor. | 
| MetricPublishFrequencyInSeconds | Entero | No | 60 | El intervalo, en segundos, en el que se publican las métricas en Amazon CloudWatch. El valor predeterminado es `60`. Valores válidos: `10``30`,`60`,`120`,`180`,`240`,`300`. Si `EnableEnhancedMetrics` se establece en`False`, este intervalo se aplica únicamente a las métricas de uso; las métricas de invocación se siguen publicando en el intervalo predeterminado de 60 segundos. Si se establece en`True`, este intervalo se aplica tanto a las métricas de utilización como a las de invocación. | 

**nota**  
`MetricsConfig`se establece en el nivel de configuración del punto final. No puede configurar diferentes ajustes para los componentes de inferencia individuales en el mismo punto final.

Para habilitar las métricas mejoradas en un punto final existente, cree una nueva configuración de punto final con la `MetricsConfig` configuración deseada y, a continuación, llame [UpdateEndpoint](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_UpdateEndpoint.html)con el nombre de la nueva configuración de punto final. Esto desencadena un despliegue continuo blue/green o continuo. Las métricas mejoradas no aparecen hasta que se completa la implementación. El mismo proceso se aplica al cambiar la `MetricsConfig` configuración en un punto final ya configurado.

Al configurar`MetricsConfig`, ambos [DescribeEndpoint](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_DescribeEndpoint.html)y [DescribeEndpointConfig](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_DescribeEndpointConfig.html)devuelven `MetricsConfig` la respuesta.

Al habilitar las métricas mejoradas, la SageMaker IA añade dimensiones adicionales a las métricas en tres CloudWatch espacios de nombres: `/aws/sagemaker/Endpoints` para las métricas de utilización, para las métricas de invocación y `AWS/SageMaker` `/aws/sagemaker/InferenceComponents` para las métricas de utilización de los componentes de inferencia.

## Instance-level métricas de uso
<a name="enhanced-metrics-instance-utilization"></a>

El espacio de `/aws/sagemaker/Endpoints` nombres incluye métricas de uso para todos los puntos finales en tiempo real, incluidos los que utilizan componentes de inferencia. Al habilitar las métricas mejoradas, las dimensiones `InstanceId` y `AcceleratorId` (solo métricas de GPU) pasan a estar disponibles junto con las dimensiones del espacio de nombres existentes. Para obtener una lista completa de métricas y dimensiones, consulte. [SageMaker Métricas de puntos finales de IA](monitoring-cloudwatch.md#cloudwatch-metrics-endpoints)

Al habilitar las métricas mejoradas, estarán disponibles las siguientes dimensiones adicionales:


**Dimensiones adicionales para las métricas de uso a nivel de instancia**  

| Dimensión | Description (Descripción) | 
| --- | --- | 
| InstanceId | Filtra las métricas de uso de una instancia específica. | 
| AcceleratorId | (Solo métricas de GPU) Filtra las métricas de uso de una GPU específica. | 

## Métricas de invocación a nivel de instancia y contenedor
<a name="enhanced-metrics-invocation"></a>

El `AWS/SageMaker` espacio de nombres incluye métricas de invocación. Al habilitar las métricas mejoradas, las dimensiones `InstanceId` y `ContainerId` (solo los componentes de inferencia) pasan a estar disponibles junto con las dimensiones del espacio de nombres existentes. Para obtener una lista completa de métricas y dimensiones, consulte. [SageMaker Métricas de invocación de puntos finales de IA](monitoring-cloudwatch.md#cloudwatch-metrics-endpoint-invocation)

Al habilitar las métricas mejoradas, estarán disponibles las siguientes dimensiones adicionales:


**Dimensiones adicionales para las métricas de invocación**  

| Dimensión | Description (Descripción) | 
| --- | --- | 
| InstanceId | Filtra las métricas de invocación de una instancia específica. | 
| ContainerId | (Solo componentes de inferencia) Filtra las métricas de invocación de un contenedor específico. | 

## Container-level métricas de utilización
<a name="enhanced-metrics-container"></a>

El espacio de `/aws/sagemaker/InferenceComponents` nombres incluye métricas de uso para los puntos finales que utilizan componentes de inferencia. Al habilitar las métricas mejoradas, las dimensiones `InstanceId``ContainerId`, y `AcceleratorId` (solo métricas de GPU) pasan a estar disponibles junto con las dimensiones del espacio de nombres existentes. Para obtener una lista completa de métricas y dimensiones, consulte. [SageMaker Métricas de componentes de inferencia de IA](monitoring-cloudwatch.md#cloudwatch-metrics-inference-component)

Al habilitar las métricas mejoradas, estarán disponibles las siguientes dimensiones adicionales:


**Dimensiones adicionales para las métricas de utilización a nivel de contenedor**  

| Dimensión | Description (Descripción) | 
| --- | --- | 
| InstanceId | Filtra las métricas de uso de una instancia específica. | 
| ContainerId | Filtra las métricas de uso de un contenedor específico. | 
| AcceleratorId | (Solo métricas de GPU) Filtra las métricas de uso de una GPU específica. | 

## Frecuencia métrica configurable
<a name="enhanced-metrics-frequency"></a>

Puede configurar el intervalo en el que se publican las métricas CloudWatch. La frecuencia predeterminada es de 60 segundos.

**Valores válidos:** 10, 30, 60, 120, 180, 240 o 300 segundos.

Si `EnableEnhancedMetrics` se establece en`False`, esta frecuencia se aplica únicamente a las métricas de uso; las métricas de invocación se siguen publicando en el intervalo predeterminado de 60 segundos. Si se establece en`True`, esta frecuencia se aplica tanto a las métricas de utilización como a las de invocación.

**nota**  
Las métricas publicadas a intervalos inferiores a 60 segundos (alta resolución) se conservan durante 3 horas.

 CloudWatch El precio estándar se aplica por métrica y combinación de dimensiones única. Las métricas mejoradas aumentan la cantidad de flujos de métricas porque cada instancia, contenedor y GPU crea combinaciones de dimensiones adicionales. Para obtener más información sobre los precios, consulta [ CloudWatch los precios de Amazon](https://aws.amazon.com/cloudwatch/pricing/).

## Ejemplos de código: configurar métricas mejoradas
<a name="enhanced-metrics-code-examples"></a>

Los siguientes ejemplos muestran cómo crear una configuración de punto final con las métricas mejoradas habilitadas y cómo verificar la configuración.

### Cree una configuración de punto final con métricas mejoradas
<a name="enhanced-metrics-create-example"></a>

------
#### [ AWS SDK for Python (Boto3) ]

**Example Cree una configuración de punto final con métricas mejoradas**  

```
import boto3

sagemaker_client = boto3.client('sagemaker')

response = sagemaker_client.create_endpoint_config(
    EndpointConfigName='{{my-enhanced-metrics-config}}',
    ProductionVariants=[
        {
            'VariantName': '{{AllTraffic}}',
            'ModelName': '{{my-model}}',
            'InstanceType': '{{ml.m5.xlarge}}',
            'InitialInstanceCount': {{2}},
        }
    ],
    MetricsConfig={
        'EnableEnhancedMetrics': True,
        'MetricPublishFrequencyInSeconds': {{60}}
    }
)
```

------
#### [ AWS CLI ]

**Example Cree una configuración de punto final con métricas mejoradas**  

```
aws sagemaker create-endpoint-config \
    --endpoint-config-name {{my-enhanced-metrics-config}} \
    --production-variants file://production-variants.json \
    --metrics-config file://metrics-config.json
```
Donde `metrics-config.json` contiene:  

```
{
    "EnableEnhancedMetrics": true,
    "MetricPublishFrequencyInSeconds": {{60}}
}
```

------

### Verifique la configuración de métricas mejorada
<a name="enhanced-metrics-verify-example"></a>

------
#### [ AWS SDK for Python (Boto3) ]

**Example Verifique la configuración de métricas mejorada**  

```
response = sagemaker_client.describe_endpoint_config(
    EndpointConfigName='{{my-enhanced-metrics-config}}'
)
print(response['MetricsConfig'])
# {'EnableEnhancedMetrics': True, 'MetricPublishFrequencyInSeconds': 60}

response = sagemaker_client.describe_endpoint(
    EndpointName='{{my-endpoint}}'
)
print(response['MetricsConfig'])
```

------
#### [ AWS CLI ]

**Example Verifique la configuración de métricas mejorada**  

```
aws sagemaker describe-endpoint-config \
    --endpoint-config-name {{my-enhanced-metrics-config}} \
    --query 'MetricsConfig'
```

```
aws sagemaker describe-endpoint \
    --endpoint-name {{my-endpoint}} \
    --query 'MetricsConfig'
```

------