

# PERF02-BP03 Recopilar métricas relacionadas con la computación
<a name="perf_select_compute_collect_metrics"></a>

Para entender el rendimiento de sus recursos de computación, debe registrar y hacer un seguimiento de la utilización de varios sistemas. Estos datos pueden utilizarse para determinar con mayor precisión las requisitos de recursos.  

 Las cargas de trabajo pueden generar grandes volúmenes de datos como métricas, registros y eventos. Determine si su actual servicio de almacenamiento, supervisión y observabilidad puede administrar los datos generados. Identifique qué métricas reflejan la utilización de los recursos y pueden recopilarse, agregarse y correlacionarse en una única plataforma. Esas métricas deben representar todos sus recursos de carga de trabajo, aplicaciones y servicios, para que pueda obtener fácilmente una visibilidad de todo el sistema e identificar rápidamente las oportunidades y los problemas de mejora del rendimiento.

 **Resultado deseado:** todas las métricas relacionadas con los recursos relacionados con la computación se identifican, recopilan, agregan y correlacionan en una única plataforma con retención implementada para respaldar los costes y los objetivos operativos. 

 **Patrones de uso no recomendados comunes:** 
+  Solo se utiliza la búsqueda manual de métricas en los archivos de registro.  
+  Solo se publican las métricas en las herramientas internas. 
+  Solo se utilizan las métricas por defecto registradas por el software de supervisión seleccionado. 
+  Solo se revisan las métricas cuando hay un problema. 

 

 **Beneficios de establecer esta práctica recomendada:** para supervisar el rendimiento de las cargas de trabajo, debe registrar múltiples métricas de rendimiento durante un período de tiempo. Estas métricas le permiten detectar anomalías en el rendimiento. También le ayudarán a medir el rendimiento con respecto a las métricas empresariales para asegurarse de que satisface sus necesidades de carga de trabajo. 

 **Nivel de riesgo expuesto si no se establece esta práctica recomendada:** Alto 

## Guía para la implementación
<a name="implementation-guidance"></a>

 Identifique, recopile, agregue y correlacione las métricas relacionadas con la computación. El uso de un servicio como Amazon CloudWatch, puede acelerar la implementación y facilitar su mantenimiento. Además de las métricas predeterminadas registradas, identifique y haga un seguimiento de las métricas adicionales en el nivel del sistema en su carga de trabajo. Registre datos como las métricas de utilización de la CPU, memoria, E/S del disco y red para conocer los niveles de utilización y los cuellos de botella. Estos datos son cruciales para entender el rendimiento de la carga de trabajo y cómo se utiliza la solución de computación. Utilice estas métricas como parte de un enfoque basado en datos para ajustar y optimizar activamente los recursos de su carga de trabajo.  

 **Pasos de implementación:** 

1.  ¿Qué métricas de solución de computación son importantes para hacer un seguimiento? 

   1.  [Métricas predeterminadas de EC2](https://docs.aws.amazon.com/AWSEC2/latest/UserGuide/viewing_metrics_with_cloudwatch.html) 

   1.  [Métricas predeterminadas de Amazon ECS](https://docs.aws.amazon.com/AmazonECS/latest/developerguide/cloudwatch-metrics.html) 

   1.  [Métricas predeterminadas de EKS](https://docs.aws.amazon.com/prescriptive-guidance/latest/implementing-logging-monitoring-cloudwatch/kubernetes-eks-metrics.html) 

   1.  [Métricas predeterminadas de Lambda](https://docs.aws.amazon.com/lambda/latest/dg/monitoring-functions-access-metrics.html) 

   1.  [Métricas de memoria y disco de EC2](https://docs.aws.amazon.com/AWSEC2/latest/UserGuide/mon-scripts.html) 

1.  ¿Dispongo actualmente de una solución de registro y supervisión aprobada? 

   1.  [Amazon CloudWatch](https://aws.amazon.com/cloudwatch/) 

   1.  [AWS Distro for OpenTelemetry](https://aws.amazon.com/otel/) 

   1.  [Amazon Managed Service for Prometheus](https://docs.aws.amazon.com/grafana/latest/userguide/prometheus-data-source.html) 

1.  ¿He identificado y configurado mis políticas de retención de datos para que se ajusten a mis objetivos de seguridad y operativos? 

   1.  [Retención de datos predeterminada para métricas de CloudWatch](https://aws.amazon.com/cloudwatch/faqs/#AWS_resource_.26_custom_metrics_monitoring) 

   1.  [Retención de datos predeterminada para CloudWatch Logs](https://aws.amazon.com/cloudwatch/faqs/#Log_management) 

1.  ¿Cómo despliega sus agentes de agregación de métricas y registros? 

   1.  [Automatización de AWS Systems Manager](https://docs.aws.amazon.com/systems-manager/latest/userguide/systems-manager-automation.html?ref=wellarchitected) 

   1.  [OpenTelemetry Collector](https://aws-otel.github.io/docs/getting-started/collector) 

 **Nivel de esfuerzo para el plan de implementación: **hay un nivel *medio* de esfuerzo para identificar, hacer un seguimiento, recopilar, agregar y correlacionar las métricas de todos los recursos de computación. 

## Recursos
<a name="resources"></a>

 **Documentos relacionados:** 
+  [Documentación de Amazon CloudWatch](https://docs.aws.amazon.com/cloudwatch/index.html?ref=wellarchitected) 
+  [Recopilación de métricas y registros de instancias Amazon EC2 y en los servidores locales con el agente de CloudWatch](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/Install-CloudWatch-Agent.html?ref=wellarchitected) 
+  [Acceso a Amazon CloudWatch Logs para AWS Lambda](https://docs.aws.amazon.com/lambda/latest/dg/monitoring-functions-logs.html?ref=wellarchitected) 
+  [Uso de CloudWatch Logs con instancias de contenedor](https://docs.aws.amazon.com/AmazonECS/latest/developerguide/using_cloudwatch_logs.html?ref=wellarchitected) 
+  [Publique métricas personalizadas](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/publishingMetrics.html?ref=wellarchitected) 
+  [AWS Answers: registro centralizado](https://aws.amazon.com/answers/logging/centralized-logging/?ref=wellarchitected) 
+  [Servicios de AWS que publican métricas de CloudWatch](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/CW_Support_For_AWS.html?ref=wellarchitected) 
+  [Supervisión de Amazon EKS en AWS Fargate](https://aws.amazon.com/blogs/containers/monitoring-amazon-eks-on-aws-fargate-using-prometheus-and-grafana/) 

 

 **Vídeos relacionados:** 
+  [Application Performance Management on AWS (Administración del rendimiento de las aplicaciones en AWS)](https://www.youtube.com/watch?v=5T4stR-HFas&ref=wellarchitected) 
+  [Diseñe un plan de monitoreo](https://www.youtube.com/watch?v=OMmiGETJpfU&ref=wellarchitected) 

 

 **Ejemplos relacionados:** 
+  [Nivel 100: supervisión con paneles de CloudWatch](https://wellarchitectedlabs.com/performance-efficiency/100_labs/100_monitoring_with_cloudwatch_dashboards/) 
+  [Nivel 100: supervisión de una instancia EC2 de Windows con paneles de CloudWatch](https://wellarchitectedlabs.com/performance-efficiency/100_labs/100_monitoring_windows_ec2_cloudwatch/) 
+  [Nivel 100: supervisión de una instancia EC2 de Amazon Linux con paneles de CloudWatch](https://wellarchitectedlabs.com/performance-efficiency/100_labs/100_monitoring_linux_ec2_cloudwatch/) 