# PERF02-BP03 Collecter les métriques liées au calcul
<a name="perf_select_compute_collect_metrics"></a>

Pour comprendre les performances de vos systèmes de calcul, vous devez enregistrer et suivre l'utilisation de divers systèmes. Ces données peuvent être utilisées pour évaluer les besoins en ressources avec plus de précision.  

 Les charges de travail peuvent générer de gros volumes de données telles que des métriques, des journaux et des événements. Déterminez si votre service de stockage, de surveillance et d'observabilité existant peut gérer les données générées. Identifiez les métriques qui reflètent l'utilisation des ressources et qui peuvent être collectées, agrégées et corrélées sur une seule plateforme. Ces mesures devraient représenter toutes vos ressources de charge de travail, applications et services, afin que vous ayez une visibilité optimale à l'échelle du système et que vous puissiez identifier rapidement les améliorations possibles des performances et les problèmes.

 **Résultat souhaité :** Toutes les métriques relatives aux ressources liées au calcul sont identifiées, collectées, agrégées et corrélées sur une plateforme unique avec la mise en œuvre de la rétention afin de soutenir les objectifs de coût et opérationnels. 

 **Anti-modèles courants :** 
+  Vous utilisez uniquement la recherche manuelle des fichiers journaux pour les métriques.  
+  Vous publiez des métriques uniquement dans des outils internes. 
+  Vous n'utilisez que les métriques par défaut enregistrées par le logiciel de surveillance que vous avez sélectionné. 
+  Vous n'examinez les métriques qu'en cas de problème. 

 

 **Avantages liés au respect de cette bonne pratique :** L'enregistrement de plusieurs métriques de performance sur une période donnée est nécessaire pour la surveillance des performances de vos charges de travail. Ces métriques permettent de détecter les anomalies de performances. Elles vous aident également à comparer les performances par rapport aux métriques de l'entreprise pour vous assurer que vous répondez aux besoins de votre charge de travail. 

 **Niveau de risque exposé si cette bonne pratique n'est pas respectée :** Débit 

## Directives d'implémentation
<a name="implementation-guidance"></a>

 Identifiez, collectez, agrégez et corrélez les métriques liées au calcul. L'utilisation d'un service comme Amazon CloudWatch peut accélérer la mise en œuvre et en faciliter la gestion. En plus des métriques par défaut enregistrées, identifiez et suivez des métriques supplémentaires au niveau du système dans votre charge de travail. Enregistrez des données telles que l'utilisation du processeur, la mémoire, les E/S de disque et les métriques entrantes et sortantes du réseau, pour obtenir des informations sur les niveaux d'utilisation ou les goulets d'étranglement. Ces données sont essentielles pour comprendre à la fois les performances de la charge de travail et l'utilisation de la solution de calcul. Utilisez ces métriques dans le cadre d'une approche fondée sur les données pour ajuster activement et optimiser les ressources de votre charge de travail.  

 **Étapes d'implémentation :** 

1.  Quelles sont les métriques de la solution de calcul à suivre ? 

   1.  [Métriques EC2 par défaut](https://docs.aws.amazon.com/AWSEC2/latest/UserGuide/viewing_metrics_with_cloudwatch.html) 

   1.  [Métriques Amazon ECS par défaut](https://docs.aws.amazon.com/AmazonECS/latest/developerguide/cloudwatch-metrics.html) 

   1.  [Métriques EKS par défaut](https://docs.aws.amazon.com/prescriptive-guidance/latest/implementing-logging-monitoring-cloudwatch/kubernetes-eks-metrics.html) 

   1.  [Métriques Lambda par défaut](https://docs.aws.amazon.com/lambda/latest/dg/monitoring-functions-access-metrics.html) 

   1.  [Métriques de mémoire et de disque EC2](https://docs.aws.amazon.com/AWSEC2/latest/UserGuide/mon-scripts.html) 

1.  Une solution de journalisation et de surveillance approuvée est-elle actuellement à ma disposition ? 

   1.  [Amazon CloudWatch](https://aws.amazon.com/cloudwatch/) 

   1.  [AWS Distro for OpenTelemetry](https://aws.amazon.com/otel/) 

   1.  [Amazon Managed Service for Prometheus](https://docs.aws.amazon.com/grafana/latest/userguide/prometheus-data-source.html) 

1.  Est-ce que j'ai identifié et configuré mes politiques de conservation des données pour qu'elles correspondent à mes objectifs de sécurité et d'exploitation ? 

   1.  [Métriques de conservation des données pour CloudWatch](https://aws.amazon.com/cloudwatch/faqs/#AWS_resource_.26_custom_metrics_monitoring) 

   1.  [Conservation des données pour CloudWatch Logs](https://aws.amazon.com/cloudwatch/faqs/#Log_management) 

1.  Comment déployez-vous vos agents d'agrégation de métriques et de journaux ? 

   1.  [Automatisation AWS Systems Manager](https://docs.aws.amazon.com/systems-manager/latest/userguide/systems-manager-automation.html?ref=wellarchitected) 

   1.  [Collecteur OpenTelemetry](https://aws-otel.github.io/docs/getting-started/collector) 

 **Niveau d'effort du plan d'implémentation : **Il existe un niveau d'effort *moyen* pour identifier, suivre, collecter, agréger et corréler les métriques de toutes les ressources de calcul. 

## Ressources
<a name="resources"></a>

 **Documents connexes :** 
+  [Documentation Amazon CloudWatch](https://docs.aws.amazon.com/cloudwatch/index.html?ref=wellarchitected) 
+  [Collecte des métriques et des journaux des instances Amazon EC2 et serveurs sur site avec l'agent CloudWatch](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/Install-CloudWatch-Agent.html?ref=wellarchitected) 
+  [Accès à Amazon CloudWatch Logs pour AWS Lambda](https://docs.aws.amazon.com/lambda/latest/dg/monitoring-functions-logs.html?ref=wellarchitected) 
+  [Utiliser CloudWatch Logs avec des instances de conteneur](https://docs.aws.amazon.com/AmazonECS/latest/developerguide/using_cloudwatch_logs.html?ref=wellarchitected) 
+  [Publier des métriques personnalisées](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/publishingMetrics.html?ref=wellarchitected) 
+  [AWS Answers : journalisation centralisée](https://aws.amazon.com/answers/logging/centralized-logging/?ref=wellarchitected) 
+  [Services AWS publiant des métriques CloudWatch](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/CW_Support_For_AWS.html?ref=wellarchitected) 
+  [Surveillance d'Amazon EKS sur AWS Fargate](https://aws.amazon.com/blogs/containers/monitoring-amazon-eks-on-aws-fargate-using-prometheus-and-grafana/) 

 

 **Vidéos connexes :** 
+  [Application Performance Management on AWS](https://www.youtube.com/watch?v=5T4stR-HFas&ref=wellarchitected) 
+  [Élaborer un plan de surveillance](https://www.youtube.com/watch?v=OMmiGETJpfU&ref=wellarchitected) 

 

 **Exemples connexes :** 
+  [Niveau 100 : surveillance avec les tableaux de bord CloudWatch](https://wellarchitectedlabs.com/performance-efficiency/100_labs/100_monitoring_with_cloudwatch_dashboards/) 
+  [Niveau 100 : surveillance d'une instance Windows EC2 avec les tableaux de bord CloudWatch](https://wellarchitectedlabs.com/performance-efficiency/100_labs/100_monitoring_windows_ec2_cloudwatch/) 
+  [Niveau 100 : surveillance d'une instance Amazon Linux EC2 avec les tableaux de bord CloudWatch](https://wellarchitectedlabs.com/performance-efficiency/100_labs/100_monitoring_linux_ec2_cloudwatch/)