

# PERF 7  Comment surveiller vos ressources pour vous assurer qu'elles fonctionnent ?
<a name="w2aac19c11b9b5"></a>

 Les performances du système peuvent se dégrader au fil du temps. Surveillez-les afin d'identifier cette dégradation et corriger les facteurs internes ou externes tels que le système d'exploitation ou le chargement des applications. 

**Topics**
+ [PERF07-BP01 Enregistrer les métriques liées aux performances](perf_monitor_instances_post_launch_record_metrics.md)
+ [PERF07-BP02 Analyser les métriques lorsque des événements ou incidents se produisent](perf_monitor_instances_post_launch_review_metrics.md)
+ [PERF07-BP03 Définir des indicateurs clés de performance (KPI) pour mesurer les performances de la charge de travail](perf_monitor_instances_post_launch_establish_kpi.md)
+ [PERF07-BP04 Utiliser la surveillance pour générer des notifications basées sur une alarme](perf_monitor_instances_post_launch_generate_alarms.md)
+ [PERF07-BP05 Vérifier les métriques à intervalles réguliers](perf_monitor_instances_post_launch_review_metrics_collected.md)
+ [PERF07-BP06 Surveillance et alarmes proactives](perf_monitor_instances_post_launch_proactive.md)

# PERF07-BP01 Enregistrer les métriques liées aux performances
<a name="perf_monitor_instances_post_launch_record_metrics"></a>

 Utilisez un service de surveillance et d'observabilité pour enregistrer les métriques liées aux performances. Parmi les exemples de métriques, citons les transactions de la base de données, les requêtes lentes, la latence d'E/S, le débit des demandes HTTP, la latence de service ou d'autres données clés. 

 Identifiez les métriques de performance qui comptent pour votre charge de travail et enregistrez-les. Ces données sont un élément important pour être en mesure d'identifier les composants qui ont une incidence sur les performances globales ou sur l'efficacité de la charge de travail. 

 En travaillant à partir de l'expérience client, identifiez les métriques importantes. Pour chaque métrique, identifiez la cible, la méthode d'évaluation et la priorité. Utilisez-les pour créer des alarmes et des notifications pour gérer de manière proactive les problèmes liés à la performance. 

 **Anti-modèles courants :** 
+  Vous surveillez uniquement les métriques au niveau du système d'exploitation pour obtenir des informations sur votre charge de travail. 
+  Vous concevez l'architecture de vos besoins de calcul de sorte à répondre aux pics de charges de travail. 

 **Avantages liés au respect de cette bonne pratique :** Vous avez besoin d'une vue opérationnelle unifiée de vos indicateurs de performance clés (KPI) pour optimiser les performances et l'utilisation des ressources. Vous pouvez créer des tableaux de bord et soumettre vos données à des calculs métriques pour en tirer des informations opérationnelles et d'utilisation. 

 **Niveau de risque exposé si cette bonne pratique n'est pas respectée :** Débit 

## Directives d'implémentation
<a name="implementation-guidance"></a>

 Identifiez et enregistrez les métriques de performance pertinentes pour votre charge de travail. Ces données permettent d'identifier les composants ayant un impact sur les performances globales ou l'efficacité de votre charge de travail. 

 Identifier les métriques de performance : utilisez l'expérience client pour identifier les métriques les plus importantes. Pour chaque métrique, identifiez la cible, la méthode d'évaluation et la priorité. Utilisez ces points de données pour créer des alarmes et des notifications afin de gérer de manière proactive les problèmes liés à la performance. 

## Ressources
<a name="resources"></a>

 **Documents connexes :** 
+  [Documentation CloudWatch](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/WhatIsCloudWatch.html) 
+  [Collecte des métriques et des journaux des instances Amazon EC2 et serveurs sur site avec l'agent CloudWatch](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/Install-CloudWatch-Agent.html?ref=wellarchitected) 
+  [Publier des métriques personnalisées](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/publishingMetrics.html?ref=wellarchitected) 
+  [Surveillance, journalisation et performances Partenaires APN](https://aws.amazon.com/devops/partner-solutions/#_Monitoring.2C_Logging.2C_and_Performance) 
+  [Documentation X-Ray](https://docs.aws.amazon.com/xray/latest/devguide/aws-xray.html) 
+  [Amazon CloudWatch RUM](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/CloudWatch-RUM.html) 

 **Vidéos connexes :** 
+  [Cut through the chaos: Gain operational visibility and insight (MGT301-R1)](https://www.youtube.com/watch?v=nLYGbotqHd0) 
+  [Application Performance Management on AWS](https://www.youtube.com/watch?v=5T4stR-HFas&ref=wellarchitected) 
+  [Élaborer un plan de surveillance](https://www.youtube.com/watch?v=OMmiGETJpfU&ref=wellarchitected) 

 **Exemples connexes :** 
+  [Niveau 100 : surveillance avec les tableaux de bord CloudWatch](https://wellarchitectedlabs.com/performance-efficiency/100_labs/100_monitoring_with_cloudwatch_dashboards/) 
+  [Niveau 100 : surveillance d'une instance Windows EC2 avec les tableaux de bord CloudWatch](https://wellarchitectedlabs.com/performance-efficiency/100_labs/100_monitoring_windows_ec2_cloudwatch/) 
+  [Niveau 100 : surveillance d'une instance Amazon Linux EC2 avec les tableaux de bord CloudWatch](https://wellarchitectedlabs.com/performance-efficiency/100_labs/100_monitoring_linux_ec2_cloudwatch/) 

# PERF07-BP02 Analyser les métriques lorsque des événements ou incidents se produisent
<a name="perf_monitor_instances_post_launch_review_metrics"></a>

 En réponse à un événement/incident ou lors de celui-ci, utilisez les tableaux de bord ou les rapports de supervision pour comprendre et diagnostiquer l'impact. Ces vues permettent d’identifier les portions de la charge de travail qui ne fonctionnent pas comme prévu. 

 Lorsque vous écrivez des scénarios utilisateurs critiques pour votre architecture, incluez les exigences en matière de performances, notamment en précisant à quelle vitesse devrait s'exécuter chaque scénario critique. Pour ces scénarios critiques, mettez en place d'autres parcours utilisateurs écrits à l'avance afin de vous assurer que ces scénarios fonctionnent conformément à vos exigences. 

 **Anti-modèles courants :** 
+  Vous supposez que les événements de performances sont exceptionnels et uniquement liés à des anomalies. 
+  Vous n'évaluez les métriques de performances existantes que lorsque vous répondez à des événements de performances. 

 **Avantages liés au respect de cette bonne pratique :** Afin de déterminer si votre charge de travail fonctionne aux niveaux prévus, vous devez répondre aux événements de performances en recueillant des données de métriques supplémentaires pour l'analyse. Ces données sont utilisées pour comprendre l'impact de l'événement de performance et suggérer des modifications pour améliorer les performances de la charge de travail. 

 **Niveau de risque exposé si cette bonne pratique n'est pas respectée :** Débit 

## Directives d'implémentation
<a name="implementation-guidance"></a>

 Donner la priorité à l'expérience dans les scénarios utilisateur critiques : lorsque vous écrivez des scénarios utilisateur critiques pour votre architecture, incluez les exigences en matière de performances, notamment en précisant à quelle vitesse devrait s'exécuter chaque scénario critique. Pour ces scénarios critiques, mettez en place d'autres parcours utilisateurs écrits à l'avance afin de vous assurer de connaître comment les narrations de l’utilisateur fonctionnent par rapport à vos exigences. 

## Ressources
<a name="resources"></a>

 **Documents connexes :** 
+  [Documentation CloudWatch](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/WhatIsCloudWatch.html) 
+  [Amazon CloudWatch Synthetics](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/CloudWatch_Synthetics_Canaries.html) 
+  [Surveillance, journalisation et performances Partenaires APN](https://aws.amazon.com/devops/partner-solutions/#_Monitoring.2C_Logging.2C_and_Performance) 
+  [Documentation X-Ray](https://docs.aws.amazon.com/xray/latest/devguide/aws-xray.html) 

 **Vidéos connexes :** 
+  [Cut through the chaos: Gain operational visibility and insight (MGT301-R1)](https://www.youtube.com/watch?v=nLYGbotqHd0) 
+  [Optimize applications through Amazon CloudWatch RUM](https://www.youtube.com/watch?v=NMaeujY9A9Y) 
+  [Demo of Amazon CloudWatch Synthetics](https://www.youtube.com/watch?v=hF3NM9j-u7I) 

 **Exemples connexes :** 
+  [Mesurer le temps de chargement des pages avec Amazon CloudWatch Synthetics](https://github.com/aws-samples/amazon-cloudwatch-synthetics-page-performance) 
+  [Client web Amazon CloudWatch RUM](https://github.com/aws-observability/aws-rum-web) 

# PERF07-BP03 Définir des indicateurs clés de performance (KPI) pour mesurer les performances de la charge de travail
<a name="perf_monitor_instances_post_launch_establish_kpi"></a>

 Identifiez les KPI qui mesurent les performances de la charge de travail de manière quantitative et qualitative. Les KPI permettent de mesurer l'état d'une charge de travail par rapport à un objectif commercial. Ils permettent aux équipes commerciales et d'ingénierie de s'aligner sur la mesure des objectifs et des stratégies et sur la façon dont ces éléments se combinent pour générer des résultats commerciaux. Les KPI doivent être revus lorsque les objectifs commerciaux, les stratégies ou les exigences des utilisateurs finaux changent.   

 Par exemple, une charge de travail de site Web peut utiliser le temps de chargement de la page comme indication des performances globales. Cette métrique serait l'un des éléments de données pris en compte pour mesurer l'expérience d'un utilisateur final. En plus d'identifier les temps limites de chargement des pages, vous devez documenter le résultat attendu ou le risque commercial si les performances ne sont pas atteintes. Un long temps de chargement des pages affecterait directement vos utilisateurs finaux, nuirait à leur expérience utilisateur et pourrait entraîner une perte de clients. Lorsque vous définissez vos seuils de KPI, combinez à la fois les points de référence en vigueur dans votre secteur et les attentes de vos utilisateurs finaux. Par exemple, si le point de référence actuel établi par votre secteur d'activité pour le chargement d'une page Web est un délai de deux secondes, mais que vos utilisateurs finaux s'attendent à ce qu'une page Web se charge dans un délai d'une seconde, vous devez prendre en compte ces deux éléments de données lors de la définition des KPI. Un autre exemple de KPI pourrait se concentrer sur la satisfaction des besoins de performances internes. Un seuil de KPI peut spécifier que la génération des rapports de vente doit se faire dans un délai d'un jour ouvrable après la génération des données de production. Ces rapports peuvent affecter directement les décisions quotidiennes et les résultats commerciaux.  

 **Résultat souhaité :** La définition de KPI implique différents départements et parties prenantes. Votre équipe doit évaluer les KPI de votre charge de travail à l'aide de données précises en temps réel et de données historiques à titre de référence et créer des tableaux de bord qui effectuent des calculs de métriques par rapport à vos données de KPI pour générer des informations opérationnelles et d'utilisation. Les KPI doivent être documentés. Les KPI et les seuils convenus qui soutiennent les objectifs et les stratégies de l'entreprise, ainsi que les métriques surveillées doivent être indiqués. Les KPI identifient les exigences de performance, sont vérifiés intentionnellement et sont fréquemment partagés et acceptés par toutes les équipes. Les risques et les compromis sont clairement identifiés et compris, et l'impact sur l'activité si les seuils de KPI ne sont pas atteints est connu. 

 **Anti-modèles courants :** 
+  Vous surveillez uniquement les métriques au niveau du système pour avoir un aperçu de votre charge de travail et ne comprenez pas les impacts commerciaux possibles. 
+  Vous supposez que vos KPI sont déjà publiés et partagés en tant que données de métriques standard. 
+  Vous définissez des KPI, mais vous ne les partagez pas avec toutes les équipes. 
+  Vous ne définissez pas des KPI quantitatifs et mesurables. 
+  Vous ne tenez pas compte des objectifs ni des stratégies de l'entreprise pour définir vos KPI. 

 

 **Avantages liés au respect de cette bonne pratique :** L'identification de métriques spécifiques qui représentent l'état de la charge de travail contribue à aligner les équipes sur leurs priorités et à définir des résultats commerciaux atteignables. Le partage de ces métriques avec tous les départements offre une visibilité et un alignement sur les seuils, les attentes et l'impact commercial. 

 **Niveau de risque exposé si cette bonne pratique n'est pas respectée :** Débit 

## Directives d'implémentation
<a name="implementation-guidance"></a>

 Tous les départements et toutes les équipes métier concernés par l'état de la charge de travail doivent contribuer à la définition des KPI. Une seule personne doit gérer la collaboration, les délais, la documentation et les informations relatives aux KPI d'une organisation. Ce responsable unique partagera souvent les objectifs et les stratégies de l'entreprise et attribuera des tâches aux parties prenantes pour qu'ils créent des KPI dans leurs départements respectifs. Une fois les KPI définis, l'équipe des opérations aide souvent à définir les métriques qui soutiendront et informeront le succès des différents KPI. Les KPI ne sont efficaces que si tous les membres de l'équipe responsables d'une charge de travail en a connaissance. 

 **Étapes d'implémentation** 

1.  Identifiez et documentez les parties prenantes de l'entreprise. 

1.  Identifiez les objectifs et les stratégies de l'entreprise. 

1.  Passez en revue les KPI qui correspondent aux objectifs et aux stratégies de votre entreprise dans votre secteur d'activité. 

1.  Passez en revue les attentes des utilisateurs finaux concernant votre charge de travail. 

1.  Définissez et documentez des KPI qui soutiennent les objectifs et les stratégies de l'entreprise. 

1.  Identifiez et documentez les stratégies de compromis approuvées pour atteindre les KPI. 

1.  Identifiez et documentez les métriques qui informeront les KPI. 

1.  Identifiez et documentez les seuils de KPI pour les niveaux de gravité ou d'alarme. 

1.  Identifiez et documentez le risque et l'impact si le KPI n'est pas atteint. 

1.  Identifiez la fréquence de révision par KPI. 

1.  Communiquer la documentation sur les KPI à toutes les équipes responsables de la charge de travail. 

** Niveau d'effort du plan d'implémentation :** Définir et communiquer les KPI implique un niveau d'effort *faible* . Cela peut généralement se faire en quelques semaines et implique de se réunir avec les parties prenantes de l'entreprise et d'examiner les objectifs, les stratégies et les métriques de la charge de travail.

## Ressources
<a name="resources"></a>

 **Documents connexes :** 
+ [Documentation CloudWatch ](http://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/WhatIsCloudWatch.html) 
+  [Surveillance, journalisation et performances Partenaires APN](https://aws.amazon.com/devops/partner-solutions/#_Monitoring.2C_Logging.2C_and_Performance) 
+ [Documentation X-Ray ](https://docs.aws.amazon.com/xray/latest/devguide/aws-xray.html) 
+  [Fonctionnement des tableaux de bord Amazon CloudWatch](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/CloudWatch_Dashboards.html?ref=wellarchitected) 
+  [KPI Quick](https://docs.aws.amazon.com/quicksight/latest/user/kpi.html) 

 **Vidéos connexes :** 
+  [AWS re:Invent 2019: Scaling up to your first 10 million users (ARC211-R)](https://www.youtube.com/watch?v=kKjm4ehYiMs&ref=wellarchitected) 
+  [Cut through the chaos: Gain operational visibility and insight (MGT301-R1)](https://www.youtube.com/watch?v=nLYGbotqHd0&ref=wellarchitected) 
+  [Élaborer un plan de surveillance](https://www.youtube.com/watch?v=OMmiGETJpfU&ref=wellarchitected) 

 

 **Exemples connexes :** 
+  [Création d'un tableau de bord avec Quick](https://github.com/aws-samples/amazon-quicksight-sdk-proserve) 

# PERF07-BP04 Utiliser la surveillance pour générer des notifications basées sur une alarme
<a name="perf_monitor_instances_post_launch_generate_alarms"></a>

 En vous servant des KPI que vous avez définis, utilisez un système de surveillance qui génère des alarmes automatiquement lorsque ces mesures sont situées en dehors des limites attendues. 

 Amazon CloudWatch peut récupérer des métriques à partir des ressources de votre architecture. Vous pouvez également récupérer et publier des métriques personnalisées pour faire apparaître des métriques d'entreprise ou des métriques dérivées. Utilisez CloudWatch ou un service de surveillance tiers pour définir des alarmes qui vous avertissent lorsque les seuils sont dépassés. Les alarmes indiquent qu'une métrique est située en dehors des limites attendues. 

 **Anti-modèles courants :** 
+  Vous comptez sur le personnel pour surveiller les métriques et réagir en cas de problème. 
+  Vous comptez uniquement sur les runbooks opérationnels, notamment lorsque des flux de travail sans serveur peuvent être déclenchés pour accomplir la même tâche. 

 **Avantages liés au respect de cette bonne pratique :** Vous pouvez définir des alarmes et automatiser des actions en fonction de seuils prédéfinis ou d'algorithmes de machine learning qui identifient les comportements anormaux dans vos métriques. Ces mêmes alarmes peuvent également déclencher des flux de travail sans serveur, ce qui peut modifier les caractéristiques de performance de votre charge de travail (par exemple, augmenter la capacité de calcul ou modifier la configuration de la base de données) 

 **Niveau de risque exposé si cette bonne pratique n'est pas respectée :** Moyenne entreprise 

## Directives d'implémentation
<a name="implementation-guidance"></a>

 Surveiller les métriques : Amazon CloudWatch peut récupérer des métriques à partir des ressources de votre architecture. Vous pouvez récupérer et publier des métriques personnalisées pour faire apparaître des métriques métiers ou des métriques dérivées. Utilisez CloudWatch ou un service de surveillance tiers pour définir des alarmes qui indiquent les dépassements de seuils. 

## Ressources
<a name="resources"></a>

 **Documents connexes :** 
+  [Documentation CloudWatch](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/WhatIsCloudWatch.html) 
+  [Surveillance, journalisation et performances Partenaires APN](https://aws.amazon.com/devops/partner-solutions/#_Monitoring.2C_Logging.2C_and_Performance) 
+  [Documentation X-Ray](https://docs.aws.amazon.com/xray/latest/devguide/aws-xray.html) 
+  [Utilisation des alarmes et des actions d'alarme dans CloudWatch](https://docs.aws.amazon.com/sdk-for-go/v1/developer-guide/cw-example-using-alarm-actions.html) 

 **Vidéos connexes :** 
+  [AWS re:Invent 2019: Scaling up to your first 10 million users (ARC211-R)](https://www.youtube.com/watch?v=kKjm4ehYiMs&ref=wellarchitected) 
+  [Cut through the chaos: Gain operational visibility and insight (MGT301-R1)](https://www.youtube.com/watch?v=nLYGbotqHd0&ref=wellarchitected) 
+  [Build a Monitoring Plan](https://www.youtube.com/watch?v=OMmiGETJpfU&ref=wellarchitected) 
+  [Using AWS Lambda with Amazon CloudWatch Events](https://www.youtube.com/watch?v=WDBD3JmpLqs) 

 **Exemples connexes :** 
+  [Personnalisation des alarmes Cloudwatch Logs](https://github.com/awslabs/cloudwatch-logs-customize-alarms) 

# PERF07-BP05 Vérifier les métriques à intervalles réguliers
<a name="perf_monitor_instances_post_launch_review_metrics_collected"></a>

 Vérifiez les métriques qui sont collectées au titre de la maintenance de routine ou en réponse à des événements ou des incidents. Utilisez ces vérifications pour identifier les métriques qui ont été essentielles pour traiter les problèmes et les métriques supplémentaires, si elles ont été suivies, qui aideraient à identifier, traiter ou empêcher les problèmes. 

 Lorsque vous répondez aux incidents ou aux événements, évaluez les métriques qui ont été utiles dans la gestion du problème et les métriques qui auraient pu aider mais ne sont pas suivies actuellement. Utilisez ce processus pour améliorer la qualité des métriques que vous collectez afin de pouvoir prévenir ou résoudre plus rapidement les incidents futurs. 

 **Anti-modèles courants :** 
+  Vous autorisez les métriques à rester dans un état d'alarme pendant longtemps. 
+  Vous créez des alarmes qui ne sont pas exploitables par un système d'automatisation. 

 **Avantages liés au respect de cette bonne pratique :** Passer en revue en permanence les métriques qui sont collectées pour vous assurer qu'elles identifient, résolvent ou préviennent correctement les problèmes. Les métriques peuvent également devenir caduques si vous les laissez dans un état d'alarme pendant longtemps. 

 **Niveau de risque exposé si cette bonne pratique n'est pas respectée :** Moyenne entreprise 

## Directives d'implémentation
<a name="implementation-guidance"></a>

 Améliorer constamment la collecte et le suivi des métriques : lorsque vous répondez aux incidents ou aux événements, évaluez les métriques qui ont été utiles dans la gestion du problème et les métriques qui auraient pu aider mais ne sont pas suivies actuellement. Utilisez cette méthode pour améliorer la qualité des métriques que vous collectez afin de pouvoir prévenir ou résoudre plus rapidement les incidents futurs. 

## Ressources
<a name="resources"></a>

 **Documents connexes :** 
+  [Documentation CloudWatch](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/WhatIsCloudWatch.html) 
+  [Collecte des métriques et des journaux des instances Amazon EC2 et serveurs sur site avec l'agent CloudWatch](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/Install-CloudWatch-Agent.html?ref=wellarchitected) 
+  [Surveillance, journalisation et performances Partenaires APN](https://aws.amazon.com/devops/partner-solutions/#_Monitoring.2C_Logging.2C_and_Performance) 
+  [Documentation X-Ray](https://docs.aws.amazon.com/xray/latest/devguide/aws-xray.html) 

 **Vidéos connexes :** 
+  [Cut through the chaos: Gain operational visibility and insight (MGT301-R1)](https://www.youtube.com/watch?v=nLYGbotqHd0) 
+  [Application Performance Management on AWS](https://www.youtube.com/watch?v=5T4stR-HFas&ref=wellarchitected) 
+  [Build a Monitoring Plan](https://www.youtube.com/watch?v=OMmiGETJpfU&ref=wellarchitected) 

 **Exemples connexes :** 
+  [Création d'un tableau de bord avec Quick](https://github.com/aws-samples/amazon-quicksight-sdk-proserve) 
+  [Niveau 100 : surveillance avec les tableaux de bord CloudWatch](https://wellarchitectedlabs.com/performance-efficiency/100_labs/100_monitoring_with_cloudwatch_dashboards/) 

# PERF07-BP06 Surveillance et alarmes proactives
<a name="perf_monitor_instances_post_launch_proactive"></a>

 Utilisez les KPI en combinaison avec des systèmes de surveillance et d'alarme pour traiter de manière proactive les problèmes liés aux performances. Utilisez des alarmes pour déclencher des actions automatisées afin de corriger les problèmes dans la mesure du possible. Faites remonter l'alarme aux personnes qui peuvent répondre si une réponse automatique n'est pas possible. Par exemple, vous pourriez disposer d'un système capable de prédire les valeurs attendues de KPI lorsqu'elles dépassent certains seuils d'alarme. Vous pouvez aussi disposer d’un outil capable d'arrêter ou de restaurer automatiquement des déploiements si les valeurs des KPI dépassent celles attendues. 

 Mettez en place des processus qui rendent visibles les performances pendant que votre charge de travail est en cours d'exécution. Créez des tableaux de bord de surveillance et établissez des normes de référence pour les attentes en matière de performances pour déterminer si les performances de la charge de travail sont optimales. 

 **Anti-modèles courants :** 
+  Vous autorisez uniquement le personnel des opérations à apporter des modifications opérationnelles à la charge de travail. 
+  Vous confiez toutes les activités de filtre des alarmes à l'équipe des opérations sans correction proactive. 

 **Avantages liés au respect de cette bonne pratique :** La correction proactive des actions d'alarme permet au personnel d'assistance de se concentrer sur les éléments qui ne sont pas exploitables automatiquement. Cela garantit que le personnel des opérations ne soit pas submergé par toutes les alarmes et se concentre uniquement sur les alarmes critiques. 

 **Niveau de risque exposé si cette bonne pratique n'est pas respectée :** Faible 

## Directives d'implémentation
<a name="implementation-guidance"></a>

 Surveiller les performances au cours des opérations : mettez en œuvre des processus garantissant une visibilité des performances lors de l'exécution de votre charge de travail. Créez des tableaux de bord de surveillance et établissez une référence pour les attentes en matière de performances. 

## Ressources
<a name="resources"></a>

 **Documents connexes :** 
+  [Documentation CloudWatch](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/WhatIsCloudWatch.html) 
+  [Surveillance, journalisation et performances Partenaires APN](https://aws.amazon.com/devops/partner-solutions/#_Monitoring.2C_Logging.2C_and_Performance) 
+  [Documentation X-Ray](https://docs.aws.amazon.com/xray/latest/devguide/aws-xray.html) 
+  [Utilisation des alarmes et des actions d'alarme dans CloudWatch](https://docs.aws.amazon.com/sdk-for-go/v1/developer-guide/cw-example-using-alarm-actions.html) 

 **Vidéos connexes :** 
+  [Cut through the chaos: Gain operational visibility and insight (MGT301-R1)](https://www.youtube.com/watch?v=nLYGbotqHd0) 
+  [Application Performance Management on AWS](https://www.youtube.com/watch?v=5T4stR-HFas&ref=wellarchitected) 
+  [Build a Monitoring Plan](https://www.youtube.com/watch?v=OMmiGETJpfU&ref=wellarchitected) 
+  [Using AWS Lambda with Amazon CloudWatch Events](https://www.youtube.com/watch?v=WDBD3JmpLqs) 

 **Exemples connexes :** 
+  [Personnalisation des alarmes Cloudwatch Logs](https://github.com/awslabs/cloudwatch-logs-customize-alarms) 