# Préparation
Préparation

**Topics**
+ [

# OPS 4. Comment mettre en œuvre l’observabilité dans votre charge de travail ?
](ops-04.md)
+ [

# OPS 5. Comment réduire les défauts, faciliter les corrections et améliorer le flux dans la production ?
](ops-05.md)
+ [

# OPS 6. Comment réduire les risques liés au déploiement ?
](ops-06.md)
+ [

# OPS 7. Comment savoir si vous êtes prêt à assurer une charge de travail ?
](ops-07.md)

# OPS 4. Comment mettre en œuvre l’observabilité dans votre charge de travail ?


Intégrez l’observabilité à votre charge de travail afin de comprendre son état et de prendre des décisions basées sur les données en fonction des exigences de l’entreprise.

**Topics**
+ [

# OPS04-BP01 Identifier les indicateurs de performance clés
](ops_observability_identify_kpis.md)
+ [

# OPS04-BP02 Implémenter la télémétrie des applications
](ops_observability_application_telemetry.md)
+ [

# OPS04-BP03 Implémenter la télémétrie de l'expérience utilisateur
](ops_observability_customer_telemetry.md)
+ [

# OPS04-BP04 Mise en œuvre de la télémétrie des dépendances
](ops_observability_dependency_telemetry.md)
+ [

# OPS04-BP05 Mettre en œuvre le traçage distribué
](ops_observability_dist_trace.md)

# OPS04-BP01 Identifier les indicateurs de performance clés
OPS04-BP01 Identifier les indicateurs de performance clés

 La mise en œuvre de l’observabilité dans votre charge de travail commence par la compréhension de son état et par la prise de décisions basées sur les données en fonction des exigences de l’entreprise. L'un des moyens les plus efficaces de garantir l'alignement entre les activités de surveillance et les objectifs commerciaux consiste à définir et à suivre des indicateurs de performance clés (KPIs). 

 **Résultat escompté :** pratiques d’observabilité efficaces qui sont étroitement alignées sur les objectifs commerciaux, garantissant que les efforts de surveillance sont toujours au service de résultats commerciaux tangibles. 

 **Anti-modèles courants :** 
+  Non défini KPIs : le fait de travailler sans clarté KPIs peut entraîner une surveillance trop importante ou insuffisante, ce qui peut entraîner l'absence de signaux vitaux. 
+  Statique KPIs : ne pas revoir ou affiner au KPIs fur et à mesure de l'évolution de la charge de travail ou des objectifs commerciaux. 
+  Désalignement : se concentrer sur des métriques techniques qui ne sont pas directement corrélées aux résultats commerciaux ou qui sont plus difficiles à corréler aux problèmes réels. 

 **Avantages liés au respect de cette bonne pratique :** 
+  Facilité d'identification des problèmes : les entreprises identifient KPIs souvent les problèmes plus clairement que les indicateurs techniques. Une baisse d'activité KPI permet d'identifier un problème plus efficacement que de passer au crible de nombreux indicateurs techniques. 
+  Cohérence des activités : garantit que les activités de surveillance soutiennent directement les objectifs commerciaux. 
+  Efficacité : la priorité est donnée à la surveillance des ressources et l’attention est concentrée sur les métriques déterminantes. 
+  Proactivité : identifiez et traitez les problèmes avant qu’ils n’aient des implications commerciales plus larges. 

 **Niveau d’exposition au risque si cette bonne pratique n’est pas respectée :** élevé 

## Directives d’implémentation
Directives d’implémentation

 Pour définir efficacement la charge de travail KPIs : 

1.  **Commencement par les résultats commerciaux :** avant de vous plonger dans les métriques, déterminez les résultats commerciaux souhaités. S’agit-il d’une augmentation des ventes, d’un engagement plus élevé des utilisateurs ou d’une réduction des temps de réponse ? 

1.  **Corrélation des métriques techniques avec les objectifs commerciaux :** les métriques techniques n’ont pas toutes un impact direct sur les résultats commerciaux. Identifiez ceux qui le font, mais il est souvent plus simple d'identifier un problème dans le cadre d'une entrepriseKPI. 

1.  **Utilisez [Amazon CloudWatch](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/WhatIsCloudWatch.html) :** Employ CloudWatch pour définir et surveiller les indicateurs qui représentent votreKPIs. 

1.  **Révision et mise à jour régulières KPIs :** au fur et à mesure de l'évolution de votre charge de travail et de votre activité, restez KPIs pertinent. 

1.  **Impliquer les parties prenantes :** Impliquer les équipes techniques et commerciales dans la définition et la révisionKPIs. 

 **Niveau d’effort du plan d’implémentation :** moyen 

## Ressources
Ressources

 **Bonnes pratiques associées :** 
+ [OPS04-BP02 Implémenter la télémétrie des applications](ops_observability_application_telemetry.md)
+ [OPS04-BP03 Implémenter la télémétrie de l'expérience utilisateur](ops_observability_customer_telemetry.md)
+ [OPS04-BP04 Mise en œuvre de la télémétrie des dépendances](ops_observability_dependency_telemetry.md)
+ [OPS04-BP05 Mettre en œuvre le traçage distribué](ops_observability_dist_trace.md)

 **Documents connexes :** 
+ [AWS Meilleures pratiques en matière d'observabilité](https://aws-observability.github.io/observability-best-practices/)
+ [ CloudWatch Guide de l'utilisateur](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/WhatIsCloudWatch.html)
+ [AWS Cours de renforcement des compétences en observabilité](https://explore.skillbuilder.aws/learn/course/external/view/elearning/14688/aws-observability)

 **Vidéos connexes :** 
+ [Developing an observability strategy](https://www.youtube.com/watch?v=Ub3ATriFapQ)

 **Exemples connexes :** 
+  [Un atelier sur l’observabilité](https://catalog.workshops.aws/observability/en-US) 

# OPS04-BP02 Implémenter la télémétrie des applications
OPS04-BP02 Implémenter la télémétrie des applications

 La télémétrie de l’application est la pierre angulaire de l’observabilité de votre charge de travail. Il est essentiel de diffuser des données télémétriques fournissant des informations exploitables sur l’état de votre application et sur son taux de réussite par rapport aux résultats techniques et commerciaux. Qu'il s'agisse de résoudre des problèmes, de mesurer l'impact d'une nouvelle fonctionnalité ou de garantir l'alignement sur les indicateurs de performance clés de l'entreprise (KPIs), la télémétrie des applications vous permet de créer, d'exploiter et de faire évoluer votre charge de travail. 

 Les métriques, les journaux et les données de suivi constituent les trois principaux piliers de l’observabilité. Ils servent d’outils de diagnostic qui décrivent l’état de votre application. Au fil du temps, ils contribuent à créer des points de référence et à identifier les anomalies. Cependant, pour garantir l'alignement entre les activités de surveillance et les objectifs commerciaux, il est essentiel de les définir et de les surveillerKPIs. KPIsLes entreprises facilitent souvent l'identification des problèmes par rapport aux seuls indicateurs techniques. 

 D'autres types de télémétrie, tels que la surveillance des utilisateurs réels (RUM) et les transactions synthétiques, complètent ces sources de données principales. RUMfournit des informations sur les interactions des utilisateurs en temps réel, tandis que les transactions synthétiques simulent les comportements potentiels des utilisateurs, aidant ainsi à détecter les goulets d'étranglement avant que les utilisateurs réels ne les rencontrent. 

 **Résultat escompté :** obtenez des informations exploitables sur les performances de votre charge de travail. Ces informations vous permettront de prendre des décisions proactives concernant l’optimisation des performances, d’accroître la stabilité de la charge de travail, de rationaliser les processus CI/CD et d’utiliser efficacement les ressources. 

 **Anti-modèles courants :** 
+  **Observabilité incomplète :** le fait de négliger d’intégrer l’observabilité à chaque niveau de la charge de travail entraîne des angles morts susceptibles de masquer des informations essentielles sur les performances et le comportement du système. 
+  **Vue fragmentée des données :** lorsque les données sont dispersées entre plusieurs outils et systèmes, il devient difficile de conserver une vision globale de l’état et des performances de la charge de travail. 
+  **Problèmes signalés par les utilisateurs :** cela indique que la détection proactive des problèmes par le biais de la télémétrie et de la KPI surveillance des activités fait défaut. 

 **Avantages liés au respect de cette bonne pratique :** 
+  Prise de **décision éclairée :** grâce aux informations issues de la télémétrie et des activités commercialesKPIs, vous pouvez prendre des décisions basées sur les données. 
+  **Efficacité opérationnelle améliorée :** l’utilisation des ressources axée sur les données est source de rentabilité. 
+  **Stabilité accrue de la charge de travail :** détection et résolution plus rapides des problèmes, ce qui améliore la disponibilité. 
+  **Processus CI/CD rationalisés :** les informations issues des données de télémétrie facilitent l’affinement des processus et la livraison fiable du code. 

 **Niveau d’exposition au risque si cette bonne pratique n’est pas respectée :** élevé 

## Directives d’implémentation
Directives d’implémentation

 Pour implémenter la télémétrie des applications pour votre charge de travail, utilisez AWS des services tels qu'[Amazon CloudWatch](https://aws.amazon.com/cloudwatch/) et. [AWS X-Ray](https://aws.amazon.com/xray/) Amazon CloudWatch fournit une suite complète d'outils de surveillance, qui vous permet d'observer vos ressources et vos applications dans AWS et sur site. Il collecte, suit et analyse les métriques, consolide et surveille les données des journaux, et répond à l’évolution de vos ressources, vous permettant ainsi de mieux comprendre le fonctionnement de votre charge de travail. En tandem, vous AWS X-Ray permet de suivre, d'analyser et de déboguer vos applications, ce qui vous permet de mieux comprendre le comportement de votre charge de travail. Des fonctionnalités telles que les cartes de service, les distributions de latence et les chronologies de suivi AWS X-Ray fournissent des informations sur les performances de votre charge de travail et les obstacles qui l'affectent. 

### Étapes d’implémentation
Étapes d’implémentation

1.  **Identification des données à collecter :** déterminez les métriques, les journaux et les données de suivi essentiels qui fourniraient des informations substantielles sur l’état, les performances et le comportement de votre charge de travail. 

1.  **Déployez l'[CloudWatchagent](https://aws.amazon.com/cloudwatch/) :** l' CloudWatch agent joue un rôle essentiel dans l'obtention de métriques et de journaux du système et des applications à partir de votre charge de travail et de son infrastructure sous-jacente. L' CloudWatch agent peut également être utilisé pour collecter OpenTelemetry ou radiographier des traces et les envoyer à X-Ray. 

1.  **Mettez en œuvre la détection des anomalies pour les journaux et les métriques :** utilisez la détection [CloudWatch des anomalies des journaux et la détection CloudWatch](https://docs.aws.amazon.com/AmazonCloudWatch/latest/logs/LogsAnomalyDetection.html) [des anomalies des métriques](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/CloudWatch_Anomaly_Detection.html) pour identifier automatiquement les activités inhabituelles dans les opérations de votre application. Ces outils utilisent des algorithmes de machine learning pour détecter les anomalies et émettre des alertes en cas d’anomalie, ce qui améliore vos capacités de surveillance et accélère le temps de réponse en cas de perturbations ou de menaces de sécurité potentielles. Configurez ces fonctionnalités pour gérer de manière proactive l’intégrité et la sécurité des applications. 

1.  **Sécurisez les données de journal sensibles :** utilisez la [protection des données Amazon CloudWatch Logs](https://docs.aws.amazon.com/AmazonCloudWatch/latest/logs/mask-sensitive-log-data.html) pour masquer les informations sensibles contenues dans vos journaux. Cette fonctionnalité permet de préserver la confidentialité et la conformité grâce à la détection automatique et au masquage des données sensibles avant leur accès. Mettez en œuvre le masquage des données pour gérer et protéger en toute sécurité les informations sensibles telles que les informations personnelles identifiables (PII). 

1.  **Définissez et surveillez les activités KPIs :** établissez [des indicateurs personnalisés](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/publishingMetrics.html) qui correspondent aux [résultats de votre entreprise](https://aws-observability.github.io/observability-best-practices/guides/operational/business/monitoring-for-business-outcomes/). 

1.  **Instrumentez votre application avec AWS X-Ray :** Outre le déploiement de l' CloudWatchagent, il est essentiel d'[instrumenter votre application](https://docs.aws.amazon.com/xray/latest/devguide/xray-instrumenting-your-app.html) pour émettre des données de trace. Ce processus peut fournir des informations supplémentaires sur le comportement et les performances de votre charge de travail. 

1.  **Standardisation de la collecte de données dans l’ensemble de votre application :** standardisez les pratiques de collecte de données dans l’ensemble de votre application. L’uniformité facilite la corrélation et l’analyse des données, fournissant ainsi une vue complète du comportement de votre application. 

1.  **Mettez en œuvre l'observabilité entre comptes :** améliorez l'efficacité de la surveillance sur plusieurs comptes grâce à l'observabilité entre comptes Comptes AWS [Amazon CloudWatch .](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/CloudWatch-Unified-Cross-Account.html) Grâce à cette fonctionnalité, vous pouvez consolider les métriques, les journaux et les alarmes de différents comptes en une seule vue, ce qui simplifie la gestion et améliore les temps de réponse aux problèmes identifiés dans l' AWS environnement de votre entreprise. 

1.  **Analysez les données et agissez en conséquence :** une fois que la collecte et la normalisation des données sont en place, utilisez [Amazon CloudWatch](https://aws.amazon.com/cloudwatch/features/) pour l'analyse des métriques et des journaux, ainsi que [AWS X-Ray](https://aws.amazon.com/xray/features/)pour l'analyse des traces. Une telle analyse peut fournir des informations cruciales sur l’état, les performances et le comportement de votre charge de travail, orientant ainsi votre processus décisionnel. 

 **Niveau d’effort du plan d’implémentation :** élevé 

## Ressources
Ressources

 **Bonnes pratiques associées :** 
+  [OPS04-BP01 Définir la charge de travail KPIs](https://docs.aws.amazon.com/wellarchitected/latest/operational-excellence-pillar/ops_observability_identify_kpis.html) 
+  [OPS04-BP03 Implémenter la télémétrie de l'activité des utilisateurs](https://docs.aws.amazon.com/wellarchitected/latest/operational-excellence-pillar/ops_observability_customer_telemetry.html) 
+  [OPS04-BP04 Implémenter la télémétrie des dépendances](https://docs.aws.amazon.com/wellarchitected/latest/operational-excellence-pillar/ops_observability_dependency_telemetry.html) 
+  [OPS04-BP05 Mettre en œuvre la traçabilité des transactions](https://docs.aws.amazon.com/wellarchitected/latest/operational-excellence-pillar/ops_observability_dist_trace.html) 

 **Documents connexes :** 
+  [Bonnes pratiques AWS en matière d’observabilité](https://aws-observability.github.io/observability-best-practices/) 
+  [Guide de l’utilisateur CloudWatch](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/WhatIsCloudWatch.html) 
+  [AWS X-Ray Manuel du développeur](https://docs.aws.amazon.com/xray/latest/devguide/aws-xray.html) 
+  [Instrumentation des systèmes distribués au profit de la visibilité opérationnelle](https://aws.amazon.com/builders-library/instrumenting-distributed-systems-for-operational-visibility) 
+  [Cours de renforcement des compétences en observabilitéAWS](https://explore.skillbuilder.aws/learn/course/external/view/elearning/14688/aws-observability) 
+  [Nouveautés d'Amazon CloudWatch](https://aws.amazon.com/about-aws/whats-new/management-and-governance/?whats-new-content.sort-by=item.additionalFields.postDateTime&whats-new-content.sort-order=desc&awsf.whats-new-products=general-products%23amazon-cloudwatch) 
+  [Quoi de neuf avec AWS X-Ray](https://aws.amazon.com/about-aws/whats-new/developer-tools/?whats-new-content.sort-by=item.additionalFields.postDateTime&whats-new-content.sort-order=desc&awsf.whats-new-products=general-products%23aws-x-ray) 

 **Vidéos connexes :** 
+  [AWS re:Invent 2022 - Meilleures pratiques en matière d'observabilité sur Amazon](https://youtu.be/zZPzXEBW4P8) 
+  [AWS re:Invent 2022 - Élaboration d'une stratégie d'observabilité](https://youtu.be/Ub3ATriFapQ) 

 **Exemples associés :** 
+  [Un atelier sur l’observabilité](https://catalog.workshops.aws/observability) 
+  [AWS Bibliothèque de solutions : surveillance des applications avec Amazon CloudWatch](https://aws.amazon.com/solutions/implementations/application-monitoring-with-cloudwatch) 

# OPS04-BP03 Implémenter la télémétrie de l'expérience utilisateur
OPS04-BP03 Implémenter la télémétrie de l'expérience utilisateur

 Il est essentiel d’obtenir des informations approfondies sur les expériences des clients et leurs interactions avec votre application. La surveillance des utilisateurs réels (RUM) et les transactions synthétiques constituent de puissants outils à cette fin. RUMfournit des données sur les interactions réelles des utilisateurs, offrant une perspective non filtrée de la satisfaction des utilisateurs, tandis que les transactions synthétiques simulent les interactions des utilisateurs, aidant à détecter les problèmes potentiels avant même qu'ils n'affectent les utilisateurs réels. 

 **Résultat escompté :**une vision globale de l’expérience client, une détection proactive des problèmes et une optimisation des interactions avec les utilisateurs pour proposer des expériences numériques fluides. 

 **Anti-modèles courants :** 
+  Applications sans véritable surveillance des utilisateurs (RUM) : 
  +  Détection différée des problèmes : sans celaRUM, vous ne vous rendrez peut-être pas compte de l'existence de problèmes ou de problèmes de performances tant que les utilisateurs ne se seront pas plaints. Cette approche réactive peut entraîner l’insatisfaction des clients. 
  +  Manque d'informations sur l'expérience utilisateur : si vous RUM ne l'utilisez pas, vous perdez des données cruciales qui montrent comment les utilisateurs réels interagissent avec votre application, ce qui limite votre capacité à optimiser l'expérience utilisateur. 
+  Applications sans transactions synthétiques : 
  +  Cas marginaux manqués : les transactions synthétiques vous aident à tester des chemins et des fonctions qui ne sont pas toujours fréquemment utilisés par les utilisateurs ordinaires, mais qui sont essentiels à certaines fonctions commerciales. Sans ces transactions synthétiques, ces chemins pourraient mal fonctionner et passer inaperçus. 
  +  Recherche de problèmes lorsque l’application n’est pas utilisée : des tests synthétiques réguliers permettent de simuler les situations où les utilisateurs réels n’interagissent pas activement avec votre application, garantissant ainsi le bon fonctionnement du système. 

 **Avantages liés au respect de cette bonne pratique :** 
+  Détection proactive des problèmes : identifiez et résolvez les problèmes potentiels avant qu’ils n’affectent les utilisateurs réels. 
+  Expérience utilisateur optimisée : le feedback continu RUM permet d'affiner et d'améliorer l'expérience utilisateur globale. 
+  Informations sur les performances de l’appareil et du navigateur : comprenez le fonctionnement de votre application sur différents appareils et navigateurs, afin de l’affiner davantage. 
+  Flux de travail validés : des transactions synthétiques régulières garantissent que les fonctionnalités de base et les chemins critiques restent opérationnels et efficaces. 
+  Performances améliorées des applications : exploitez les informations recueillies à partir de données sur les utilisateurs réels pour améliorer la réactivité et la fiabilité des applications. 

 **Niveau d’exposition au risque si cette bonne pratique n’est pas respectée :** élevé 

## Directives d’implémentation
Directives d’implémentation

 Pour exploiter RUM et synthétiser les transactions à des fins de télémétrie de l'activité des utilisateurs, AWS propose des services tels qu'Amazon et [ CloudWatch RUMAmazon CloudWatch ](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/CloudWatch-RUM.html) [Synthetics](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/CloudWatch_Synthetics_Canaries.html). Les métriques, les journaux et les données de suivi, associés aux données d’activité des utilisateurs, fournissent une vue complète de l’état de fonctionnement de l’application et de l’expérience utilisateur. 

### Étapes d’implémentation
Étapes d’implémentation

1.  **Déployez Amazon CloudWatch RUM :** intégrez votre application CloudWatch RUM pour collecter, analyser et présenter des données utilisateur réelles. 

   1.  Utilisez la [CloudWatch RUM JavaScript bibliothèque](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/CloudWatch-RUM.html) pour l'intégrer RUM à votre application. 

   1.  Configurez des tableaux de bord pour visualiser et surveiller les données sur les utilisateurs réels. 

1.  **Configurer CloudWatch Synthetics** : créez des canaris, ou des routines scriptées, qui simulent les interactions des utilisateurs avec votre application. 

   1.  Définissez les flux de travail et les chemins d’application critiques. 

   1.  Concevez des canaris à l'aide [CloudWatch de scripts Synthetics](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/CloudWatch_Synthetics_Canaries.html) pour simuler les interactions des utilisateurs sur ces trajectoires. 

   1.  Planifiez et surveillez les scripts canary pour qu’ils fonctionnent à des intervalles spécifiés, afin de garantir des contrôles de performance cohérents. 

1.  **Analysez les données et agissez en fonction de celles-ci :** utilisez les données issues RUM des transactions synthétiques pour obtenir des informations et prendre des mesures correctives lorsque des anomalies sont détectées. Utilisez des CloudWatch tableaux de bord et des alarmes pour rester informé. 

 **Niveau d’effort du plan d’implémentation :** moyen 

## Ressources
Ressources

 **Bonnes pratiques associées :** 
+  [OPS04-BP01 Identifier les indicateurs de performance clés](ops_observability_identify_kpis.md) 
+  [OPS04-BP02 Implémenter la télémétrie des applications](ops_observability_application_telemetry.md) 
+  [OPS04-BP04 Mise en œuvre de la télémétrie des dépendances](ops_observability_dependency_telemetry.md) 
+  [OPS04-BP05 Mettre en œuvre le traçage distribué](ops_observability_dist_trace.md) 

 **Documents connexes :** 
+ [ CloudWatch RUMGuide Amazon](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/CloudWatch-RUM.html)
+ [Guide Amazon CloudWatch Synthetics](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/CloudWatch_Synthetics_Canaries.html)

 **Vidéos connexes :** 
+ [Optimisez les applications grâce aux informations sur les utilisateurs finaux avec Amazon CloudWatch RUM](https://www.youtube.com/watch?v=NMaeujY9A9Y)
+ [AWS sur Air ft. Surveillance des utilisateurs réels pour Amazon CloudWatch](https://www.youtube.com/watch?v=r6wFtozsiVE)

 **Exemples connexes :** 
+ [Un atelier sur l’observabilité](https://catalog.workshops.aws/observability/en-US/intro)
+ [Référentiel Git pour Amazon CloudWatch RUM Web Client](https://github.com/aws-observability/aws-rum-web)
+ [Utilisation d'Amazon CloudWatch Synthetics pour mesurer le temps de chargement des pages](https://github.com/aws-samples/amazon-cloudwatch-synthetics-page-performance)

# OPS04-BP04 Mise en œuvre de la télémétrie des dépendances
OPS04-BP04 Mise en œuvre de la télémétrie des dépendances

 La télémétrie des dépendances est essentielle pour surveiller l’état et les performances des services et composants externes sur lesquels repose votre charge de travail. Elle fournit des informations précieuses sur l’accessibilité, les délais d’attente et d’autres événements critiques liés aux dépendances comme le DNS, les bases de données ou les API tierces. Lorsque vous instrumentez votre application de sorte à émettre des métriques, des journaux et des données de suivi concernant ces dépendances, vous identifiez plus facilement les goulets d’étranglement potentiels, les problèmes de performances ou les défaillances susceptibles d’avoir un impact sur votre charge de travail. 

 **Résultat escompté :** assurez-vous que les dépendances sur lesquelles repose votre charge de travail fonctionnent comme prévu, ce qui vous permet de résoudre les problèmes de manière proactive et de garantir des performances de charge de travail optimales. 

 **Anti-modèles courants :** 
+  **Omission des dépendances externes :** se concentrer uniquement sur les métriques internes des applications tout en négligeant les métriques liées aux dépendances externes. 
+  **Absence de surveillance proactive :** attendre l’apparition de problèmes au lieu de surveiller en permanence l’état et les performances des dépendances. 
+  **Surveillance cloisonnée :** utiliser des outils de surveillance divers et variés qui peuvent donner lieu à des visions fragmentées et incohérentes de l’état des dépendances. 

 **Avantages liés au respect de cette bonne pratique :** 
+  **Fiabilité améliorée de la charge de travail :** en garantissant que les dépendances externes sont constamment disponibles et fonctionnent de manière optimale. 
+  **Détection et résolution plus rapides des problèmes :** en identifiant et en résolvant de manière proactive les problèmes liés aux dépendances avant qu’ils n’affectent la charge de travail. 
+  **Vue globale :** grâce à une visibilité complète des composants internes et externes qui influencent l’état de la charge de travail. 
+  **Meilleure capacité de mise à l’échelle de la charge de travail :** grâce à une meilleure compréhension des limites de la capacité de mise à l’échelle et des caractéristiques de performance des dépendances externes. 

 **Niveau d’exposition au risque si cette bonne pratique n’est pas respectée :** élevé 

## Directives d’implémentation
Directives d’implémentation

 Mettez en œuvre la télémétrie des dépendances en commençant par identifier les services, l’infrastructure et les processus sur lesquels repose votre charge de travail. Quantifiez ce à quoi les conditions favorables ressemblent lorsque ces dépendances fonctionnent comme prévu, puis déterminez les données nécessaires pour les mesurer. Ces informations vous permettront de créer des tableaux de bord et des alertes qui fourniront à vos équipes opérationnelles des informations sur l’état de ces dépendances. Utilisez les outils AWS pour découvrir et quantifier les impacts lorsque les dépendances ne répondent pas aux besoins. Revoyez continuellement votre stratégie en tenant compte de l’évolution des priorités, des objectifs et des connaissances acquises. 

### Étapes d’implémentation
Étapes d’implémentation

 Pour implémenter efficacement la télémétrie des dépendances : 

1.  **Identification des dépendances externes :** collaborez avec les parties prenantes pour identifier les dépendances externes sur lesquelles repose votre charge de travail. Les dépendances externes peuvent inclure des services tels que des bases de données externes, des API tierces, des routes de connectivité réseau vers d’autres environnements et des services DNS. La première étape à suivre pour assurer l’efficacité de la télémétrie des dépendances consiste à comprendre parfaitement ce que sont ces dépendances. 

1.  **Élaboration d’une stratégie de suivi :** une fois que vous avez une idée précise de vos dépendances externes, élaborez une stratégie de surveillance qui leur est adaptée. Cela implique de comprendre le caractère critique de chaque dépendance, son comportement attendu et tous les contrats ou tous les objectifs de niveau de service associés (SLA ou SLT). Configurez des alertes proactives pour vous informer des changements d’état ou des écarts de performance. 

1.  **Utilisation de la [surveillance du réseau](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/CloudWatch-Network-Monitoring-Sections.html) :** utilisez [Internet Monitor](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/CloudWatch-InternetMonitor.html) et [Network Monitor](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/what-is-network-monitor.html), qui fournissent des informations complètes sur l’état mondial de l’Internet et du réseau. Ces outils vous aident à comprendre les pannes, les interruptions ou les dégradations de performances qui affectent vos dépendances externes et à y répondre. 

1.  **Restez informé avec [AWS Health](https://aws.amazon.com/premiumsupport/technology/aws-health/) :** AWS Health est la source d’informations faisant autorité sur l’intégrité de vos ressources AWS Cloud. Utilisez AWS Health pour visualiser et recevoir des notifications sur les événements de service en cours et les changements à venir, tels que les événements de cycle de vie planifiés, afin que vous puissiez prendre des mesures pour atténuer les impacts. 

   1.  [Créez des notifications d’événements AWS Health spécialement adaptées](https://docs.aws.amazon.com/health/latest/ug/user-notifications.html) aux e-mails et aux canaux de discussion via [Notifications des utilisateurs AWS](https://docs.aws.amazon.com/notifications/latest/userguide/what-is-service.html) et intégrez-les de manière programmatique à [vos outils de surveillance et d’alerte via Amazon EventBridge](https://docs.aws.amazon.com/health/latest/ug/cloudwatch-events-health.html) ou l’[API AWS Health](https://docs.aws.amazon.com/health/latest/APIReference/Welcome.html). 

   1.  Planifiez et suivez l’évolution des événements d’intégrité qui nécessitent une action en intégrant des outils de gestion des modifications ou des outils ITSM (tels que [Jira](https://docs.aws.amazon.com/smc/latest/ag/cloud-sys-health.html) ou [ServiceNow](https://docs.aws.amazon.com/smc/latest/ag/sn-aws-health.html)) que vous utilisez peut-être déjà via Amazon EventBridge ou l’API AWS Health. 

   1.  Si vous utilisez AWS Organizations, activez la [vue de l’organisation pour AWS Health](https://docs.aws.amazon.com/health/latest/ug/aggregate-events.html) afin d’agréger les événements AWS Health sur l’ensemble des comptes. 

1.  **Instrumentation de votre application avec [AWS X-Ray](https://aws.amazon.com/xray/) :** AWS X-Ray fournit des informations sur les performances des applications et de leurs dépendances sous-jacentes. En suivant les requêtes du début à la fin, vous pouvez identifier les goulets d’étranglement ou les défaillances des services ou composants externes sur lesquels repose votre application. 

1.  **Utilisation d’[Amazon DevOps Guru](https://aws.amazon.com/devops-guru/) :** ce service basé sur le machine learning identifie les problèmes opérationnels, prédit quand des problèmes critiques peuvent survenir et recommande des mesures spécifiques à prendre. Il s’agit d’un outil inestimable qui permet de mieux comprendre les dépendances et de déterminer qu’elles ne sont pas à l’origine de problèmes opérationnels. 

1.  **Surveillance régulière :** surveillez en permanence les métriques et les journaux liés aux dépendances externes. Configurez des alertes en cas de comportement inattendu ou de dégradation des performances. 

1.  **Validation après les modifications :** chaque fois qu’une dépendance externe est mise à jour ou modifiée, validez ses performances et vérifiez qu’elle correspond aux exigences de votre application. 

 **Niveau d’effort du plan d’implémentation :** moyen 

## Ressources
Ressources

 **Bonnes pratiques associées :** 
+  [OPS04-BP01 Définition des indicateurs de rendement clés de la charge de travail](https://docs.aws.amazon.com/wellarchitected/latest/operational-excellence-pillar/ops_observability_identify_kpis.html) 
+  [OPS04-BP02 Mise en œuvre de la télémétrie de l’application](https://docs.aws.amazon.com/wellarchitected/latest/operational-excellence-pillar/ops_observability_application_telemetry.html) 
+  [OPS04-BP03 Mise en œuvre de la télémétrie pour l’activité des utilisateurs](https://docs.aws.amazon.com/wellarchitected/latest/operational-excellence-pillar/ops_observability_customer_telemetry.html) 
+  [OPS04-BP05 Mise en œuvre de la traçabilité des transactions](https://docs.aws.amazon.com/wellarchitected/latest/operational-excellence-pillar/ops_observability_dist_trace.html) 
+  [OP08-BP04 Création d’alertes exploitables](https://docs.aws.amazon.com/wellarchitected/latest/operational-excellence-pillar/ops_workload_observability_create_alerts.html) 

 **Documents connexes :** 
+  [Guide de l’utilisateur d’Amazon Personal Tableau de bord Health](https://docs.aws.amazon.com/health/latest/ug/what-is-aws-health.html) 
+  [Guide de l’utilisateur d’AWS Internet Monitor](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/CloudWatch-InternetMonitor.html) 
+  [Guide du développeur AWS X-Ray](https://docs.aws.amazon.com/xray/latest/devguide/aws-xray.html) 
+  [Guide de l’utilisateur d’AWS DevOps Guru](https://docs.aws.amazon.com/devops-guru/latest/userguide/welcome.html) 

 **Vidéos connexes :** 
+  [Visibility into how internet issues impact app performance](https://www.youtube.com/watch?v=Kuc_SG_aBgQ) 
+  [Présentation d’Amazon DevOps Guru](https://www.youtube.com/watch?v=2uA8q-8mTZY) 
+  [Manage resource lifecycle events at scale with AWS Health](https://www.youtube.com/watch?v=VoLLNL5j9NA) 

 **Exemples connexes :** 
+  [AWS Health Aware](https://github.com/aws-samples/aws-health-aware/) 
+  [Utilisation du filtrage basé sur des balises pour gérer la surveillance et les alertes AWS Health à l’échelle](https://aws.amazon.com/blogs/mt/using-tag-based-filtering-to-manage-health-monitoring-and-alerting-at-scale/) 

# OPS04-BP05 Mettre en œuvre le traçage distribué
OPS04-BP05 Mettre en œuvre le traçage distribué

 Le suivi distribué permet de surveiller et de visualiser les requêtes lorsqu’elles traversent les différents composants d’un système distribué. En capturant les données de suivi provenant de plusieurs sources et en les analysant dans une vue unifiée, les équipes peuvent mieux comprendre le flux des requêtes, les endroits où les goulots d’étranglement ont lieu et les domaines dans lesquels les efforts d’optimisation doivent se concentrer. 

 **Résultat escompté :** bénéficiez d’une vue globale des requêtes circulant dans votre système distribué, ce qui permet un débogage précis, des performances optimisées et une meilleure expérience utilisateur. 

 **Anti-modèles courants :** 
+  Instrumentation incohérente : les services d’un système distribué ne sont pas tous instrumentés pour le suivi. 
+  Ignorer la latence : se concentrer uniquement sur les erreurs et ne pas tenir compte de la latence ou de la dégradation progressive des performances. 

 **Avantages liés au respect de cette bonne pratique :** 
+ Vue d’ensemble complète du système : visualisation du parcours complet des requêtes, de l’entrée à la sortie.
+  Débogage amélioré : identification rapide des défaillances ou des problèmes de performance. 
+  Expérience utilisateur améliorée : surveillance et optimisation basées sur des données sur les utilisateurs réels, afin de garantir que le système répond aux exigences du monde réel. 

 **Niveau d’exposition au risque si cette bonne pratique n’est pas respectée :** élevé 

## Directives d’implémentation
Directives d’implémentation

 Commencez par identifier tous les éléments de votre charge de travail qui nécessitent de l’instrumentation. Une fois que tous les composants sont pris en compte, utilisez des outils tels que AWS X-Ray et OpenTelemetry pour collecter des données de trace à des fins d'analyse avec des outils tels que X-Ray et Amazon CloudWatch ServiceLens Map. Participez à des évaluations régulières avec les développeurs et complétez ces discussions avec des outils tels qu'Amazon DevOps Guru, X-Ray Analytics et X-Ray Insights pour vous aider à découvrir des résultats plus approfondis. Définissez des alertes à partir des données de suivi pour envoyer une notification lorsque les résultats, tels que décrits dans le plan de surveillance de la charge de travail, sont menacés. 

### Étapes d’implémentation
Étapes d’implémentation

 Pour mettre en œuvre efficacement le suivi distribué : 

1.  **Adoption de [AWS X-Ray](https://aws.amazon.com/xray/) :** intégrez X-Ray à votre application pour mieux comprendre son comportement, interpréter ses performances et identifier les goulots d’étranglement. Utilisez X-Ray Insights pour l’analyse automatique des données de suivi. 

1.  **Instrumentez vos services :** vérifiez que chaque service, qu'il s'agisse d'une [AWS Lambda](https://aws.amazon.com/lambda/)fonction ou d'une [EC2instance](https://aws.amazon.com/ec2/), envoie des données de suivi. Plus vous instrumentez de services, plus la end-to-end vue est claire. 

1.  **Intégrez la [surveillance des utilisateurs CloudWatch réels](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/CloudWatch-RUM.html) et la [surveillance synthétique](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/CloudWatch_Synthetics_Canaries.html) :** intégrez la surveillance des utilisateurs réels (RUM) et la surveillance synthétique avec X-Ray. Cela permet de capturer des expériences utilisateur réelles et de simuler les interactions des utilisateurs afin d’identifier les problèmes potentiels. 

1.  **Utiliser l'[CloudWatch agent](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/Install-CloudWatch-Agent.html) :** l'agent peut envoyer des traces à partir de X-Ray ou OpenTelemetry pour améliorer la profondeur des informations obtenues. 

1.  **Utilisez [Amazon DevOps Guru](https://aws.amazon.com/devops-guru/) :** DevOps Guru utilise les données de X-Ray CloudWatch, AWS Config, et AWS CloudTrail pour fournir des recommandations exploitables. 

1.  **Analyse des traces :** passez régulièrement en revue les données de suivi pour identifier les tendances, les anomalies ou les goulots d’étranglement susceptibles d’avoir un impact sur les performances de votre application. 

1.  **Configurez des alertes :** configurez les alarmes en fonction [CloudWatch](https://aws.amazon.com/cloudwatch/)de modèles inhabituels ou de latences prolongées, ce qui permet de résoudre les problèmes de manière proactive. 

1.  **Amélioration continue :** revoyez votre stratégie de suivi au fur et à mesure que des services sont ajoutés ou modifiés afin de capturer tous les points de données pertinents. 

 **Niveau d’effort du plan d’implémentation :** moyen 

## Ressources
Ressources

 **Bonnes pratiques associées :** 
+  [OPS04-BP01 Identifier les indicateurs de performance clés](ops_observability_identify_kpis.md) 
+  [OPS04-BP02 Implémenter la télémétrie des applications](ops_observability_application_telemetry.md) 
+  [OPS04-BP03 Implémenter la télémétrie de l'expérience utilisateur](ops_observability_customer_telemetry.md) 
+  [OPS04-BP04 Mise en œuvre de la télémétrie des dépendances](ops_observability_dependency_telemetry.md) 

 **Documents connexes :** 
+ [AWS X-Ray Guide du développeur](https://docs.aws.amazon.com/xray/latest/devguide/aws-xray.html)
+ [Guide de CloudWatch l'utilisateur d'Amazon Agent](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/Install-CloudWatch-Agent.html)
+ [Guide de l'utilisateur Amazon DevOps Guru](https://docs.aws.amazon.com/devops-guru/latest/userguide/welcome.html)

 **Vidéos connexes :** 
+ [Utilisez AWS X-Ray Insights](https://www.youtube.com/watch?v=tl8OWHl6jxw)
+ [AWS sur Air ft. Observabilité : Amazon CloudWatch ](https://www.youtube.com/watch?v=qBDBnPkZ-KI) et AWS X-Ray

 **Exemples connexes :** 
+ [Instrumentation de votre application pour AWS X-Ray](https://aws.amazon.com/xray/latest/devguide/xray-instrumenting-your-app.html)

# OPS 5. Comment réduire les défauts, faciliter les corrections et améliorer le flux dans la production ?


 Adoptez des approches qui améliorent l’entrée des modifications en production et qui permettent une refactorisation, des retours rapides sur la qualité et la correction de bogues. Cela permet d’accélérer l’entrée des modifications bénéfiques en production, de limiter le déploiement de problèmes et d’identifier et de corriger rapidement les problèmes introduits par les activités de déploiement. 

**Topics**
+ [

# OPS05-BP01 Utilisation du contrôle de version
](ops_dev_integ_version_control.md)
+ [

# OPS05-BP02 Test et validation des modifications
](ops_dev_integ_test_val_chg.md)
+ [

# OPS05-BP03 Utilisation de systèmes de gestion de la configuration
](ops_dev_integ_conf_mgmt_sys.md)
+ [

# OPS05-BP04 Utiliser des systèmes de gestion du développement et du déploiement
](ops_dev_integ_build_mgmt_sys.md)
+ [

# OPS05-BP05 Gestion des correctifs
](ops_dev_integ_patch_mgmt.md)
+ [

# OPS05-BP06 Partager les normes de conception
](ops_dev_integ_share_design_stds.md)
+ [

# OPS05-BP07 Mise en œuvre de pratiques visant à améliorer la qualité du code
](ops_dev_integ_code_quality.md)
+ [

# OPS05-BP08 Utilisation de plusieurs environnements
](ops_dev_integ_multi_env.md)
+ [

# OPS05-BP09 Procéder à des modifications fréquentes, mineures et réversibles
](ops_dev_integ_freq_sm_rev_chg.md)
+ [

# OPS05-BP10 Automatisation complète de l’intégration et du déploiement
](ops_dev_integ_auto_integ_deploy.md)

# OPS05-BP01 Utilisation du contrôle de version
OPS05-BP01 Utilisation du contrôle de version

 Utilisez le contrôle de version pour activer le suivi des modifications et des versions. 

 De nombreux services AWS offrent des fonctionnalités de contrôle de version. Utilisez un système de révision ou de [contrôle des sources](https://aws.amazon.com/devops/source-control/) comme [Git](https://aws.amazon.com/devops/source-control/git/) pour gérer le code et d’autres artefacts, tels que les modèles [AWS CloudFormation](https://aws.amazon.com/cloudformation/) de contrôle de versions de votre infrastructure. 

 **Résultat escompté :** vos équipes collaborent sur le code. Une fois fusionné, le code est cohérent et aucune modification n’est perdue. Les erreurs sont facilement corrigées grâce à une gestion des versions appropriée. 

 **Anti-modèles courants :** 
+  Vous avez développé et stocké le code sur votre poste de travail. Un problème de stockage s’est produit sur le poste de travail et vous avez perdu le code. 
+  Après avoir remplacé le code existant par vos modifications, vous redémarrez votre application et elle n’est plus utilisable. Vous ne pouvez pas annuler la modification. 
+  Vous disposez d’un verrou d’écriture sur un fichier de rapport que quelqu’un d’autre doit modifier. Il vous contacte pour vous demander d’arrêter de travailler dessus afin qu’il puisse effectuer ses tâches. 
+  Votre équipe de recherche a travaillé sur une analyse détaillée qui façonnera vos futurs travaux. Quelqu’un a accidentellement enregistré sa liste d’achats sur le rapport final. Vous ne pouvez pas annuler la modification et vous devrez recréer le rapport. 

 **Avantages liés au respect de cette bonne pratique :** en utilisant les fonctionnalités de contrôle de version, vous pouvez revenir facilement aux bons états connus et aux versions précédentes, et limiter le risque de perte de ressources. 

 **Niveau d’exposition au risque si cette bonne pratique n’est pas respectée :** élevé 

## Directives d’implémentation
Directives d’implémentation

 Maintenez les ressources dans des référentiels avec contrôle de version. Cela permet le suivi des modifications, le déploiement de nouvelles versions, la détection des modifications apportées aux versions existantes, et le retour à des versions antérieures (par exemple, la restauration à un état correct connu en cas de défaillance). Intégrez les fonctionnalités de contrôle de version de vos systèmes de gestion de la configuration dans vos procédures. 

## Ressources
Ressources

 **Bonnes pratiques associées :** 
+  [OPS05-BP04 Utiliser des systèmes de gestion du développement et du déploiement](ops_dev_integ_build_mgmt_sys.md) 

 **Vidéos connexes :** 
+ [AWS re:Invent 2023 - How Lockheed Martin builds software faster, powered by DevSecOps ](https://www.youtube.com/watch?v=Q1OSyxYkl5w)
+ [AWS re:Invent 2023 - How GitHub operationalizes AI for team collaboration and productivity ](https://www.youtube.com/watch?v=cOVvGaiusOI)

# OPS05-BP02 Test et validation des modifications
OPS05-BP02 Test et validation des modifications

 Chaque changement déployé doit être testé pour éviter des erreurs de production. Cette bonne pratique est axée sur les tests des changements du contrôle des versions à la création d’artefacts. En plus des changements du code de l’application, les tests doivent inclure l’infrastructure, la configuration, les contrôles de sécurité et les procédures opérationnelles. Les tests peuvent prendre de nombreuses formes, des tests unitaires à l’analyse des composants d’un logiciel (SCA). Le fait de pousser les tests encore plus loin dans le processus d’intégration et de livraison de logiciels entraîne une plus grande certitude de la qualité des artefacts. 

 Votre organisation doit développer des normes de test pour tous les artefacts logiciels. Les tests automatisés réduisent la quantité de travail et évitent les erreurs de test manuel. Des tests manuels peuvent être nécessaires dans certains cas. Les développeurs doivent avoir accès aux résultats des tests automatisés pour créer des boucles de commentaires qui améliorent la qualité du logiciel. 

 **Résultat escompté :** les changements apportés au logiciel sont testés avant d’être livrés. Les développeurs ont accès aux résultats des tests et aux validations. Votre organisation a une norme de test qui s’applique à tous les changements apportés au logiciel. 

 **Anti-modèles courants :** 
+  Vous déployez un nouveau changement apporté au logiciel sans aucun test. Il ne s’exécute pas en production, ce qui entraîne une panne. 
+  De nouveaux groupes de sécurité sont déployés avec AWS CloudFormation sans être testés dans un environnement de préproduction. Les groupes de sécurité empêchent les clients d’atteindre votre application. 
+  Une méthode est modifiée mais il n’existe aucun test d’unité. Le logiciel échoue quand il est déployé en production. 

 **Avantages de l’établissement de cette bonne pratique :** le taux d’échec des changements dans les déploiements de logiciels est réduit. La qualité du logiciel s’améliore. Les développeurs ont une meilleure connaissance de la viabilité de leur code. Des politiques de sécurité peuvent être déployées en toute confiance pour soutenir la conformité de l’organisation. Les changements apportés à l’infrastructure, tels que les mises à jour de la politique de mise à l’échelle automatique, sont testés à l’avance pour répondre aux besoins du trafic. 

 **Niveau d’exposition au risque si cette bonne pratique n’est pas respectée :** élevé 

## Directives d’implémentation
Directives d’implémentation

 Des tests sont réalisés sur tous les changements, du code de l’application à l’infrastructure, dans le cadre de votre pratique d’intégration continue. Les résultats des tests sont publiés afin que les développeurs disposent d’une rétroaction rapide. Votre organisation a une norme de test que tous les changements doivent respecter. 

 Utilisez la puissance de l’IA générative avec Amazon Q Developer pour améliorer la productivité des développeurs et la qualité du code. Amazon Q Developer comprend la génération de suggestions de code (basées sur de grands modèles de langage), la production de tests unitaires (y compris les conditions limites) et l’amélioration de la sécurité du code par la détection et la correction des vulnérabilités de sécurité. 

 **Exemple client** 

 Dans le cadre de leur pipeline d’intégration continue, AnyCompany Retail réalise plusieurs types de test sur tous les artefacts logiciels. L’entreprise pratique le développement axé sur les tests afin que tous les logiciels bénéficient de tests d’unités. Une fois l’artefact créé, elle exécute des tests de bout en bout. Une fois cette première série de tests terminée, elle exécute une analyse de la sécurité des applications statiques qui cherchent des vulnérabilités connues. Les développeurs reçoivent des messages indiquant que chaque palier de test est validé. Une fois tous les tests terminés, l’artefact logiciel est stocké dans un référentiel d’artefacts. 

### Étapes d’implémentation
Étapes d’implémentation

1.  Collaborez avec les parties prenantes dans votre organisation pour développer une norme de test pour les artefacts logiciels. Quels tests standards tous les artefacts doivent-ils valider ? Des exigences en termes de conformité ou de réglementation doivent-elles être incluses dans la couverture des tests ? Faut-il réaliser des tests de qualité du code ? Qui doit être informé de la fin des tests ? 

   1.  [L’architecture de référence du pipeline de déploiement AWS](https://pipelines.devops.aws.dev/) contient une liste officielle des types de tests qui peuvent être réalisés sur des artefacts logiciels dans le cadre d’un pipeline d’intégration. 

1.  Instrumentalisez votre application avec les tests nécessaires en fonction de la norme de test de votre logiciel. Chaque ensemble de tests doit être réalisé en moins de dix minutes. Les tests doivent être exécutés dans le cadre d’un pipeline d’intégration. 

   1.  Utilisez [Amazon Q Developer](https://docs.aws.amazon.com/amazonq/latest/qdeveloper-ug/what-is.html), un outil d’IA générative qui peut vous aider à créer des cas de tests unitaires (y compris des conditions limites), à générer des fonctions à l’aide de code et de commentaires, et à implémenter des algorithmes connus. 

   1.  Utilisez [Amazon CodeGuru Reviewer](https://docs.aws.amazon.com/codeguru/latest/reviewer-ug/welcome.html) pour tester le code de votre application afin de détecter d’éventuels défauts. 

   1.  [AWS CodeBuild](https://docs.aws.amazon.com/codebuild/latest/userguide/welcome.html) vous permet de réaliser des tests sur les artefacts logiciels. 

   1.  [AWS CodePipeline](https://docs.aws.amazon.com/codepipeline/latest/userguide/welcome.html) peut orchestrer vos tests logiciels dans un pipeline. 

## Ressources
Ressources

 **Bonnes pratiques associées :** 
+  [OPS05-BP01 Utilisation du contrôle de version](https://docs.aws.amazon.com/wellarchitected/latest/operational-excellence-pillar/ops_dev_integ_version_control.html) 
+  [OPS05-BP06 Partage des normes de conception](https://docs.aws.amazon.com/wellarchitected/latest/operational-excellence-pillar/ops_dev_integ_share_design_stds.html) 
+  [OPS05-BP07 Mise en œuvre de pratiques visant à améliorer la qualité du code](https://docs.aws.amazon.com/wellarchitected/latest/operational-excellence-pillar/ops_dev_integ_code_quality.html) 
+  [OPS05-BP10 Automatisation complète de l’intégration et du déploiement](https://docs.aws.amazon.com/wellarchitected/latest/operational-excellence-pillar/ops_dev_integ_auto_integ_deploy.html) 

 **Documents connexes :** 
+  [Adopter une approche de développement piloté par les tests](https://docs.aws.amazon.com/prescriptive-guidance/latest/best-practices-cdk-typescript-iac/development-best-practices.html) 
+  [Accélération du cycle de développement de vos logiciels avec Amazon Q](https://aws.amazon.com/blogs/devops/accelerate-your-software-development-lifecycle-with-amazon-q/) 
+  [Amazon Q Developer, désormais disponible pour le grand public, inclut des aperçus de nouvelles fonctionnalités destinées à réinventer l’expérience des développeurs](https://aws.amazon.com/blogs/aws/amazon-q-developer-now-generally-available-includes-new-capabilities-to-reimagine-developer-experience/) 
+  [L’aide-mémoire ultime pour utiliser Amazon Q Developer dans votre environnement de développement intégré](https://community.aws/content/2eYoqeFRqaVnk900emsknDfzhfW/the-ultimate-cheat-sheet-for-using-amazon-q-developer-in-your-ide) 
+  [Shift-Left Workload, tirant parti de l’IA pour la création de tests](https://community.aws/content/2gBZtC94gPzaCQRnt4P0rIYWuBx/shift-left-workload-leveraging-ai-for-test-creation) 
+  [Centre de développement Amazon Q](https://aws.amazon.com/developer/generative-ai/amazon-q/) 
+  [10 façons de créer des applications plus rapidement avec Amazon CodeWhisperer](https://aws.amazon.com/blogs/devops/10-ways-to-build-applications-faster-with-amazon-codewhisperer/) 
+  [Au-delà de la couverture du code avec Amazon CodeWhisperer](https://aws.amazon.com/blogs/devops/looking-beyond-code-coverage-with-amazon-codewhisperer/) 
+  [Bonnes pratiques pour une ingénierie de requête avec Amazon CodeWhisperer](https://aws.amazon.com/blogs/devops/best-practices-for-prompt-engineering-with-amazon-codewhisperer/) 
+  [Pipeline de test AWS CloudFormation automatisé avec TaskCat et CodePipeline](https://aws.amazon.com/blogs/devops/automated-cloudformation-testing-pipeline-with-taskcat-and-codepipeline/) 
+  [Création d’un pipeline CI/CD AWS DevSecOps de bout en bout avec les outils open source SCA, SAST et DAST](https://aws.amazon.com/blogs/devops/building-end-to-end-aws-devsecops-ci-cd-pipeline-with-open-source-sca-sast-and-dast-tools/) 
+  [Démarrer avec les applications de test sans serveur](https://aws.amazon.com/blogs/compute/getting-started-with-testing-serverless-applications/) 
+  [Mon pipeline CI/CD est mon capitaine de versions](https://aws.amazon.com/builders-library/cicd-pipeline/) 
+  [Livre blanc Mise en pratique de l’intégration continue/livraison continue sur le livre blanc AWS](https://docs.aws.amazon.com/whitepapers/latest/practicing-continuous-integration-continuous-delivery/welcome.html) 

 **Vidéos connexes :** 
+  [Implement an API with Amazon Q Developer Agent for Software Development](https://www.youtube.com/watch?v=U4XEvJUvff4) 
+  [Installing, Configuring, & Using Amazon Q Developer with JetBrains IDEs (How-to)](https://www.youtube.com/watch?v=-iQfIhTA4J0) 
+  [Mastering the art of Amazon CodeWhisperer - YouTube playlist](https://www.youtube.com/playlist?list=PLDqi6CuDzubxzL-yIqgQb9UbbceYdKhpK) 
+  [AWS re:Invent 2020: Testable infrastructure: Integration testing on AWS](https://www.youtube.com/watch?v=KJC380Juo2w) 
+  [AWS Summit ANZ 2021 - Driving a test-first strategy with CDK and test driven development](https://www.youtube.com/watch?v=1R7G_wcyd3s) 
+  [Testing Your Infrastructure as Code with AWS CDK](https://www.youtube.com/watch?v=fWtuwGSoSOU) 

 **Ressources connexes :** 
+  [Architecture de référence du pipeline de déploiement AWS – Application](https://pipelines.devops.aws.dev/application-pipeline/index.html) 
+  [Pipeline AWS Kubernetes DevSecOps](https://github.com/aws-samples/devsecops-cicd-containers) 
+  [Exécution de tests d’unités pour une application Node.js de GitHub à l’aide d’AWS CodeBuild](https://docs.aws.amazon.com/prescriptive-guidance/latest/patterns/run-unit-tests-for-a-node-js-application-from-github-by-using-aws-codebuild.html) 
+  [Utilisation de Serverspec pour le développement axé sur les tests du code d’infrastructure](https://docs.aws.amazon.com/prescriptive-guidance/latest/patterns/use-serverspec-for-test-driven-development-of-infrastructure-code.html) 

 **Services connexes :** 
+  [Amazon Q Developer](https://aws.amazon.com/q/developer/) 
+  [Amazon CodeGuru Reviewer](https://docs.aws.amazon.com/codeguru/latest/reviewer-ug/welcome.html) 
+  [AWS CodeBuild](https://docs.aws.amazon.com/codebuild/latest/userguide/welcome.html) 
+  [AWS CodePipeline](https://docs.aws.amazon.com/codepipeline/latest/userguide/welcome.html) 

# OPS05-BP03 Utilisation de systèmes de gestion de la configuration
OPS05-BP03 Utilisation de systèmes de gestion de la configuration

 Utilisez des systèmes de gestion de la configuration pour effectuer et suivre les modifications de la configuration. Ces systèmes réduisent les erreurs causées par les processus manuels et diminuent le niveau d’effort nécessaire au déploiement des modifications. 

La gestion de la configuration statique définit des valeurs lors de l’initialisation d’une ressource. Elles doivent rester cohérentes tout au long de la durée de vie de cette ressource. La gestion dynamique de la configuration définit des valeurs à l’initialisation qui peuvent ou sont censées changer pendant la durée de vie d’une ressource. Par exemple, vous pouvez définir une touche à bascule de fonctionnalité pour activer les fonctionnalités de votre code par le biais d’une modification de configuration, ou modifier le niveau de détail du journal lors d’un incident.

Les configurations doivent être déployées dans un état connu et cohérent. Vous devez utiliser l’inspection automatisée pour surveiller en permanence les configurations des ressources dans les environnements et les régions. Ces contrôles doivent être définis sous forme de code et de gestion automatisés afin de garantir que les règles sont appliquées de manière cohérente dans tous les environnements. Les modifications apportées aux configurations doivent être mises à jour par le biais de procédures de contrôle des modifications convenues et appliquées de manière cohérente, dans le respect du contrôle des versions. La configuration des applications doit être gérée indépendamment du code de l’application et de l’infrastructure. Cela permet un déploiement cohérent dans plusieurs environnements. Les modifications de configuration n’entraînent pas la reconstruction ou le redéploiement de l’application. 

 **Résultat escompté :** vous effectuez la configuration, la validation et le déploiement dans le cadre de votre pipeline d’intégration et de livraison continues (CI/CD). Vous assurez la surveillance pour vérifier que les configurations sont correctes. Cela permet de minimiser l’impact sur les utilisateurs finaux et les clients. 

 **Anti-modèles courants :** 
+  Vous mettez manuellement à jour la configuration des serveurs Web de votre flotte, et un certain nombre de serveurs ne répondent plus en raison d’erreurs de mise à jour. 
+  Vous mettez à jour manuellement votre flotte de serveurs d’applications pendant plusieurs heures. L’incohérence de la configuration pendant la modification entraîne des comportements inattendus. 
+  Quelqu’un a mis à jour vos groupes de sécurité et vos serveurs Web ne sont plus accessibles. Sans savoir ce qui a changé, vous passez beaucoup de temps à enquêter sur la question, ce qui prolonge votre temps de reprise. 
+  Vous mettez en production une configuration de préproduction via le pipeline CI/CD sans validation. Vous exposez les utilisateurs et les clients à des données et à des services incorrects. 

 **Avantages liés au respect de cette bonne pratique :** l’adoption de systèmes de gestion de la configuration réduit le niveau d’effort nécessaire pour effectuer et suivre les changements, ainsi que la fréquence des erreurs causées par les procédures manuelles. Les systèmes de gestion de la configuration fournissent des garanties en matière de gouvernance, de conformité et d’exigences réglementaires. 

 **Niveau d’exposition au risque si cette bonne pratique n’est pas respectée :** moyen 

## Directives d’implémentation
Directives d’implémentation

 Les systèmes de gestion de la configuration sont utilisés pour suivre et mettre en œuvre les modifications apportées aux configurations des applications et de l’environnement. Ils sont également utilisés pour réduire les erreurs causées par les processus manuels, pour rendre les modifications de configuration reproductibles et vérifiables, et pour réduire le niveau d’effort. 

 Sur AWS, vous pouvez utiliser [AWS Config](https://docs.aws.amazon.com/config/latest/developerguide/WhatIsConfig.html) pour surveiller continuellement vos configurations de ressources AWS [à travers les comptes et les régions](https://docs.aws.amazon.com/config/latest/developerguide/aggregate-data.html). Il vous permet de suivre leur historique de configuration, de comprendre comment une modification de la configuration affecterait d’autres ressources et de les auditer par rapport aux configurations attendues ou souhaitées avec [AWS Config Rules](https://docs.aws.amazon.com/config/latest/developerguide/evaluate-config.html) et [AWS Config Conformance Packs](https://docs.aws.amazon.com/config/latest/developerguide/conformance-packs.html). 

 Pour les configurations dynamiques de vos applications exécutées sur des instances Amazon EC2, AWS Lambda, des conteneurs , des applications mobiles ou des appareils IoT, vous pouvez les utiliser [AWS AppConfig](https://docs.aws.amazon.com/appconfig/latest/userguide/what-is-appconfig.html) pour les configurer, les valider, les déployer et les surveiller dans vos environnements. 

### Étapes d’implémentation
Étapes d’implémentation

1.  Identifiez les responsables de la configuration. 

   1.  Informez les responsables de la configuration de tout besoin en matière de conformité, de gouvernance ou de réglementation. 

1.  Identifiez les éléments de configuration et les livrables. 

   1.  Les éléments de configuration sont toutes les configurations d’application et d’environnement concernées par un déploiement au sein de votre pipeline CI/CD. 

   1.  Les livrables incluent les critères de réussite, la validation et ce qui doit être surveillé. 

1.  Sélectionnez les outils de gestion de la configuration en fonction des besoins de votre entreprise et de votre pipeline de livraison. 

1.  Envisagez des déploiements pondérés tels que les déploiements canary pour les modifications de configuration importantes, afin de minimiser l’impact des configurations incorrectes. 

1.  Intégrez la gestion de votre configuration dans votre pipeline CI/CD. 

1.  Validez toutes les modifications apportées. 

## Ressources
Ressources

 **Bonnes pratiques associées :** 
+  [OPS06-BP01 Planifier les modifications infructueuses](ops_mit_deploy_risks_plan_for_unsucessful_changes.md) 
+  [OPS06-BP02 Déploiements de tests](ops_mit_deploy_risks_test_val_chg.md) 
+  [OPS06-BP03 Adoption de stratégies de déploiement sûres](ops_mit_deploy_risks_deploy_mgmt_sys.md) 
+  [OPS06-BP04 Automatiser les tests et les annulations](ops_mit_deploy_risks_auto_testing_and_rollback.md) 

 **Documents connexes :** 
+ [AWS Control Tower](https://docs.aws.amazon.com/controltower/latest/userguide/what-is-control-tower.html)
+ [Accélérateur de zone de destination AWS](https://aws.amazon.com/solutions/implementations/landing-zone-accelerator-on-aws/)
+ [AWS Config](https://aws.amazon.com/config/)
+ [ Présentation de AWS Config](https://docs.aws.amazon.com/config/latest/developerguide/WhatIsConfig.html)
+  [AWS AppConfig](https://docs.aws.amazon.com/appconfig/latest/userguide/what-is-appconfig.html) 
+ [ Présentation de AWS CloudFormation](https://docs.aws.amazon.com/AWSCloudFormation/latest/UserGuide/Welcome.html)
+  [Outils pour développeurs AWS](https://aws.amazon.com/products/developer-tools/) 
+ [AWS CodeBuild](https://aws.amazon.com/codebuild/)
+ [AWS CodePipeline](https://aws.amazon.com/codepipeline/)
+ [AWS CodeDeploy](https://aws.amazon.com/codedeploy/)

 **Vidéos connexes :** 
+ [AWS re:Invent 2022 - Proactive governance and compliance for AWS workloads](https://youtu.be/PpUnH9Y52X0?si=82wff87KHXcc6nbT)
+ [AWS re:Invent 2020: Achieve compliance as code using AWS Config](https://youtu.be/m8vTwvbzOfw?si=my4DP0FLq1zwKjho)
+ [Manage and Deploy Application Configurations with AWS AppConfig](https://youtu.be/ztIxMY3IIu0?si=ovYGsxWOBysyQrg0)

# OPS05-BP04 Utiliser des systèmes de gestion du développement et du déploiement
OPS05-BP04 Utiliser des systèmes de gestion du développement et du déploiement

 Utilisez des systèmes de gestion du développement et du déploiement. Ces systèmes réduisent les erreurs causées par les processus manuels et diminuent le niveau d’effort nécessaire au déploiement des modifications. 

 Dans AWS, vous pouvez créer des pipelines d’intégration continue/de déploiement continu (CI/CD) à l’aide de services tels que les [outils pour développeurs AWS](https://aws.amazon.com/products/developer-tools/) (par exemple, [AWS CodeBuild](https://aws.amazon.com/codebuild/), [AWS CodePipeline](https://aws.amazon.com/codepipeline/) et [AWS CodeDeploy](https://aws.amazon.com/codedeploy/)). 

 **Résultat escompté :** vos systèmes de gestion du développement et du déploiement prennent en charge le système d’intégration et de livraison continues (CI/CD) de votre entreprise, qui fournit des fonctionnalités permettant d’automatiser des déploiements sécurisés avec les configurations appropriées. 

 **Anti-modèles courants :** 
+  Après avoir compilé votre code sur votre système de développement, vous copiez l’exécutable sur vos systèmes de production et il ne démarre pas. Les fichiers journaux locaux indiquent qu’il n’a pas fonctionné en raison de dépendances manquantes. 
+  Vous créez avec succès votre application avec de nouvelles fonctionnalités dans votre environnement de développement et soumettez le code à l’assurance qualité (QA). L’assurance qualité échoue, car il manque des ressources statiques. 
+  Vendredi, après de nombreux efforts, vous avez réussi à créer manuellement votre application dans votre environnement de développement, y compris vos nouvelles fonctionnalités codées. Lundi, vous ne pouvez pas répéter les étapes qui vous ont permis de créer votre application avec succès. 
+  Vous effectuez les tests que vous avez créés pour votre nouvelle version. Ensuite, vous passez la semaine suivante à configurer un environnement de test et à exécuter tous les tests d’intégration existants, suivis des tests de performances. Le nouveau code a un impact inacceptable sur les performances et doit être redéveloppé, puis retesté. 

 **Avantages liés au respect de cette bonne pratique :** en fournissant des mécanismes pour gérer les activités de construction et de déploiement, vous réduisez le niveau d’effort nécessaire pour effectuer des tâches répétitives, vous libérez les membres de votre équipe pour qu’ils puissent se concentrer sur leurs tâches créatives de grande valeur et vous limitez l’introduction d’erreurs provenant des procédures manuelles. 

 **Niveau de risque encouru si cette bonne pratique n’est pas respectée :** moyen 

## Directives d’implémentation
Directives d’implémentation

 Les systèmes de gestion du développement et du déploiement sont utilisés pour suivre et mettre en œuvre les modifications, réduire les erreurs causées par les processus manuels et limiter le niveau d’effort requis pour des déploiements sûrs. Automatisez entièrement le pipeline d’intégration et de déploiement à partir du code d’enregistrement et par le biais du développement, des tests, du déploiement et de la validation. Cela permet de réduire les délais, de diminuer les coûts, d’augmenter la fréquence des modifications, de limiter le niveau d’effort et d’accroître la collaboration. 

### Étapes d’implémentation
Étapes d’implémentation

![\[Schéma illustrant un pipeline CI/CD utilisant AWS CodePipeline et des services connexes\]](http://docs.aws.amazon.com/fr_fr/wellarchitected/latest/framework/images/deployment-pipeline-tooling.png)


1.  Utilisez un système de contrôle de version pour stocker et gérer les ressources (tels que des documents, du code source et des fichiers binaires). 

1.  Utilisez CodeBuild pour compiler votre code source, exécute des tests unitaires et produit des artefacts prêts à être déployés. 

1.  Utilisez CodeDeploy comme un service de déploiement qui automatise les déploiements d’applications vers des instances [Amazon EC2](https://aws.amazon.com/ec2/), des instances sur site, des [fonctions AWS Lambda sans serveur](https://docs.aws.amazon.com/lambda/latest/dg/welcome.html) ou [Amazon ECS](https://aws.amazon.com/ecs/). 

1.  Surveillez vos déploiements. 

## Ressources
Ressources

 **Bonnes pratiques associées :** 
+  [OPS06-BP04 Automatiser les tests et les annulations](ops_mit_deploy_risks_auto_testing_and_rollback.md) 

 **Documents connexes :** 
+  [Outils pour développeurs AWS](https://aws.amazon.com/products/developer-tools/) 
+  [Présentation de AWS CodeBuild](https://docs.aws.amazon.com/codebuild/latest/userguide/welcome.html) 
+ [AWS CodeBuild](https://aws.amazon.com/codebuild/)
+  [Présentation de AWS CodeDeploy](https://docs.aws.amazon.com/codedeploy/latest/userguide/welcome.html) 

 **Vidéos connexes :** 
+ [AWS re:Invent 2022 - AWS Well-Architected best practices for DevOps on AWS](https://youtu.be/hfXokRAyorA)

# OPS05-BP05 Gestion des correctifs
OPS05-BP05 Gestion des correctifs

 Procédez à la gestion des correctifs afin de profiter des fonctionnalités, de résoudre les problèmes et de rester conforme à la gouvernance. Automatisez la gestion des correctifs pour réduire les erreurs causées par les processus manuels, pour permettre la mise à l’échelle et pour réduire le niveau d’efforts nécessaire aux correctifs. 

 La gestion des correctifs et des vulnérabilités fait partie de vos activités de gestion des bénéfices et des risques. Il est préférable d’avoir des infrastructures immuables et de déployer des charges de travail dans des états de bon fonctionnement connus et vérifiés. Lorsque cela n’est pas viable, l’application de correctifs est la seule solution. 

 [AWS Health](https://aws.amazon.com/premiumsupport/technology/aws-health/) est la source d’informations faisant autorité sur les événements de cycle de vie planifiés et les autres événements nécessitant des actions qui affectent l’intégrité de vos ressources AWS Cloud. Vous devez être au courant des modifications à venir et des mises à jour à effectuer. Les principaux événements de cycle de vie planifiés sont envoyés au moins six mois à l’avance. 

 [Amazon EC2 Image Builder](https://aws.amazon.com/image-builder/) fournit des pipelines pour mettre à jour les images des machines. Dans le cadre de la gestion des correctifs, envisagez que des images [Amazon Machine Image](https://docs.aws.amazon.com/AWSEC2/latest/UserGuide/AMIs.html       ) (AMI) utilisent un [pipeline d’images AMI](https://docs.aws.amazon.com/imagebuilder/latest/userguide/start-build-image-pipeline.html) ou des images de conteneur avec un [pipeline d’images Docker](https://docs.aws.amazon.com/imagebuilder/latest/userguide/start-build-container-pipeline.html), pendant que AWS Lambda fournit des modèles pour des environnements d’[exécution personnalisés et des bibliothèques supplémentaires](https://docs.aws.amazon.com/lambda/latest/dg/runtimes-custom.html) pour supprimer les vulnérabilités. 

 Vous devez gérer les mises à jour des images [Amazon Machine Image](https://docs.aws.amazon.com/AWSEC2/latest/UserGuide/AMIs.html) pour les images Linux ou Windows Server à l’aide d’[Amazon EC2 Image Builder](https://aws.amazon.com/image-builder/). Vous pouvez utiliser [Amazon Elastic Container Registry (Amazon ECR)](https://docs.aws.amazon.com/AmazonECR/latest/userguide/what-is-ecr.html) avec votre pipeline existant pour gérer les images Amazon ECS et les images Amazon EKS. Lambda comprend les [fonctionnalités de gestion des versions](https://docs.aws.amazon.com/lambda/latest/dg/configuration-versions.html). 

 L’application de correctifs ne doit pas être effectuée sur les systèmes de production sans avoir effectué un test préalable dans un environnement sûr. Les correctifs ne doivent être appliqués que s’ils favorisent la réalisation d’un résultat opérationnel ou métier. Sur AWS, vous pouvez utiliser [AWS Systems Manager Patch Manager](https://docs.aws.amazon.com/systems-manager/latest/userguide/systems-manager-patch.html) pour automatiser le processus d’application des correctifs aux systèmes gérés et planifier l’activité à l’aide de [Systems Manager Maintenance Windows](https://docs.aws.amazon.com/systems-manager/latest/userguide/systems-manager-maintenance.html). 

 **Résultat escompté :** vos images AMI et images de conteneur sont corrigées, mises à jour et prêtes à être lancées. Vous pouvez suivre l’état de toutes les images déployées et déterminer la conformité des correctifs. Vous êtes en mesure de rendre compte de l’état actuel et de disposer d’un processus pour répondre à vos besoins en matière de conformité. 

 **Anti-modèles courants :** 
+  On vous demande d’appliquer tous les nouveaux correctifs de sécurité dans un délai de deux heures, ce qui entraîne de multiples pannes dues à l’incompatibilité de l’application avec les correctifs. 
+  Une bibliothèque non corrigée entraîne des conséquences imprévues, car des parties inconnues y utilisent des failles pour accéder à votre charge de travail. 
+  Vous corrigez automatiquement les environnements de développement sans en informer les développeurs. Vous recevez plusieurs réclamations des développeurs indiquant que leur environnement ne fonctionne plus correctement. 
+  Vous n’avez pas corrigé le logiciel sur une instance persistante. Lorsque vous rencontrez un problème avec le logiciel et que vous contactez le fournisseur, celui-ci vous informe que la version n’est pas prise en charge et que vous devez effectuer appliquer un correctif à un niveau spécifique pour recevoir de l’aide. 
+  Un correctif récemment publié pour le logiciel de chiffrement que vous avez utilisé présente des améliorations significatives de performances. Votre système non corrigé présente des problèmes de performances qui persistent suite à l’absence de correctifs. 
+  Vous êtes averti d’une vulnérabilité de type « jour zéro » nécessitant une correction d’urgence et vous devez corriger manuellement tous vos environnements. 
+  Vous n’êtes pas au courant des actions critiques nécessaires pour maintenir vos ressources, telles que les mises à jour de version obligatoires, car vous ne passez pas en revue les événements de cycle de vie planifiés à venir ni les autres informations. Vous perdez un temps critique pour la planification et l’exécution, ce qui entraîne des changements d’urgence pour vos équipes et un impact potentiel ou une durée d’indisponibilité imprévue. 

 **Avantages liés au respect de cette bonne pratique :** en établissant un processus de gestion des correctifs, y compris vos critères d’application des correctifs et la méthodologie de distribution dans vos environnements, vous pouvez mettre à l’échelle les niveaux de correctifs et créer des rapports sur ces niveaux. Cela fournit des garanties concernant les correctifs de sécurité et assure une visibilité claire sur l’état des correctifs connus en cours de mise en place. Cela encourage aussi l’adoption des fonctions et fonctionnalités désirées, l’élimination rapide des problèmes et le respect durable de la gouvernance. Mettez en œuvre des systèmes de gestion des correctifs et d’automatisation pour réduire le niveau d’effort nécessaire au déploiement des correctifs et limiter les erreurs causées par les processus manuels. 

 **Niveau d’exposition au risque si cette bonne pratique n’est pas respectée :** moyen 

## Directives d’implémentation
Directives d’implémentation

 Appliquez des correctifs aux systèmes pour corriger les problèmes, obtenir des fonctionnalités souhaitées et rester conforme à la politique de gouvernance et aux exigences d’assistance du fournisseur. Dans les systèmes immuables, déployez avec l’ensemble de correctifs approprié pour obtenir le résultat souhaité. Automatisez le mécanisme de gestion des correctifs afin de réduire le temps écoulé avant l’application des correctifs, d’éviter les erreurs causées par les processus manuels et de limiter le niveau d’efforts nécessaire pour appliquer les correctifs. 

### Étapes d’implémentation
Étapes d’implémentation

 Pour Amazon EC2 Image Builder 

1.  Avec Amazon EC2 Image Builder, spécifiez les détails du pipeline : 

   1.  Créez un pipeline d’images et nommez-le. 

   1.  Définissez le calendrier et le fuseau horaire du pipeline. 

   1.  Configurez toutes les dépendances. 

1.  Choisissez une recette : 

   1.  Sélectionnez une recette existante ou créez-en une. 

   1.  Sélectionnez le type d’image. 

   1.  Donnez un nom et une version à votre recette. 

   1.  Sélectionnez votre image de base. 

   1.  Ajoutez des composants de build et incluez-les dans le registre cible. 

1.  Facultatif : définissez la configuration de votre infrastructure. 

1.  Facultatif : définissez les paramètres de configuration. 

1.  Révisez les paramètres. 

1.  Gérez régulièrement l’hygiène des recettes. 

 Pour le gestionnaire de correctifs de Systems Manager : 

1.  Créez un référentiel de correctifs. 

1.  Sélectionnez une méthode d’opérations d’application de correctifs. 

1.  Activez le reporting et l’analyse de conformité. 

## Ressources
Ressources

 **Bonnes pratiques associées :** 
+  [OPS06-BP04 Automatiser les tests et les annulations](ops_mit_deploy_risks_auto_testing_and_rollback.md) 

 **Documents connexes :** 
+ [Présentation d’Amazon EC2 Image Builder](https://docs.aws.amazon.com/imagebuilder/latest/userguide/what-is-image-builder.html)
+ [Création d’un pipeline d’images à l’aide d’Amazon EC2 Image Builder](https://docs.aws.amazon.com/imagebuilder/latest/userguide/start-build-image-pipeline.html)
+ [Création d’un pipeline d’images de conteneurs](https://docs.aws.amazon.com/imagebuilder/latest/userguide/start-build-container-pipeline.html)
+  [Gestionnaire de correctifs d’AWS Systems Manager](https://docs.aws.amazon.com/systems-manager/latest/userguide/systems-manager-patch.html) 
+ [Utilisation du gestionnaire de correctifs](https://docs.aws.amazon.com/systems-manager/latest/userguide/patch-manager-console.html)
+ [Utilisation des rapports de conformité des correctifs](https://docs.aws.amazon.com/systems-manager/latest/userguide/patch-manager-compliance-reports.html)
+ [Outils pour développeurs AWS](https://aws.amazon.com/products/developer-tools)

 **Vidéos connexes :** 
+  [CI/CD for Serverless Applications on AWS](https://www.youtube.com/watch?v=tEpx5VaW4WE) 
+  [Design with Ops in Mind](https://youtu.be/uh19jfW7hw4) 

   **Exemples connexes :** 
+ [Tutoriels du gestionnaire de correctifs AWS Systems Manager](https://docs.aws.amazon.com/systems-manager/latest/userguide/patch-manager-tutorials.html)

# OPS05-BP06 Partager les normes de conception
OPS05-BP06 Partager les normes de conception

 Partagez les bonnes pratiques entre les équipes pour sensibiliser et maximiser les bénéfices des efforts de développement. Documentez-les et mettez-les à jour au fur et à mesure de l’évolution de votre architecture. Si votre organisation applique des normes partagées, il est essentiel de prévoir des mécanismes permettant de demander des ajouts, des modifications et des exceptions aux normes. Sans cette possibilité, les normes deviennent une contrainte à l’innovation. 

 **Résultat escompté :** les normes de conception sont partagées par toutes les équipes de vos organisations. Ils sont documentés et conservés au up-to-date fur et à mesure de l'évolution des meilleures pratiques. 

 **Anti-modèles courants :** 
+ Deux équipes de développement ont chacune créé un service d’authentification des utilisateurs. Vos utilisateurs doivent conserver un ensemble distinct d’informations d’identification pour chaque partie du système à laquelle ils veulent accéder. 
+ Chaque équipe gère sa propre infrastructure. Une nouvelle exigence de conformité impose une modification de votre infrastructure et chaque équipe la met en œuvre de manière différente.

 **Avantages liés au respect de cette bonne pratique :** l’utilisation de normes communes favorise l’adoption de bonnes pratiques et maximise les avantages des efforts de développement. La documentation et la mise à jour des normes de conception permettent à votre organisation de up-to-date respecter les meilleures pratiques et les exigences de sécurité et de conformité. 

 **Niveau d’exposition au risque si cette bonne pratique n’est pas respectée :** moyen 

## Directives d’implémentation
Directives d’implémentation

 Partagez les bonnes pratiques existantes, les normes de conception, les listes de contrôle, les procédures d’exploitation, les conseils et les exigences de gouvernance entre les équipes. Prévoyez des procédures pour demander des modifications, des ajouts et des exceptions aux normes de conception afin de favoriser l’amélioration et l’innovation. Assurez-vous que les équipes sont au courant du contenu publié. Disposer d'un mécanisme permettant de maintenir les normes de conception au up-to-date fur et à mesure que de nouvelles pratiques exemplaires apparaissent. 

 **Exemple client** 

 AnyCompany Retail dispose d'une équipe d'architecture interfonctionnelle qui crée des modèles d'architecture logicielle. Cette équipe construit l’architecture en y intégrant les aspects de conformité et de gouvernance. Les équipes qui adoptent ces normes communes bénéficient des avantages de la conformité et de la gouvernance intégrées. Elles peuvent rapidement s’appuyer sur la norme de conception. L’équipe d’architecture se réunit tous les trimestres pour évaluer les modèles d’architecture et les mettre à jour si nécessaire. 

### Étapes d’implémentation
Étapes d’implémentation

1.  Identifiez une équipe interfonctionnelle qui sera chargée de développer et de mettre à jour les normes de conception. Cette équipe travaillera avec les parties prenantes de votre organisation pour élaborer des normes de conception, des procédures d’exploitation, des listes de contrôle, des conseils et des exigences de gouvernance. Documentez les normes de conception et partagez-les au sein de votre organisation. 

   1.  [AWS Service Catalog](https://docs.aws.amazon.com/servicecatalog/latest/adminguide/introduction.html) permet de créer des portefeuilles représentant les normes de conception en utilisant l’infrastructure en tant que code. Vous pouvez partager des portefeuilles entre plusieurs comptes. 

1.  Mettre en place un mécanisme pour maintenir les normes de conception au up-to-date fur et à mesure que de nouvelles pratiques exemplaires sont identifiées. 

1.  Si les normes de conception sont appliquées de manière centralisée, il faut prévoir un processus pour demander des modifications, des mises à jour et des exemptions. 

 **Niveau d’effort du plan d’implémentation :** moyen. L’élaboration d’un processus de création et de partage des normes de conception peut nécessiter une coordination et une coopération avec les parties prenantes de votre organisation. 

## Ressources
Ressources

 **Bonnes pratiques associées :** 
+  [OPS01-BP03 Évaluer les exigences de gouvernance](ops_priorities_governance_reqs.md) – Les exigences de gouvernance influencent les normes de conception. 
+  [OPS01-BP04 Évaluation des exigences de conformité](ops_priorities_compliance_reqs.md) – La conformité est un élément essentiel de la création de normes de conception. 
+  [OPS07-BP02 Assurer un examen cohérent de l’état de préparation opérationnelle](ops_ready_to_support_const_orr.md) – Les listes de contrôle de la disponibilité opérationnelle constituent un mécanisme de mise en œuvre des normes de conception lors de la conception de votre charge de travail. 
+  [OPS11-BP01 Définir un processus d’amélioration continue](ops_evolve_ops_process_cont_imp.md) – La mise à jour des normes de conception fait partie de l’amélioration continue. 
+  [OPS11-BP04 Effectuer la gestion des connaissances](ops_evolve_ops_knowledge_management.md) – Dans le cadre de votre pratique de gestion des connaissances, documentez et partagez les normes de conception. 

 **Documents connexes :** 
+ [Automatisez AWS Backup nous avec AWS Service Catalog](https://aws.amazon.com/blogs/mt/automate-aws-backups-with-aws-service-catalog/)
+ [AWS Service Catalog Compte amélioré en usine](https://aws.amazon.com/blogs/mt/aws-service-catalog-account-factory-enhanced/)
+ [Comment Expedia Group a créé une offre de base de données en tant que service (DBaaS) en utilisant AWS Service Catalog](https://aws.amazon.com/blogs/mt/how-expedia-group-built-database-as-a-service-dbaas-offering-using-aws-service-catalog/)
+ [Assurer la visibilité sur l’utilisation des modèles d’architecture cloud](https://aws.amazon.com/blogs/architecture/maintain-visibility-over-the-use-of-cloud-architecture-patterns/)
+ [Simplifiez le partage de vos AWS Service Catalog portefeuilles dans une AWS Organizations configuration](https://aws.amazon.com/blogs/mt/simplify-sharing-your-aws-service-catalog-portfolios-in-an-aws-organizations-setup/)

 **Vidéos connexes :** 
+ [AWS Service Catalog — Mise en route](https://www.youtube.com/watch?v=A9kKy6WhqVA)
+ [AWS re:Invent 2020 : Gérez vos AWS Service Catalog portefeuilles comme un expert](https://www.youtube.com/watch?v=lVfXkWHAtR8)

 **Exemples connexes :** 
+ [AWS Service Catalog Architecture de référence](https://github.com/aws-samples/aws-service-catalog-reference-architectures)
+ [AWS Service Catalog Atelier](https://catalog.us-east-1.prod.workshops.aws/workshops/d40750d7-a330-49be-9945-cde864610de9/en-US)

 **Services connexes :** 
+  [AWS Service Catalog](https://docs.aws.amazon.com/servicecatalog/latest/adminguide/introduction.html) 

# OPS05-BP07 Mise en œuvre de pratiques visant à améliorer la qualité du code
OPS05-BP07 Mise en œuvre de pratiques visant à améliorer la qualité du code

 Mettez en place des pratiques pour améliorer la qualité du code et limiter les failles. Parmi les exemples, citons le développement piloté par les tests, les révisions de code, l’adoption de normes et la programmation en binôme. Incorporez ces pratiques dans votre processus d’intégration et de livraison continues. 

 **Résultat escompté :** votre organisation utilise des bonnes pratiques comme les révisions de code ou la programmation en binôme pour améliorer la qualité du code. Les développeurs et les opérateurs adoptent les bonnes pratiques en matière de qualité du code dans le cadre du cycle de vie du développement logiciel. 

 **Anti-modèles courants :** 
+  Vous livrez du code à la branche principale de votre application sans effectuer de révision du code. La modification est automatiquement déployée en production et provoque une panne. 
+  Une nouvelle application est développée sans aucun test d’unité, de bout en bout ou d’intégration. Il n’y a aucun moyen de tester l’application avant son déploiement. 
+  Vos équipes procèdent à des modifications manuelles en production pour corriger les défauts. Les modifications ne sont pas soumises à des tests ou à des révisions de code et ne sont pas saisies ou enregistrées dans le cadre des processus d’intégration et de livraison continues. 

 **Avantages liés au respect de cette bonne pratique :** en adoptant des pratiques visant à améliorer la qualité du code, vous contribuez à minimiser les problèmes introduits dans la production. Les bonnes pratiques en matière de qualité du code incluent la programmation en binôme, les révisions de code et la mise en œuvre d’outils de productivité basés sur l’IA. 

 **Niveau d’exposition au risque si cette bonne pratique n’est pas respectée :** moyen 

## Directives d’implémentation
Directives d’implémentation

 Mettez en œuvre des pratiques visant à améliorer la qualité du code afin de minimiser les défauts avant leur déploiement. Utilisez des pratiques telles que le développement piloté par les tests, les révisions de code et la programmation en binôme pour améliorer la qualité de votre développement. 

 Utilisez la puissance de l’IA générative avec Amazon Q Developer pour améliorer la productivité des développeurs et la qualité du code. Amazon Q Developer comprend la génération de suggestions de code (basées sur de grands modèles de langage), la production de tests unitaires (y compris les conditions limites) et l’amélioration de la sécurité du code par la détection et la correction des vulnérabilités de sécurité. 

 **Exemple client** 

 AnyCompany Retail adopte plusieurs pratiques pour améliorer la qualité du code. La société a adopté le développement piloté par les tests comme norme d’écriture des applications. Pour certaines nouvelles fonctionnalités, elle demande aux développeurs de programmer en binôme pendant un sprint. Chaque demande d’extraction est soumise à une révision du code par un développeur principal avant d’être intégrée et déployée. 

### Étapes d’implémentation
Étapes d’implémentation

1.  Adoptez des pratiques de qualité du code telles que le développement piloté par les tests, les révisions de code et la programmation en binôme dans votre processus d’intégration et de livraison continues. Utilisez ces techniques pour améliorer la qualité des logiciels. 

   1.  Utilisez [Amazon Q Developer](https://docs.aws.amazon.com/amazonq/latest/qdeveloper-ug/what-is.html), un outil d’IA générative qui peut vous aider à créer des cas de tests unitaires (y compris des conditions limites), à générer des fonctions à l’aide de code et de commentaires, à implémenter des algorithmes connus, à détecter les violations des politiques de sécurité et les vulnérabilités dans votre code, à détecter les secrets, à scanner l’infrastructure en tant que code (IaC), à documenter le code et à apprendre plus rapidement des bibliothèques de code tierces. 

   1.  [Amazon CodeGuru Reviewer](https://docs.aws.amazon.com/codeguru/latest/reviewer-ug/welcome.html) peut fournir des recommandations de programmation pour le code Java et Python en utilisant le machine learning. 

 **Niveau d’effort du plan d’implémentation :** moyen. Il existe de nombreuses façons de mettre en œuvre cette bonne pratique, mais il peut être difficile de la faire adopter par l’organisation. 

## Ressources
Ressources

 **Bonnes pratiques associées :** 
+  [OPS05-BP02 Test et validation des modifications](https://docs.aws.amazon.com/wellarchitected/latest/operational-excellence-pillar/ops_dev_integ_test_val_chg.html) 
+  [OPS05-BP06 Partage des normes de conception](https://docs.aws.amazon.com/wellarchitected/latest/operational-excellence-pillar/ops_dev_integ_share_design_stds.html) 

 **Documents connexes :** 
+  [Adopter une approche de développement piloté par les tests](https://docs.aws.amazon.com/prescriptive-guidance/latest/best-practices-cdk-typescript-iac/development-best-practices.html) 
+  [Accélération du cycle de développement de vos logiciels avec Amazon Q](https://aws.amazon.com/blogs/devops/accelerate-your-software-development-lifecycle-with-amazon-q/) 
+  [Amazon Q Developer, désormais disponible pour le grand public, inclut des aperçus de nouvelles fonctionnalités destinées à réinventer l’expérience des développeurs](https://aws.amazon.com/blogs/aws/amazon-q-developer-now-generally-available-includes-new-capabilities-to-reimagine-developer-experience/) 
+  [L’aide-mémoire ultime pour utiliser Amazon Q Developer dans votre environnement de développement intégré](https://community.aws/content/2eYoqeFRqaVnk900emsknDfzhfW/the-ultimate-cheat-sheet-for-using-amazon-q-developer-in-your-ide) 
+  [Shift-Left Workload, tirant parti de l’IA pour la création de tests](https://community.aws/content/2gBZtC94gPzaCQRnt4P0rIYWuBx/shift-left-workload-leveraging-ai-for-test-creation) 
+  [Centre de développement Amazon Q](https://aws.amazon.com/developer/generative-ai/amazon-q/) 
+  [10 façons de créer des applications plus rapidement avec Amazon CodeWhisperer](https://aws.amazon.com/blogs/devops/10-ways-to-build-applications-faster-with-amazon-codewhisperer/) 
+  [Au-delà de la couverture du code avec Amazon CodeWhisperer](https://aws.amazon.com/blogs/devops/looking-beyond-code-coverage-with-amazon-codewhisperer/) 
+  [Bonnes pratiques pour une ingénierie de requête avec Amazon CodeWhisperer](https://aws.amazon.com/blogs/devops/best-practices-for-prompt-engineering-with-amazon-codewhisperer/) 
+  [Guide du logiciel Agile](https://martinfowler.com/agile.html) 
+  [Mon pipeline CI/CD est mon capitaine de versions](https://aws.amazon.com/builders-library/cicd-pipeline/) 
+  [Automatisez les révisions de code avec Amazon CodeGuru Reviewer](https://aws.amazon.com/blogs/devops/automate-code-reviews-with-amazon-codeguru-reviewer/) 
+  [Adopter une approche de développement piloté par les tests](https://docs.aws.amazon.com/prescriptive-guidance/latest/best-practices-cdk-typescript-iac/development-best-practices.html) 
+  [Comment DevFactory crée de meilleures applications avec Amazon CodeGuru](https://aws.amazon.com/blogs/machine-learning/how-devfactory-builds-better-applications-with-amazon-codeguru/) 
+  [Programmation en binôme](https://martinfowler.com/articles/on-pair-programming.html) 
+  [RENGA Inc. automatise les révisions de code avec Amazon CodeGuru](https://aws.amazon.com/blogs/machine-learning/renga-inc-automates-code-reviews-with-amazon-codeguru/) 
+  [L’art du développement agile : le développement piloté par les tests](http://www.jamesshore.com/v2/books/aoad1/test_driven_development) 
+  [Pourquoi les révisions de code sont importantes (et font gagner du temps \$1)](https://www.atlassian.com/agile/software-development/code-reviews) 

 **Vidéos connexes :** 
+  [Implement an API with Amazon Q Developer Agent for Software Development](https://www.youtube.com/watch?v=U4XEvJUvff4) 
+  [Installing, Configuring, & Using Amazon Q Developer with JetBrains IDEs (How-to)](https://www.youtube.com/watch?v=-iQfIhTA4J0) 
+  [Mastering the art of Amazon CodeWhisperer - YouTube playlist](https://www.youtube.com/playlist?list=PLDqi6CuDzubxzL-yIqgQb9UbbceYdKhpK) 
+  [AWS re:Invent 2020: Continuous improvement of code quality with Amazon CodeGuru](https://www.youtube.com/watch?v=iX1i35H1OVw) 
+  [AWS Summit ANZ 2021 - Driving a test-first strategy with CDK and test driven development](https://www.youtube.com/watch?v=1R7G_wcyd3s) 

 **Services connexes :** 
+  [Amazon Q Developer](https://aws.amazon.com/q/developer/) 
+  [Amazon CodeGuru Reviewer](https://docs.aws.amazon.com/codeguru/latest/reviewer-ug/welcome.html) 
+  [Amazon CodeGuru Profiler](https://docs.aws.amazon.com/codeguru/latest/profiler-ug/what-is-codeguru-profiler.html) 

# OPS05-BP08 Utilisation de plusieurs environnements
OPS05-BP08 Utilisation de plusieurs environnements

 Utilisez plusieurs environnements pour expérimenter, développer et tester votre charge de travail. Utilisez des niveaux de contrôle croissants lorsque les environnements approchent de la production pour vous assurer que votre charge de travail fonctionnera correctement une fois déployée. 

 **Résultat escompté :** vous disposez de plusieurs environnements qui répondent à vos besoins en matière de conformité et de gouvernance. Vous testez et promouvez le code dans les différents environnements jusqu’à la production. 

1.  Pour ce faire, votre organisation établit une zone de destination, qui assure la gouvernance, les contrôles, l’automatisation des comptes, la mise en réseau, la sécurité et l’observabilité opérationnelle. Gérez ces fonctionnalités de zone de destination en utilisant plusieurs environnements. Un exemple courant est celui d’une organisation d’environnement de test (sandbox) chargée de développer et de tester des modifications apportées à une zone de destination basée sur [AWS Control Tower](https://aws.amazon.com/controltower/), qui inclut [AWS IAM Identity Center](https://aws.amazon.com/iam/identity-center/) et des politiques telles que les [politiques de contrôle des services (SCP)](https://docs.aws.amazon.com/organizations/latest/userguide/orgs_manage_policies_scps.html). Tous ces éléments peuvent avoir un impact significatif sur l’accès aux Comptes AWS et leur fonctionnement dans la zone de destination. 

1.  En plus de ces services, vos équipes étendent les capacités des zones de destination avec des solutions publiées par AWS et les partenaires AWS ou des solutions personnalisées développées au sein de votre organisation. Les exemples de solutions publiées par AWS incluent [Configurations personnalisées d’AWS Control Tower (CfCT)](https://aws.amazon.com/solutions/implementations/customizations-for-aws-control-tower/) et [AWS Control Tower Account Factory pour Terraform (AFT)](https://docs.aws.amazon.com/controltower/latest/userguide/aft-overview.html). 

1.  Votre organisation applique les mêmes principes en matière de test, de promotion du code et de modification des politiques pour la zone de destination via les environnements sur le chemin de la production. Cette stratégie offre un environnement de zone de destination stable et sécurisé à vos équipes chargées des applications et des charges de travail. 

 **Anti-modèles courants :** 
+  Vous effectuez un développement dans un environnement de développement partagé et un autre développeur remplace vos modifications de code. 
+  Les contrôles de sécurité restrictifs sur votre environnement de développement partagé vous empêchent d’expérimenter de nouveaux services et fonctionnalités. 
+  Vous effectuez des tests de charge sur vos systèmes de production et provoquez une panne pour vos utilisateurs. 
+  Une erreur critique entraînant une perte de données s’est produite en production. Dans votre environnement de production, vous essayez de recréer les conditions qui ont conduit à la perte de données afin de pouvoir identifier comment elle s’est produite et empêcher qu’elle ne se reproduise. Pour éviter toute perte de données supplémentaire pendant les tests, vous devez rendre l’application indisponible aux utilisateurs. 
+  Vous explorez un service multilocataire et n’êtes pas en mesure de répondre à la demande d’un client pour un environnement dédié. 
+  Il se peut que vous ne réalisiez pas toujours des tests, mais lorsque vous le faites, vous procédez dans votre environnement de production. 
+  Vous pensez que la simplicité d’un environnement unique l’emporte sur la portée de l’impact des modifications au sein de l’environnement. 
+  Vous améliorez une fonctionnalité clé de la zone de destination, mais cette modification réduit la capacité de votre équipe à vendre des comptes pour de nouveaux projets ou pour vos charges de travail existantes. 
+  Vous appliquez de nouveaux contrôles à vos Comptes AWS, mais la modification a un impact sur la capacité de votre équipe chargée des charges de travail à déployer des modifications dans leurs Comptes AWS. 

 **Avantages liés au respect de cette bonne pratique :** lorsque vous déployez plusieurs environnements, vous pouvez prendre en charge simultanément plusieurs environnements de développement, de test et de production sans créer de conflits entre les développeurs ou les communautés d’utilisateurs. Pour les fonctionnalités complexes telles que les zones de destination, cela réduit considérablement le risque de modifications, simplifie le processus d’amélioration et réduit le risque de mises à jour critiques de l’environnement. Les organisations qui utilisent des zones de destination tirent naturellement parti des comptes multiples dans leur environnement AWS, avec les configurations de structure de compte, de gouvernance, de réseau et de sécurité. Au fil du temps, à mesure que votre entreprise grandit, la zone de destination peut évoluer pour sécuriser et organiser vos charges de travail et vos ressources. 

 **Niveau d’exposition au risque si cette bonne pratique n’est pas respectée :** moyen 

## Directives d’implémentation
Directives d’implémentation

 Utilisez plusieurs environnements et fournissez aux développeurs des environnements de test (sandbox) avec des contrôles réduits au minimum pour faciliter l’expérimentation. Fournissez des environnements de développement individuels pour permettre le travail en parallèle, ce qui augmente l’agilité du développement. Mettez en œuvre davantage de contrôles rigoureux dans les environnements proches de la production pour offrir aux développeurs la liberté d’innover. Utilisez l’infrastructure en tant que code et les systèmes de gestion de la configuration pour déployer des environnements configurés de manière cohérente par rapport aux contrôles de production pour veiller au bon fonctionnement des systèmes lorsqu’ils sont déployés. Lorsque les environnements ne sont pas en cours d’utilisation, désactivez-les pour éviter les coûts associés à des ressources inutilisées (par exemple, les systèmes de développement en soirée et les week-ends). Déployez des environnements équivalents à la production lors des tests de charge pour accroître les résultats valides. 

 Les équipes chargées de l’ingénierie des plateformes, de la mise en réseau et des opérations de sécurité gèrent souvent les capacités au niveau de l’organisation avec des exigences distinctes. La séparation des comptes ne suffit pas à fournir et à maintenir des environnements distincts pour l’expérimentation, le développement et les tests. Dans ce type de cas, créez des instances distinctes d’AWS Organizations. 

## Ressources
Ressources

 **Documents connexes :** 
+ [Instance Scheduler sur AWS](https://aws.amazon.com/solutions/implementations/instance-scheduler-on-aws/)
+  [Présentation de AWS CloudFormation](https://docs.aws.amazon.com/AWSCloudFormation/latest/UserGuide/Welcome.html) 
+ [ Organisation de votre environnement AWS à l’aide de plusieurs comptes - Organisations multiples - Test des modifications apportées à votre environnement AWS global ](https://docs.aws.amazon.com/whitepapers/latest/organizing-your-aws-environment/multiple-organizations.html#test-changes-to-your-overall-aws-environment)
+ [Guide AWS Control Tower](https://catalog.workshops.aws/control-tower)

# OPS05-BP09 Procéder à des modifications fréquentes, mineures et réversibles
OPS05-BP09 Procéder à des modifications fréquentes, mineures et réversibles

 Les modifications fréquentes, légères et réversibles limitent la portée et l’impact d’une modification. Lorsqu’elles sont utilisées conjointement avec des systèmes de gestion des modifications, des systèmes de gestion de configuration et des systèmes de construction et de livraison, les modifications fréquentes, mineures et réversibles limitent la portée et l’impact d’une modification. Cela se traduit par une résolution plus efficace des problèmes et par des corrections plus rapides avec la possibilité d’annuler les modifications effectuées. 

 **Anti-modèles courants :** 
+  Vous déployez une nouvelle version de votre application tous les trimestres avec une fenêtre de modification qui signifie qu’un service principal est désactivé. 
+  Vous modifiez fréquemment le schéma de votre base de données sans suivre les modifications apportées à vos systèmes de gestion. 
+  Vous effectuez des mises à jour manuelles sur place, en remplaçant les installations et les configurations existantes, sans aucun plan de restauration clair. 

 **Avantages de l’établissement de cette bonne pratique :** les efforts de développement sont plus rapides en déployant fréquemment de petites modifications. Lorsque les changements sont minimes, il est beaucoup plus facile d’identifier s’ils ont des conséquences inattendues et ils sont plus faciles à annuler. Lorsque les changements sont réversibles, les risques de mise en œuvre d’une modification sont minimes, car la récupération est simplifiée. Le processus de modification présente un risque réduit et l’impact de l’échec d’une modification est réduit. 

 **Niveau d’exposition au risque si cette bonne pratique n’est pas respectée :** faible 

## Directives d’implémentation
Directives d’implémentation

 Ayez recours à des modifications fréquentes, légères et réversibles pour limiter leur portée et leur impact. Cela facilite la résolution des problèmes, contribue à accélérer les corrections et offre la possibilité d’annuler une modification. Cela augmente également la vitesse à laquelle vous pouvez apporter de la valeur à votre entreprise. 

## Ressources
Ressources

 **Bonnes pratiques associées :** 
+  [OPS05-BP03 Utilisation de systèmes de gestion de la configuration](ops_dev_integ_conf_mgmt_sys.md) 
+  [OPS05-BP04 Utiliser des systèmes de gestion du développement et du déploiement](ops_dev_integ_build_mgmt_sys.md) 
+  [OPS06-BP04 Automatiser les tests et les annulations](ops_mit_deploy_risks_auto_testing_and_rollback.md) 

 **Documents connexes :** 
+ [Implémentation de microservices sur AWS](https://docs.aws.amazon.com/whitepapers/latest/microservices-on-aws/microservices-on-aws.html)
+ [Microservices – Observabilité](https://docs.aws.amazon.com/whitepapers/latest/microservices-on-aws/observability.html)

# OPS05-BP10 Automatisation complète de l’intégration et du déploiement
OPS05-BP10 Automatisation complète de l’intégration et du déploiement

 Automatisez la création, le déploiement et le test de la charge de travail. Cela permet de réduire les erreurs découlant des processus manuels, ainsi que les efforts nécessaires au déploiement des modifications. 

 Appliquez des métadonnées à l’aide des [balises de ressource](https://docs.aws.amazon.com/general/latest/gr/aws_tagging.html) et de [Groupes de ressources AWS](https://docs.aws.amazon.com/ARG/latest/APIReference/Welcome.html) en suivant une [stratégie de balisage](https://aws.amazon.com/answers/account-management/aws-tagging-strategies/) cohérente pour permettre l’identification de vos ressources. Balisez vos ressources pour l’organisation, la comptabilité analytique, les contrôles d’accès et le ciblage de l’exécution des activités d’opérations automatisées. 

 **Résultat escompté :** les développeurs utilisent des outils pour fournir du code et le promouvoir jusqu’à la production. Les développeurs n’ont pas besoin de se connecter à la AWS Management Console pour fournir des mises à jour. Il existe une piste d’audit complète des modifications et de la configuration, répondant aux besoins de gouvernance et de conformité. Les processus sont reproductibles et standardisés entre les équipes. Les développeurs sont libres de se concentrer sur le développement et les envois de code, ce qui augmente la productivité. 

 **Anti-modèles courants :** 
+  Vendredi, vous avez fini de créer le code de votre branche de fonctionnalité. Lundi, après avoir exécuté vos scripts de test de la qualité du code et chacun de vos scripts de tests unitaires, vous vérifiez votre code pour la prochaine version prévue. 
+  Vous êtes chargé de coder un correctif pour un problème critique affectant un grand nombre de clients en production. Après avoir testé le correctif, vous validez votre code et envoyez un e-mail à l’équipe de gestion des modifications pour demander l’autorisation de le déployer en production. 
+  En tant que développeur, vous vous connectez à la AWS Management Console pour créer un environnement de développement à l’aide de méthodes et de systèmes non standard. 

 **Avantages liés au respect de cette bonne pratique :** en mettant en œuvre des systèmes automatisés de gestion de la création et du déploiement, vous réduisez les erreurs causées par les processus manuels et diminuez l’effort de déploiement des changements, ce qui permet aux membres de votre équipe de se concentrer sur la création de valeur ajoutée. Vous accélérez la vitesse de livraison au fur et à mesure que vous progressez jusqu’à la production. 

 **Niveau d’exposition au risque si cette bonne pratique n’est pas respectée :** bas 

## Directives d’implémentation
Directives d’implémentation

 Utilisez des systèmes de gestion du développement et du déploiement afin de suivre et de mettre en œuvre des modifications, de réduire les erreurs causées par les processus manuels et de réduire le niveau d’efforts. Automatisez entièrement le pipeline d’intégration et de déploiement à partir du code d’enregistrement et par le biais du développement, des tests, du déploiement et de la validation. Cela permet de raccourcir les délais, d’augmenter la fréquence des modifications, de réduire le niveau d’effort, d’accélérer la mise sur le marché, d’augmenter la productivité et de renforcer la sécurité de votre code jusqu’à la production. 

## Ressources
Ressources

 **Bonnes pratiques associées :** 
+  [OPS05-BP03 Utilisation de systèmes de gestion de la configuration](ops_dev_integ_conf_mgmt_sys.md) 
+  [OPS05-BP04 Utiliser des systèmes de gestion du développement et du déploiement](ops_dev_integ_build_mgmt_sys.md) 

 **Documents connexes :** 
+  [Présentation de AWS CodeBuild](https://docs.aws.amazon.com/codebuild/latest/userguide/welcome.html) 
+  [Présentation de AWS CodeDeploy](https://docs.aws.amazon.com/codedeploy/latest/userguide/welcome.html) 

 **Vidéos connexes :** 
+ [AWS re:Invent 2022 - AWS Well-Architected best practices for DevOps on AWS](https://youtu.be/hfXokRAyorA)

# OPS 6. Comment réduire les risques liés au déploiement ?


 Adoptez des approches qui fournissent un retour d’information rapide sur la qualité et permettent une reprise rapide à la suite de changements qui n’offrent pas les résultats escomptés. L’utilisation de ces pratiques diminue l’impact des problèmes découlant du déploiement des modifications. 

**Topics**
+ [

# OPS06-BP01 Planifier les modifications infructueuses
](ops_mit_deploy_risks_plan_for_unsucessful_changes.md)
+ [

# OPS06-BP02 Déploiements de tests
](ops_mit_deploy_risks_test_val_chg.md)
+ [

# OPS06-BP03 Adoption de stratégies de déploiement sûres
](ops_mit_deploy_risks_deploy_mgmt_sys.md)
+ [

# OPS06-BP04 Automatiser les tests et les annulations
](ops_mit_deploy_risks_auto_testing_and_rollback.md)

# OPS06-BP01 Planifier les modifications infructueuses
OPS06-BP01 Planifier les modifications infructueuses

Prévoyez de revenir à un état correct connu ou de remédier à la situation dans l’environnement de production si le déploiement entraîne un résultat indésirable. L’existence d’une politique visant à établir un tel plan aide toutes les équipes à développer des stratégies de récupération en cas d’échec des modifications. Parmi les exemples de stratégies, citons les étapes de déploiement et de restauration, les stratégies de changement, les indicateurs de fonctionnalité, l’isolation du trafic et le déplacement du trafic. Une seule version peut inclure plusieurs modifications de composants connexes. La stratégie doit permettre de résister ou de se remettre d’une défaillance de tout changement de composant.

 **Résultat escompté :** vous avez préparé un plan de reprise détaillé pour votre modification en cas d’échec. En outre, vous avez réduit la taille de votre version afin de minimiser l’impact potentiel sur d’autres composants de la charge de travail. Vous avez ainsi réduit l’impact sur l’entreprise en diminuant le temps d’arrêt potentiel causé par une modification ratée et en augmentant la flexibilité et l’efficacité des temps de récupération. 

 **Anti-modèles courants :** 
+  Vous avez effectué un déploiement et votre application est devenue instable, mais il semble qu’il y ait des utilisateurs actifs sur le système. Vous devez décider entre annuler la modification et avoir un impact sur les utilisateurs actifs et attendre pour annuler la modification en sachant que les utilisateurs peuvent être impactés de toute façon. 
+  Après avoir modifié la routine, vos nouveaux environnements sont accessibles, mais l’un de vos sous-réseaux est devenu inaccessible. Vous devez décider de tout annuler ou d’essayer de réparer le sous-réseau inaccessible. Pendant cette période de détermination, le sous-réseau reste inaccessible. 
+  Vos systèmes ne sont pas conçus de manière à pouvoir être mis à jour avec de plus petites versions. Par conséquent, il est difficile d’annuler ces modifications en bloc en cas d’échec du déploiement. 
+  Vous n’utilisez pas l’infrastructure en tant que code (IaC) et vous avez effectué des mises à jour manuelles de votre infrastructure, ce qui a entraîné une configuration indésirable. Vous n’êtes pas en mesure de suivre et d’annuler efficacement les modifications manuelles. 
+  Parce que vous n’avez pas mesuré l’augmentation de la fréquence de vos déploiements, votre équipe n’est pas incitée à réduire la taille de ses changements et à améliorer ses plans de restauration pour chaque modification, ce qui entraîne une augmentation des risques et des taux d’échec. 
+  Vous ne mesurez pas la durée totale d’une panne causée par des modifications infructueuses. Votre équipe n’est pas en mesure d’établir des priorités et d’améliorer l’efficacité de son processus de déploiement et de son plan de reprise. 

 **Avantages de la mise en place de cette meilleure pratique :** le fait de disposer d'un plan de reprise après des modifications infructueuses permet de minimiser le temps moyen de restauration (MTTR) et de réduire l'impact sur votre entreprise. 

 **Niveau d’exposition au risque si cette bonne pratique n’est pas respectée :** élevé 

## Directives d’implémentation
Directives d’implémentation

 Une stratégie et une pratique cohérentes et documentées, adoptées par les équipes de publication des versions, permettent à une organisation de planifier ce qui doit se passer en cas d’échec des modifications. La politique devrait permettre la correction à l’avance dans des circonstances spécifiques. Dans les deux cas, un plan de correction à l’avance ou de restauration doit être bien documenté et testé avant d’être déployé dans la production réelle, afin de réduire au minimum la durée nécessaire pour restaurer une modification. 

### Étapes d’implémentation
Étapes d’implémentation

1.  Documentez les stratégies qui exigent des équipes qu’elles disposent de plans efficaces pour restaurer les modifications dans un délai donné. 

   1.  Les stratégies doivent préciser les cas où une situation de correction à l’avance est autorisée. 

   1.  Exigez qu’un plan de restauration documenté soit accessible à toutes les personnes concernées. 

   1.  Précisez les conditions de restauration (par exemple, lorsqu’il s’avère que des modifications non autorisées ont été déployées). 

1.  Analysez le niveau d’impact de toutes les modifications liées à chaque composante d’une charge de travail. 

   1.  Autorisez les modifications répétitives à être normalisées, modélisées et préautorisées si elles suivent un flux de travail cohérent qui applique les politiques de modification. 

   1.  Réduisez l’impact potentiel de toute modification en en réduisant la taille, de sorte que la reprise prenne moins de temps et ait moins d’impact sur l’entreprise. 

   1.  Veillez à ce que les procédures de restauration ramènent le code à l’état correct connu afin d’éviter les incidents dans la mesure du possible. 

1.  Intégrez des outils et des flux de travail pour appliquer vos politiques de manière programmée. 

1.  Faites en sorte que les données relatives aux modifications soient visibles pour les autres propriétaires de charges de travail afin d’améliorer la rapidité du diagnostic en cas de modification défaillante impossible à annuler. 

   1.  Mesurez le degré de réussite de cette pratique à l’aide de données sur les modifications visibles et identifiez les améliorations itératives. 

1.  Utilisez des outils de surveillance pour vérifier le succès ou l’échec d’un déploiement afin d’accélérer la prise de décision concernant la restauration. 

1.  Mesurez la durée de l’interruption lors d’un changement infructueux afin d’améliorer continuellement vos plans de reprise. 

 **Niveau d’effort du plan d’implémentation :** moyen 

## Ressources
Ressources

 **Bonnes pratiques associées :** 
+  [OPS06-BP04 Automatiser les tests et les annulations](ops_mit_deploy_risks_auto_testing_and_rollback.md) 

 **Documents connexes :** 
+ [AWS Builders Library \$1 Garantir la sécurité des annulations lors des déploiements](https://aws.amazon.com/builders-library/ensuring-rollback-safety-during-deployments/)
+ [AWS Livre blanc \$1 Gestion du changement dans le cloud](https://docs.aws.amazon.com/whitepapers/latest/change-management-in-the-cloud/change-management-in-the-cloud.html)

 **Vidéos connexes :** 
+ [re:Invent 2019 \$1 Amazon’s Approach to high-availability deployment](https://aws.amazon.com/builders-library/amazon-approach-to-high-availability-deployment/)

# OPS06-BP02 Déploiements de tests
OPS06-BP02 Déploiements de tests

 Testez les procédures de mise à disposition en préproduction en utilisant la même configuration de déploiement, les mêmes contrôles de sécurité, les mêmes étapes et les mêmes procédures qu’en production. Confirmez que toutes les étapes du déploiement se sont déroulées comme prévu, par exemple en inspectant les fichiers, les configurations et les services. Testez ensuite toutes les modifications à l’aide de tests fonctionnels, d’intégration et de charge, ainsi que de contrôles tels que les surveillances de l’état. En effectuant ces tests, vous pouvez identifier rapidement les problèmes de déploiement et avoir la possibilité de les planifier et de les atténuer avant la mise en production. 

 Vous pouvez créer des environnements parallèles temporaires pour tester chaque modification. Automatisez le déploiement des environnements de test à l’aide de l’infrastructure en tant que code (IaC) afin de réduire la quantité de travail nécessaire et d’assurer la stabilité, la cohérence et une livraison plus rapide des fonctionnalités. 

 **Résultat escompté :** votre organisation adopte une culture de développement piloté par les tests qui inclut des déploiements de tests. Cela permet de veiller à ce que les équipes se concentrent sur la création de valeur pour l’entreprise plutôt que sur la gestion des versions. Les équipes sont impliquées dès l’identification des risques de déploiement afin de déterminer les mesures d’atténuation appropriées. 

 **Anti-modèles courants :** 
+  Pendant les mises en production, les déploiements non testés entraînent des problèmes fréquents qui nécessitent un dépannage et une remontée. 
+  Votre version contient une infrastructure en tant que code (IaC) qui met à jour les ressources existantes. Vous n’êtes pas certain que l’IaC s’exécute correctement ou qu’elle a un impact sur les ressources. 
+  Vous déployez une nouvelle fonctionnalité dans votre application. Elle ne fonctionne pas comme prévu et il n’y a aucune visibilité jusqu’à ce qu’elle soit signalée par les utilisateurs concernés. 
+  Vous mettez à jour vos certificats. Vous installez accidentellement les certificats sur les mauvais composants, ce qui passe inaperçu et a un impact sur les visiteurs du site Web parce qu’il est impossible d’établir une connexion sécurisée avec le site Web. 

 **Avantages liés au respect de cette bonne pratique :** des tests approfondis en préproduction des procédures de déploiement et des modifications qu’elles introduisent minimisent l’impact potentiel sur la production causé par les étapes de déploiement. Cela permet d’accroître la confiance lors de la mise en production et de minimiser l’assistance opérationnelle sans ralentir la vitesse des changements apportés. 

 **Niveau d’exposition au risque si cette bonne pratique n’est pas respectée :** élevé 

## Directives d’implémentation
Directives d’implémentation

 Il est tout aussi important de tester votre processus de déploiement que les modifications qui en découlent. Pour ce faire, vous pouvez tester vos étapes de déploiement dans un environnement de préproduction qui reflète le plus fidèlement possible l’environnement de production. Les problèmes courants, tels que les étapes de déploiement incomplètes ou incorrectes, ou les mauvaises configurations, peuvent être détectés avant la mise en production. De plus, vous pouvez tester vos étapes de reprise. 

 **Exemple client** 

 Dans le cadre de son pipeline d'intégration continue et de livraison continue (CI/CD), AnyCompany Retail exécute les étapes définies nécessaires pour publier des mises à jour d'infrastructure et de logiciels pour ses clients dans un environnement de type production. Le pipeline comprend des contrôles préalables pour détecter les altérations (détection des changements apportés aux ressources en dehors de votre IaC) dans les ressources avant le déploiement, ainsi que pour valider les actions que l’IaC entreprend lors de son lancement. Il valide les étapes du déploiement, en vérifiant par exemple que certains fichiers et configurations sont en place, que les services sont en cours d’exécution et qu’ils répondent correctement aux surveillances de l’état sur l’hôte local avant de s’enregistrer à nouveau auprès de l’équilibreur de charge. En outre, toutes les modifications font l’objet d’un certain nombre de tests automatisés, tels que des tests fonctionnels, de sécurité, de régression, d’intégration et de charge. 

### Étapes d’implémentation
Étapes d’implémentation

1.  Effectuez des contrôles avant l’installation pour reproduire l’environnement de préproduction en production. 

   1.  Utilisez [la détection de dérive](https://docs.aws.amazon.com/AWSCloudFormation/latest/UserGuide/using-cfn-stack-drift.html) pour détecter lorsque les ressources ont été modifiées en dehors de CloudFormation. 

   1.  Utilisez [des ensembles de modifications](https://docs.aws.amazon.com/AWSCloudFormation/latest/UserGuide/using-cfn-updating-stacks-changesets.html) pour vérifier que l'intention d'une mise à jour de la pile correspond aux actions entreprises lorsque l'ensemble de modifications est initié. CloudFormation 

1.  Cela déclenche une étape d’approbation manuelle dans [AWS CodePipeline](https://docs.aws.amazon.com/codepipeline/latest/userguide/approvals.html) pour autoriser le déploiement dans l’environnement de préproduction. 

1.  Utilisez des configurations de déploiement telles que [AWS CodeDeploy AppSpec](https://docs.aws.amazon.com/codedeploy/latest/userguide/application-specification-files.html)des fichiers pour définir les étapes de déploiement et de validation. 

1.  Le cas échéant, [AWS CodeDeploy intégrez-le à d'autres AWS services](https://docs.aws.amazon.com/codedeploy/latest/userguide/integrations-aws.html) ou [AWS CodeDeploy intégrez-le aux produits et services partenaires](https://docs.aws.amazon.com/codedeploy/latest/userguide/integrations-partners.html). 

1.  [Surveillez les déploiements](https://docs.aws.amazon.com/codedeploy/latest/userguide/monitoring.html) à l'aide CloudWatch d' AWS CloudTrail Amazon et des notifications d'SNSévénements Amazon. 

1.  Réalisez des tests automatisés après déploiement, y compris des tests fonctionnels, de sécurité, de régression, d’intégration et de charge. 

1.  [Résolution](https://docs.aws.amazon.com/codedeploy/latest/userguide/troubleshooting.html) des problèmes de déploiement 

1.  La validation réussie des étapes précédentes devrait lancer un mécanisme d’autorisation manuel pour autoriser le déploiement en production. 

 **Niveau d’effort du plan d’implémentation :** élevé 

## Ressources
Ressources

 **Bonnes pratiques associées :** 
+  [OPS05-BP02 Test et validation des modifications](ops_dev_integ_test_val_chg.md) 

 **Documents connexes :** 
+ [AWS Bibliothèque pour les constructeurs \$1 Automatisation des déploiements sûrs et sans intervention directe \$1 Déploiements de test](https://aws.amazon.com/builders-library/automating-safe-hands-off-deployments/#Test_deployments_in_pre-production_environments)
+ [AWS Livre blanc \$1 Pratiquer l'intégration et la livraison continues sur AWS](https://docs.aws.amazon.com/whitepapers/latest/practicing-continuous-integration-continuous-delivery/testing-stages-in-continuous-integration-and-continuous-delivery.html)
+ [L’histoire d’Apollo, le moteur de déploiement d’Amazon](https://www.allthingsdistributed.com/2014/11/apollo-amazon-deployment-engine.html)
+  [Comment tester et déboguer AWS CodeDeploy localement avant d'expédier votre code](https://aws.amazon.com/blogs/devops/how-to-test-and-debug-aws-codedeploy-locally-before-you-ship-your-code/) 
+ [Intégrer les tests de connectivité réseau au déploiement de l’infrastructure](https://aws.amazon.com/blogs/networking-and-content-delivery/integrating-network-connectivity-testing-with-infrastructure-deployment/)

 **Vidéos connexes :** 
+ [ re:Invent 2020 \$1 Testing software and systems at Amazon ](https://www.youtube.com/watch?v=o1sc3cK9bMU)

 **Exemples connexes :** 
+ [Tutoriel \$1 Déploiement et ECS service Amazon avec un test de validation](https://docs.aws.amazon.com/codedeploy/latest/userguide/tutorial-ecs-deployment-with-hooks.html)

# OPS06-BP03 Adoption de stratégies de déploiement sûres
OPS06-BP03 Adoption de stratégies de déploiement sûres

 Les déploiements de production sécurisés contrôlent le flux des modifications bénéfiques dans le but de minimiser l’impact perçu de ces modifications sur les clients. Les contrôles de sécurité fournissent des mécanismes d’inspection permettant de valider les résultats souhaités et de limiter l’étendue de l’impact des défaillances introduites par les modifications ou des échecs de déploiement. Les déploiements sûrs peuvent inclure des stratégies telles que les indicateurs de fonctions, les déploiements sur un seul hôte, les déploiements continus (versions canary), les déploiements immuables, la division du trafic et les déploiements bleus/verts. 

 **Résultat escompté :** votre organisation utilise un système d’intégration continue et de livraison continue (CI/CD) qui permet d’automatiser des déploiements sûrs. Les équipes sont tenues d’utiliser des stratégies de déploiement sûres et appropriées. 

 **Anti-modèles courants :** 
+  Vous déployez une modification infructueuse dans l’ensemble de l’environnement de production en une seule fois. Par conséquent, tous les clients sont touchés simultanément. 
+  Une défaillance introduite lors d’un déploiement simultané dans tous les systèmes nécessite un lancement d’urgence. La correction pour tous les clients prend plusieurs jours. 
+  La gestion des versions de production nécessite la planification et la participation de plusieurs équipes. Cela limite votre capacité à mettre fréquemment à jour les fonctionnalités pour vos clients. 
+  Vous effectuez un déploiement mutable en modifiant vos systèmes existants. Après avoir découvert que la modification n’a pas abouti, vous devez modifier à nouveau les systèmes pour restaurer l’ancienne version, ce qui prolonge votre délai de récupération. 

 **Avantages liés au respect de cette bonne pratique :** les déploiements automatisés permettent de concilier la rapidité des déploiements et la cohérence des modifications apportées aux clients. Limiter l’impact permet d’éviter des échecs de déploiement coûteux et de maximiser la capacité des équipes à répondre efficacement aux défaillances. 

 **Niveau d’exposition au risque si cette bonne pratique n’est pas respectée :** moyen 

## Directives d’implémentation
Directives d’implémentation

 Les défaillances de la livraison en continu peuvent entraîner une réduction de la disponibilité des services et de mauvaises expériences pour les clients. Pour maximiser le taux de réussite des déploiements, mettez en œuvre des contrôles de sécurité dans le processus de lancement de bout en bout afin de minimiser les erreurs de déploiement ; l’objectif étant de parvenir à zéro échec de déploiement. 

 **Exemple client** 

 AnyCompany Retail a pour mission de réaliser des déploiements avec un temps d’arrêt minimal ou nul, ce qui signifie qu’il n’y a pas d’impact perceptible pour ses utilisateurs pendant les déploiements. Pour ce faire, l’entreprise a établi des modèles de déploiement (voir le diagramme de flux de travail suivant), tels que les déploiements continus et les déploiements bleus/verts. Toutes les équipes adoptent un ou plusieurs de ces modèles dans leur pipeline CI/CD. 


| Flux de travail CodeDeploy pour Amazon EC2 | Flux de travail CodeDeploy pour Amazon ECS | Flux de travail CodeDeploy pour Lambda | 
| --- | --- | --- | 
|  ![\[Flux du processus de déploiement pour Amazon EC2\]](http://docs.aws.amazon.com/fr_fr/wellarchitected/latest/framework/images/deployment-process-ec2.png)  |  ![\[Flux du processus de déploiement pour Amazon ECS\]](http://docs.aws.amazon.com/fr_fr/wellarchitected/latest/framework/images/deployment-process-ecs.png)  |  ![\[Flux du processus de déploiement pour Lambda\]](http://docs.aws.amazon.com/fr_fr/wellarchitected/latest/framework/images/deployment-process-lambda.png)  | 

### Étapes d’implémentation
Étapes d’implémentation

1.  Utilisez un flux de travail d’approbation pour lancer la séquence des étapes de déploiement de la production lors de la promotion en production. 

1.  Utilisez un système de déploiement automatisé tel que [AWS CodeDeploy](https://docs.aws.amazon.com/codedeploy/latest/userguide/welcome.html). Les [options de déploiement de AWS CodeDeploy](https://docs.aws.amazon.com/codedeploy/latest/userguide/deployment-steps.html) comprennent les déploiements sur place pour EC2/sur site et les déploiements bleus/verts pour EC2/sur site, AWS Lambda et Amazon ECS (voir le diagramme de flux de travail précédent). 

   1.  Le cas échéant, [intégrez AWS CodeDeploy à d’autres services AWS](https://docs.aws.amazon.com/codedeploy/latest/userguide/integrations-aws.html) ou [intégrez aux produits et services partenairesAWS CodeDeploy](https://docs.aws.amazon.com/codedeploy/latest/userguide/integrations-partners.html). 

1.  Utilisez des déploiements bleus/verts pour les bases de données telles qu’[Amazon Aurora](https://docs.aws.amazon.com/AmazonRDS/latest/AuroraUserGuide/blue-green-deployments.html) et [Amazon RDS](https://docs.aws.amazon.com/AmazonRDS/latest/UserGuide/blue-green-deployments.html). 

1.  [Surveillez les déploiements](https://docs.aws.amazon.com/codedeploy/latest/userguide/monitoring.html) à l’aide d’Amazon CloudWatch, AWS CloudTrail et des notifications d’événements Amazon Simple Notiﬁcation Service (Amazon SNS). 

1.  Effectuez des tests automatisés post-déploiement, y compris des tests fonctionnels, de sécurité, de régression, d’intégration et tout test de charge. 

1.  [Résolvez](https://docs.aws.amazon.com/codedeploy/latest/userguide/troubleshooting.html) les problèmes de déploiement. 

 **Niveau d’effort du plan d’implémentation :** moyen 

## Ressources
Ressources

 **Bonnes pratiques associées:** 
+  [OPS05-BP02 Test et validation des modifications](ops_dev_integ_test_val_chg.md) 
+  [OPS05-BP09 Procéder à des modifications fréquentes, mineures et réversibles](ops_dev_integ_freq_sm_rev_chg.md) 
+  [OPS05-BP10 Automatisation complète de l’intégration et du déploiement](ops_dev_integ_auto_integ_deploy.md) 

 **Documents connexes :** 
+ [AWS Builders’ Library  \$1 Automatisation de déploiements sécurisés sans intervention \$1 Déploiements en production](https://aws.amazon.com/builders-library/automating-safe-hands-off-deployments/?did=ba_card&trk=ba_card#Production_deployments)
+ [AWS Builders Library \$1 Mon pipeline CI/CD est mon capitaine de versions \$1 Versions de production automatiques et sécurisées](https://aws.amazon.com//builders-library/cicd-pipeline/#Safe.2C_automatic_production_releases)
+ [AWSLivre blanc \$1 Mise en pratique de l’intégration continue et de la livraison continue sur AWS \$1 Méthodes de déploiement](https://docs.aws.amazon.com/whitepapers/latest/practicing-continuous-integration-continuous-delivery/deployment-methods.html)
+ [AWS CodeDeploy Guide de l’utilisateur](https://docs.aws.amazon.com/codedeploy/latest/userguide/welcome.html)
+ [Utilisation des configurations de déploiement dans AWS CodeDeploy](https://docs.aws.amazon.com/codedeploy/latest/userguide/deployment-configurations.html)
+ [Configuration d’un déploiement de la version canary API Gateway](https://docs.aws.amazon.com/apigateway/latest/developerguide/canary-release.html)
+ [Types de déploiement Amazon ECS](https://docs.aws.amazon.com/)
+ [Déploiements bleus/verts entièrement gérés dans Amazon Aurora et Amazon RDS](https://aws.amazon.com/blogs/aws/new-fully-managed-blue-green-deployments-in-amazon-aurora-and-amazon-rds/)
+ [Déploiements bleus/verts avec AWS Elastic Beanstalk](https://docs.aws.amazon.com/elasticbeanstalk/latest/dg/using-features.CNAMESwap.html)

 **Vidéos connexes :** 
+ [re:Invent 2020 \$1 Hands-off: Automating continuous delivery pipelines at Amazon](https://www.youtube.com/watch?v=ngnMj1zbMPY)
+ [re:Invent 2019 \$1 Amazon’s Approach to high-availability deployment](https://www.youtube.com/watch?v=bCgD2bX1LI4)

 **Exemples connexes :** 
+ [Essai d’un exemple de déploiement bleu/vert dans AWS CodeDeploy](https://docs.aws.amazon.com/codedeploy/latest/userguide/applications-create-blue-green.html)
+ [Atelier \$1 Création de pipelines CI/CD pour les déploiements canary Lambda à l’aide d’AWS CDK](https://catalog.workshops.aws/cdk-cicd-for-lambda-canary-deployment/en-US) 
+ [Atelier \$1 Création de votre premier pipeline DevOps bleu/vert avec Amazon ECS](https://catalog.us-east-1.prod.workshops.aws/workshops/4b59b9fb-48b6-461c-9377-907b2e33c9df/en-US)
+ [Atelier \$1 Création de votre premier pipeline DevOps bleu/vert avec Amazon EKS](https://catalog.us-east-1.prod.workshops.aws/workshops/4eab6682-09b2-43e5-93d4-1f58fd6cff6e/en-US)
+ [Atelier \$1 EKS GitOps avec ArgoCD](https://catalog.workshops.aws/eksgitops-argocd-githubactions)
+ [Atelier \$1 Atelier CI/CD sur AWS](https://catalog.workshops.aws/cicdonaws/en-US)
+ [Implémentation de pipelines CI/CD entre comptes avec AWS SAM pour les fonctions Lambda basées sur des conteneurs](https://aws.amazon.com/blogs/compute/implementing-cross-account-cicd-with-aws-sam-for-container-based-lambda/)

# OPS06-BP04 Automatiser les tests et les annulations
OPS06-BP04 Automatiser les tests et les annulations

 Pour accroître la rapidité, la fiabilité et la confiance de votre processus de déploiement, mettez en place une stratégie de tests automatisés et de restauration dans les environnements de préproduction et de production. Automatisez les tests lors du déploiement en production afin de simuler les interactions entre l’homme et le système et de vérifier les modifications déployées. Automatisez la restauration pour revenir rapidement à un état antérieur sain connu. La restauration doit être déclenchée automatiquement dans des conditions prédéfinies, par exemple lorsque le résultat souhaité de la modification n’est pas atteint ou lorsque le test automatisé échoue. L’automatisation de ces deux activités améliore le taux de réussite de vos déploiements, minimise le temps de reprise et réduit l’impact potentiel sur l’entreprise. 

 **Résultat escompté :** vos tests automatisés et vos stratégies de restauration sont intégrés dans votre pipeline d’intégration continue et de livraison continue (CI/CD). Votre surveillance est en mesure de valider vos critères de réussite et de déclencher une restauration automatique en cas d’échec. Cela permet de minimiser l’impact sur les utilisateurs finaux et les clients. Par exemple, lorsque tous les résultats des tests ont été satisfaits, vous transférez votre code dans l’environnement de production où des tests de régression automatisés sont lancés, en utilisant les mêmes cas de test. Si les résultats des tests de régression ne correspondent pas aux attentes, une restauration automatisée est lancée dans le flux de travail du pipeline. 

 **Anti-modèles courants :** 
+  Vos systèmes ne sont pas conçus de manière à pouvoir être mis à jour avec de plus petites versions. Par conséquent, il est difficile d’annuler ces modifications en bloc en cas d’échec du déploiement. 
+  Votre processus de déploiement consiste en une série d’étapes manuelles. Après avoir apporté des modifications à votre charge de travail, vous commencez les tests de post-déploiement. Après les tests, vous vous rendez compte que votre charge de travail est inopérante et que les clients sont déconnectés. Vous commencez les opérations pour restaurer la version précédente. Toutes ces étapes manuelles retardent la reprise globale du système et ont un impact prolongé sur vos clients. 
+  Vous avez passé du temps à développer des cas de tests automatisés pour des fonctionnalités qui ne sont pas fréquemment utilisées dans votre application, minimisant ainsi le retour sur investissement de votre capacité de tests automatisés. 
+  Votre version est composée de mises à jour d’applications, d’infrastructures, de correctifs et de configurations qui sont indépendantes les unes des autres. Cependant, vous disposez d’un seul pipeline CI/CD qui fournit toutes les modifications en une seule fois. La défaillance d’un composant vous oblige à annuler toutes les modifications, ce qui rend votre restauration complexe et inefficace. 
+  Votre équipe termine le travail de codage au cours du premier sprint et commence le travail du deuxième sprint, mais votre plan ne prévoyait pas de tests avant le troisième sprint. En conséquence, les tests automatisés ont révélé des défauts du premier sprint qui ont dû être résolus avant que les tests des produits livrables du deuxième sprint puissent commencer et la version entière est retardée, ce qui dévalorise vos tests automatisés. 
+  Vos tests de régression automatisés pour la version de production sont terminés, mais vous ne surveillez pas l’état de la charge de travail. Comme vous ne savez pas si le service a redémarré ou non, vous ne savez pas si la restauration est nécessaire ou si elle a déjà eu lieu. 

 **Avantages liés au respect de cette bonne pratique :** l’automatisation des tests accroît la transparence de votre processus de test et votre capacité à couvrir davantage de fonctionnalités dans un laps de temps plus court. En testant et en validant les modifications en production, vous êtes en mesure d’identifier immédiatement les problèmes. L’amélioration de la cohérence avec les outils de test automatisés permet une meilleure détection des défauts. En restaurant automatiquement la version précédente, vous réduisez l’impact sur vos clients. La restauration automatisée inspire finalement plus de confiance dans vos capacités de déploiement en réduisant l’impact sur l’entreprise. Dans l'ensemble, ces capacités réduisent time-to-delivery tout en garantissant la qualité. 

 **Niveau d’exposition au risque si cette bonne pratique n’est pas respectée :** moyen 

## Directives d’implémentation
Directives d’implémentation

 Automatisez le test des environnements déployés pour confirmer les résultats souhaités plus rapidement. Automatisez la restauration du dernier état connu de bonne qualité lorsque les résultats prédéfinis ne sont pas atteints, afin de minimiser les temps de récupération et de réduire les erreurs causées par les processus manuels. Intégrez des outils de test au flux de travail de votre pipeline afin de tester de manière cohérente et de minimiser les saisies manuelles. Privilégiez l’automatisation des cas de test, tels que ceux qui atténuent les risques les plus importants et qui doivent être testés fréquemment à chaque modification. En outre, vous pouvez automatiser la restauration en fonction de conditions spécifiques prédéfinies dans votre plan de test. 

### Étapes d’implémentation
Étapes d’implémentation

1.  Établissez un cycle de test pour votre cycle de développement qui définit chaque étape du processus de test, de la planification des exigences au développement des cas de test, en passant par la configuration des outils, les tests automatisés et la clôture des cas de test. 

   1.  Créez une approche de test spécifique à la charge de travail à partir de votre stratégie de test globale. 

   1.  Envisagez, le cas échéant, une stratégie de tests continus tout au long du cycle de développement. 

1.  Choisissez des outils automatisés pour les tests et la restauration en fonction des besoins de votre entreprise et des investissements dans le pipeline. 

1.  Décidez des cas de test que vous souhaitez automatiser et de ceux qui doivent être exécutés manuellement. Ceux-ci peuvent être définis en fonction de la priorité de la valeur commerciale de la fonctionnalité testée. Alignez tous les membres de l’équipe sur ce plan et vérifiez leur responsabilité en ce qui concerne l’exécution des tests manuels. 

   1.  Appliquez les capacités de test automatisé à des cas de test spécifiques qui se prêtent à l’automatisation, tels que les cas répétables ou fréquemment exécutés, ceux qui nécessitent des tâches répétitives ou ceux qui sont requis dans plusieurs configurations. 

   1.  Définissez les scripts d’automatisation des tests ainsi que les critères de réussite dans l’outil d’automatisation afin que l’automatisation continue du flux de travail puisse être lancée lorsque des cas spécifiques échouent. 

   1.  Définissez des critères d’échec spécifiques pour la restauration automatisée. 

1.  Donnez la priorité à l’automatisation des tests afin d’obtenir des résultats cohérents grâce à un développement approfondi des cas de test où la complexité et l’interaction humaine présentent un risque d’échec plus élevé. 

1.  Intégrez vos outils de tests automatisés et de restauration dans votre pipeline CI/CD. 

   1.  Définissez des critères de réussite clairs pour vos modifications. 

   1.  Surveillez et observez pour détecter ces critères et annuler automatiquement les modifications lorsque des critères de restauration spécifiques sont remplis. 

1.  Procédez à différents types de tests de production automatisés, tels que : 

   1.  des tests A/B pour afficher les résultats par rapport à la version actuelle entre deux groupes d’utilisateurs ; 

   1.  des tests Canary qui vous permettent de déployer votre modification auprès d’un sous-ensemble d’utilisateurs avant de la diffuser à tous ; 

   1.  des tests d’indicateur de fonctions qui permettent d’activer et de désactiver une seule fonctionnalité de la nouvelle version depuis l’extérieur de l’application, de sorte que chaque nouvelle fonctionnalité puisse être validée une à la fois ; 

   1.  des tests de régression pour vérifier les nouvelles fonctionnalités avec les composants interdépendants existants. 

1.  Contrôlez les aspects opérationnels de l’application, les transactions et les interactions avec d’autres applications et composants. Élaborez des rapports pour illustrer le degré de réussite des modifications en fonction de la charge de travail, afin de pouvoir identifier les parties de l’automatisation et du flux de travail qui peuvent être encore optimisées. 

   1.  Élaborez des rapports sur les résultats des tests qui vous aideront à prendre des décisions rapides sur le fait d’invoquer ou non les procédures de restauration. 

   1.  Mettez en œuvre une stratégie permettant une restauration automatisée sur la base de conditions d’échec prédéfinies résultant d’une ou de plusieurs de vos méthodes de test. 

1.  Développez vos cas de test automatisés pour permettre leur réutilisation dans le cadre de futures modifications répétées. 

 **Niveau d’effort du plan d’implémentation :** moyen 

## Ressources
Ressources

 **Bonnes pratiques associées :** 
+  [OPS06-BP01 Planifier les modifications infructueuses](ops_mit_deploy_risks_plan_for_unsucessful_changes.md) 
+  [OPS06-BP02 Déploiements de tests](ops_mit_deploy_risks_test_val_chg.md) 

 **Documents connexes :** 
+ [AWS Builders Library \$1 Garantir la sécurité des annulations lors des déploiements](https://aws.amazon.com/builders-library/ensuring-rollback-safety-during-deployments/)
+  [Redéployez et annulez un déploiement avec AWS CodeDeploy](https://docs.aws.amazon.com/codedeploy/latest/userguide/deployments-rollback-and-redeploy.html) 
+ [8 bonnes pratiques pour automatiser vos déploiements avec AWS CloudFormation](https://aws.amazon.com/blogs/infrastructure-and-automation/best-practices-automating-deployments-with-aws-cloudformation/)

 **Exemples connexes :** 
+ [Test de l'interface utilisateur sans serveur à l'aide de Selenium, AWS LambdaAWS Fargate, et AWS des outils de développement](https://aws.amazon.com/blogs/devops/using-aws-codepipeline-aws-codebuild-and-aws-lambda-for-serverless-automated-ui-testing/)

 **Vidéos connexes :** 
+ [re:Invent 2020 \$1 Hands-off: Automating continuous delivery pipelines at Amazon](https://www.youtube.com/watch?v=ngnMj1zbMPY)
+ [re:Invent 2019 \$1 Amazon’s Approach to high-availability deployment](https://www.youtube.com/watch?v=bCgD2bX1LI4)

# OPS 7. Comment savoir si vous êtes prêt à assurer une charge de travail ?


 Évaluez la disponibilité opérationnelle de votre charge de travail, des processus et des procédures, ainsi que le personnel pour comprendre les risques opérationnels liés à votre charge de travail. 

**Topics**
+ [

# OPS07-BP01 Garantie des compétences du personnel
](ops_ready_to_support_personnel_capability.md)
+ [

# OPS07-BP02 Assurer un examen cohérent de l’état de préparation opérationnelle
](ops_ready_to_support_const_orr.md)
+ [

# OPS07-BP03 Utilisation de runbooks pour effectuer des procédures
](ops_ready_to_support_use_runbooks.md)
+ [

# OPS07-BP04 Utilisation de playbooks pour analyser les problèmes
](ops_ready_to_support_use_playbooks.md)
+ [

# OPS07-BP05 Prise de décisions avisées pour déployer des systèmes et des modifications
](ops_ready_to_support_informed_deploy_decisions.md)
+ [

# OPS07-BP06 Création de plans de support pour les charges de travail de production
](ops_ready_to_support_enable_support_plans.md)

# OPS07-BP01 Garantie des compétences du personnel
OPS07-BP01 Garantie des compétences du personnel

Prévoyez un mécanisme pour confirmer que vous disposez du nombre approprié de membres du personnel formés pour supporter la charge de travail. Ils doivent être formés à la plateforme et aux services qui constituent votre charge de travail. Donnez-leur les connaissances nécessaires pour exploiter la charge de travail. Vous devez former un nombre suffisant de membres du personnel pour assurer le fonctionnement normal de la charge de travail et résoudre les incidents qui surviennent. Prévoyez suffisamment de personnel pour pouvoir effectuer une rotation pendant les astreintes et les vacances afin d’éviter l’épuisement professionnel. 

 **Résultat escompté :** 
+  Le personnel formé est en nombre suffisant pour faire face à la charge de travail lorsque celle-ci est disponible. 
+  Vous assurez la formation de votre personnel sur les logiciels et services qui constituent votre charge de travail. 

 **Anti-modèles courants :** 
+ Déploiement d’une charge de travail sans que les membres de l’équipe soient qualifiés pour gérer la plateforme et les services utilisés. 
+  Ne pas disposer d’un personnel suffisant pour assurer les rotations d’astreinte ou les congés du personnel. 

 **Avantages liés au respect de cette bonne pratique :** 
+  Le fait de disposer de membres d’équipe compétents vous permet de prendre efficacement en charge votre charge de travail. 
+  Avec un nombre suffisant de membres de l’équipe, vous pouvez prendre en charge la charge de travail et les rotations d’astreinte tout en diminuant le risque d’épuisement professionnel. 

 **Niveau d’exposition au risque si cette bonne pratique n’est pas respectée :** élevé 

## Directives d’implémentation
Directives d’implémentation

 Confirmez qu’il y a suffisamment de personnel formé pour soutenir la charge de travail. Vérifiez que vous avez suffisamment de membres de l’équipe pour couvrir les activités opérationnelles normales, y compris les rotations d’astreinte. 

 **Exemple client** 

 AnyCompany Retail veille à ce que les équipes qui prennent en charge la charge de travail soient correctement dotées en personnel et formées. Elles disposent de suffisamment d’ingénieurs pour assurer une rotation d’astreinte. Le personnel reçoit une formation sur le logiciel et la plateforme sur lesquels repose la charge de travail et est encouragé à obtenir des certifications. Il y a suffisamment de membres du personnel pour que les gens puissent prendre des congés tout en prenant en charge la charge de travail et la rotation des astreintes. 

### Étapes d’implémentation
Étapes d’implémentation

1.  Affectez un nombre suffisant d’employés à l’exploitation et au soutien de votre charge de travail, y compris aux tâches d’astreinte, aux problèmes de sécurité et aux événements du cycle de vie, tels que les tâches de fin de prise en charge et de rotation des certificats. 

1.  Formez votre personnel aux logiciels et aux plateformes qui composent votre charge de travail. 

   1.  [AWS Training and Certification](https://aws.amazon.com/training/) dispose d’une bibliothèque de cours sur AWS. Le service propose des cours gratuits et payants, en ligne et en personne. 

   1.  [AWS organise des événements et des webinaires au cours](https://aws.amazon.com/events/) desquels vous pouvez apprendre auprès d’experts AWS. 

1. Effectuez régulièrement les tâches suivantes : 
   +  Évaluez la taille et les compétences de l’équipe en fonction de l’évolution des conditions d’exploitation et de la charge de travail. 
   +  Adaptez la taille et les compétences de l’équipe aux besoins opérationnels. 
   +  Vérifiez l’aptitude et la capacité à [traiter les événements de cycle de vie planifiés](https://docs.aws.amazon.com/health/latest/ug/aws-health-planned-lifecycle-events.html), la sécurité non planifiée et les notifications opérationnelles via AWS Health. 

 **Niveau d’effort du plan d’implémentation :** élevé L’embauche et la formation d’une équipe pour soutenir une charge de travail peuvent demander des efforts considérables, mais présentent des avantages importants à long terme. 

## Ressources
Ressources

 **Bonnes pratiques associées :** 
+  [OPS11-BP04 Effectuer la gestion des connaissances](ops_evolve_ops_knowledge_management.md) – Les membres de l’équipe doivent disposer des informations nécessaires au fonctionnement et au soutien de la charge de travail. La gestion des connaissances est la clé pour y parvenir. 

 **Documents connexes :** 
+  [Événements et webinaires AWS](https://aws.amazon.com/events/) 
+  [Formation et certification AWS](https://aws.amazon.com/training/) 

# OPS07-BP02 Assurer un examen cohérent de l’état de préparation opérationnelle
OPS07-BP02 Assurer un examen cohérent de l’état de préparation opérationnelle

Utilisez les examens de disponibilité opérationnelle (ORR) afin de vous assurer que vous pouvez gérer votre charge de travail. L’ORR est un mécanisme élaboré par Amazon afin de s’assurer que les équipes peuvent exécuter leurs charges de travail en toute sécurité. Un ORR est un processus d’examen et d’inspection qui utilise une liste de contrôle des exigences. Un ORR est une expérience en libre-service que les équipes utilisent pour certifier leurs charges de travail. Les ORR comprennent les bonnes pratiques tirées des enseignements liés aux années que nous avons consacrées à la création de logiciels. 

 La liste de contrôle d’un ORR est composée de recommandations architecturales, de processus opérationnels, de gestion d’événements et de qualité de version. Notre processus de correction des erreurs (CoE) est l’un des principaux moteurs de ces éléments. Votre propre analyse post-incident doit orienter l’évolution de votre propre ORR. Un ORR consiste non seulement à suivre les bonnes pratiques, mais permet également d’éviter la répétition d’événements que vous avez déjà vus. Enfin, les exigences en matière de sécurité, de gouvernance et de conformité peuvent également être incluses dans un ORR. 

 Exécutez les ORR avant qu’une charge de travail ne soit généralement disponible, puis tout au long du cycle de développement du logiciel. L’exécution d’un ORR avant le lancement augmente votre capacité de gestion de la charge de travail en toute sécurité. Réexécutez régulièrement votre ORR sur la charge de travail afin de détecter toute dérive par rapport aux bonnes pratiques. Vous pouvez avoir des listes de contrôle des ORR pour les lancements de nouveaux services et des ORR pour les examens périodiques. Cela vous permet de vous tenir au courant des nouvelles bonnes pratiques et d’intégrer les leçons tirées de l’analyse après incident. Au fur et à mesure que votre utilisation du cloud évolue, vous pouvez intégrer les exigences des ORR dans votre architecture par défaut. 

 **Résultat escompté :** vous avez une liste de contrôle de l’ORR avec les bonnes pratiques pour votre organisation. Les ORR sont effectuées avant le lancement des charges de travail. Les ORR sont exécutés périodiquement tout au long du cycle de vie de la charge de travail. 

 **Anti-modèles courants :** 
+ Vous lancez une charge de travail sans savoir si vous pouvez l’utiliser. 
+ Les exigences en matière de gouvernance et de sécurité ne sont pas incluses dans la certification d’une charge de travail pour le lancement. 
+ Les charges de travail ne sont pas réévaluées périodiquement. 
+ Les charges de travail sont lancées sans procédures requises en place. 
+ Vous voyez la répétition de la même cause première de défaillances dans plusieurs charges de travail. 

 **Avantages liés au respect de cette bonne pratique :** 
+  Vos charges de travail comprennent les bonnes pratiques en matière d’architecture, de processus et de gestion. 
+  Les enseignements tirés sont intégrés à votre processus d’ORR. 
+  Les procédures requises sont en place lors du lancement des charges de travail. 
+  Les ORR sont exécutés tout au long du cycle de vie logiciel de vos charges de travail. 

 **Niveau de risque si cette bonne pratique n’est pas respectée :** élevé 

## Directives d’implémentation
Directives d’implémentation

 Un ORR est composé de deux éléments : un processus et une liste de contrôle. Votre processus d’ORR doit être adopté par votre organisation et soutenu par un responsable exécutif. Au minimum, les ORR doivent être effectués avant qu’une charge de travail ne soit généralement disponible. Exécutez l’ORR tout au long du cycle de développement du logiciel afin de l’actualiser avec les bonnes pratiques ou les nouvelles exigences. La liste de contrôle d’un ORR doit comprendre les éléments de configuration, les exigences en matière de sécurité et de gouvernance et les bonnes pratiques de votre organisation. Au fil du temps, vous pouvez utiliser des services tels que [AWS Config[AWS Security Hub CSPM](https://docs.aws.amazon.com/securityhub/latest/userguide/what-is-securityhub.html)](https://docs.aws.amazon.com/config/latest/developerguide/WhatIsConfig.html), et des [AWS Control Tower Guardrails](https://docs.aws.amazon.com/controltower/latest/userguide/guardrails.html), pour intégrer les meilleures pratiques issues de l’ORR à des barrières de protection afin de détecter automatiquement les meilleures pratiques. 

 **Exemple client** 

 Après plusieurs incidents de production, AnyCompany Retail a décidé de mettre en place un processus d’ORR. L’entreprise a élaboré une liste de contrôle composée de bonnes pratiques, d’exigences en matière de gouvernance et de conformité et d’enseignements tirés des pannes. De nouvelles charges de travail effectuent des ORR avant leur lancement. Chaque charge de travail effectue un ORR annuel avec un sous-ensemble de bonnes pratiques pour intégrer de nouvelles bonnes pratiques et des exigences qui sont ajoutées à la liste de contrôle de l’ORR. Au fil du temps, AnyCompany Retail a utilisé [AWS Config](https://docs.aws.amazon.com/config/latest/developerguide/WhatIsConfig.html) pour détecter certaines bonnes pratiques, accélérant ainsi le processus ORR. 

 **Étapes d’implémentation** 

 Pour en savoir plus sur les ORR, lisez le [livre blanc intitulé Operational Readiness Reviews (ORR)](https://docs.aws.amazon.com/wellarchitected/latest/operational-readiness-reviews/wa-operational-readiness-reviews.html). Il fournit des informations détaillées sur l’historique du processus d’ORR, sur la façon d’établir votre propre pratique d’ORR et sur la façon d’élaborer votre liste de contrôle pour les ORR. Les étapes suivantes sont une version abrégée de ce document. Pour une compréhension approfondie des ORR et de la façon dont vous pouvez créer les vôtres, nous vous recommandons de lire ce livre blanc. 

1. Réunissez les parties prenantes clés, notamment les représentants de la sécurité, des opérations et du développement. 

1. Demandez à chaque partie prenante de fournir au moins une exigence. Pour la première itération, essayez de limiter le nombre d’éléments à trente ou moins. 
   +  L’[Annexe B : exemples de questions ORR](https://docs.aws.amazon.com/wellarchitected/latest/operational-readiness-reviews/appendix-b-example-orr-questions.html) du livre blanc Operational Readiness Reviews (ORR) contient des exemples de questions que vous pouvez utiliser pour démarrer. 

1. Regroupez vos exigences dans une feuille de calcul. 
   + Vous pouvez utiliser des [objectifs personnalisés](https://docs.aws.amazon.com/wellarchitected/latest/userguide/lenses-custom.html) dans [AWS Well-Architected Tool](https://console.aws.amazon.com/wellarchiected/) pour développer vos ORR et les partager entre vos comptes et votre organisation AWS. 

1. Identifiez une charge de travail pour effectuer l’ORR. Il est recommandé d’utiliser une charge de travail avant le lancement ou une charge de travail interne. 

1. Parcourez la liste de contrôle de l’ORR et notez toutes vos découvertes. Les découvertes peuvent être acceptables si une mesure d’atténuation est en place. Pour toute découverte qui ne comporte pas de mesures d’atténuation, ajoutez ces dernières à votre liste de tâches en attente et implémentez-les avant le lancement. 

1. Continuez d’ajouter des bonnes pratiques et des exigences à votre liste de contrôle de l’ORR au fil du temps. 

 Les clients Support bénéficiant du Support aux entreprises peuvent demander l’[atelier de révision du niveau de préparation opérationnelle](https://aws.amazon.com/premiumsupport/technology-and-programs/proactive-services/) auprès de leur responsable de compte technique. L’atelier est une session interactive de *travail à rebours* visant à développer votre propre liste de contrôle ORR. 

 **Niveau d’effort du plan d’implémentation :** élevé L’adoption d’une pratique d’ORR dans votre organisation nécessite un parrainage de la haute direction et l’adhésion des parties prenantes. Créez et mettez à jour la liste de contrôle à l’aide des commentaires de l’ensemble de votre organisation. 

## Ressources
Ressources

 **Bonnes pratiques associées :** 
+ [OPS01-BP03 Évaluer les exigences de gouvernance](ops_priorities_governance_reqs.md) – Les exigences en matière de gouvernance conviennent naturellement à la liste de contrôle d’un ORR. 
+ [OPS01-BP04 Évaluation des exigences de conformité](ops_priorities_compliance_reqs.md) – Les exigences de conformité sont parfois incluses dans la liste de contrôle d’un ORR. Parfois, il s’agit d’un processus distinct. 
+ [OPS03-BP07 Ressources appropriées pour les équipes](ops_org_culture_team_res_appro.md) – La capacité de l’équipe peut faire partie des exigences d’un ORR. 
+ [OPS06-BP01 Planifier les modifications infructueuses](ops_mit_deploy_risks_plan_for_unsucessful_changes.md) – Un plan de restauration ou de retour en arrière doit être établi avant le lancement de votre charge de travail. 
+ [OPS07-BP01 Garantie des compétences du personnel](ops_ready_to_support_personnel_capability.md) – Pour gérer une charge de travail, vous devez disposer du personnel requis. 
+ [SEC01-BP03 Identifier et valider les objectifs de contrôle](https://docs.aws.amazon.com/wellarchitected/latest/framework/sec_securely_operate_control_objectives.html) – Les objectifs de contrôle de sécurité constituent d’excellentes exigences d’ORR. 
+ [REL13-BP01 Définissez les objectifs de restauration en cas d’indisponibilité et de perte de données](https://docs.aws.amazon.com/wellarchitected/latest/framework/rel_planning_for_recovery_objective_defined_recovery.html) – Les plans de reprise après sinistre constituent une bonne exigence ORR. 
+ [COST02-BP01 Élaborez des politiques basées sur les exigences de votre organisation](https://docs.aws.amazon.com/wellarchitected/latest/framework/cost_govern_usage_policies.html) – Les politiques de gestion des coûts sont bonnes à inclure dans votre liste de contrôle ORR. 

 **Documents connexes :** 
+  [AWS Control Tower – Guardrails in AWS Control Tower](https://docs.aws.amazon.com/controltower/latest/userguide/guardrails.html) 
+  [AWS Well-Architected Tool – Approches personnalisées](https://docs.aws.amazon.com/wellarchitected/latest/userguide/lenses-custom.html) 
+  [Operational Readiness Review Template par Adrian Hornsby](https://medium.com/the-cloud-architect/operational-readiness-review-template-e23a4bfd8d79) 
+  [Livre blanc Operational Readiness Reviews (ORR)](https://docs.aws.amazon.com/wellarchitected/latest/operational-readiness-reviews/wa-operational-readiness-reviews.html) 

 **Vidéos connexes :** 
+  [AWS Supports You \$1 Building an Effective Operational Readiness Review (ORR)](https://www.youtube.com/watch?v=Keo6zWMQqS8) 

 **Exemples connexes :** 
+  [Sample Operational Readiness Review (ORR) Lens](https://github.com/aws-samples/custom-lens-wa-sample/tree/main/ORR-Lens) 

 **Services connexes :** 
+  [AWS Config](https://docs.aws.amazon.com/config/latest/developerguide/WhatIsConfig.html) 
+  [AWS Control Tower](https://docs.aws.amazon.com/controltower/latest/userguide/what-is-control-tower.html) 
+  [AWS Security Hub CSPM](https://docs.aws.amazon.com/securityhub/latest/userguide/what-is-securityhub.html) 
+  [AWS Well-Architected Tool](https://docs.aws.amazon.com/wellarchitected/latest/userguide/intro.html) 

# OPS07-BP03 Utilisation de runbooks pour effectuer des procédures
OPS07-BP03 Utilisation de runbooks pour effectuer des procédures

 Un *runbook* est un processus documenté pour atteindre un résultat spécifique. Les runbooks consistent en une série d’étapes permettant à la personne qui les suit d’obtenir des résultats concrets. L’utilisation des runbooks dans les opérations remonte aux débuts de l’aviation. Dans les opérations de cloud, nous utilisons des runbooks pour réduire les risques et obtenir les résultats souhaités. Dans sa forme la plus simple, un runbook est une liste de contrôle pour exécuter une tâche. 

 Les runbooks représentent une part essentielle du fonctionnement de votre charge de travail. De l’intégration d’un nouveau membre de l’équipe au déploiement d’une version majeure, les runbooks sont des processus codifiés qui fournissent des résultats cohérents quelle que soit la personne qui les utilise. Les runbooks doivent être publiés dans un emplacement central et mis à jour à mesure que le processus évolue, car la mise à jour des runbooks est un composant essentiel du processus de gestion des changements. Ils doivent également inclure des conseils sur la gestion des erreurs, les outils, les autorisations, les exceptions et les remontées en cas de problème. 

 À mesure que votre entreprise évolue, commencez à automatiser les runbooks. Prenez tout d’abord les runbooks courts et fréquemment utilisés. Utilisez des langages de scripts pour automatiser les étapes ou les rendre plus faciles. À mesure que vous automatiserez les premiers runbooks, vous consacrerez du temps à l’automatisation de runbooks plus complexes. Au fil du temps, la plupart de vos runbooks seront automatisés d’une certaine façon. 

 **Résultat escompté :** votre équipe dispose de plusieurs guides détaillés pour exécuter des tâches de charge de travail. Les runbooks contiennent le résultat souhaité, les outils et autorisations nécessaires, ainsi que les instructions pour gérer les erreurs. Ils sont stockés dans un emplacement central (système de contrôle des versions) et mis à jour fréquemment. Par exemple, vos runbooks permettent à vos équipes de surveiller, de communiquer et de répondre aux événements AWS Health concernant les comptes critiques lors d’alarmes d’applications, de problèmes opérationnels et d’événements planifiés du cycle de vie. 

 **Anti-modèles courants :** 
+  Utilisation de la mémoire pour exécuter chaque étape d’un processus. 
+  Déploiement manuel des changements sans liste de contrôle. 
+  Différents membres de l’équipe exécutant le même processus, mais avec des étapes ou résultats différents. 
+  Désynchronisation des runbooks avec les changements du système et l’automatisation. 

 **Avantages liés au respect de cette bonne pratique :** 
+  Réduction du taux d’erreur pour les tâches manuelles. 
+  Exécution cohérente des opérations. 
+  Exécution plus précoce des tâches par les nouveaux membres de l’équipe. 
+  Automatisation des runbooks pour diminuer la quantité de travail. 

 **Niveau d’exposition au risque si cette bonne pratique n’est pas respectée :** moyen 

## Directives d’implémentation
Directives d’implémentation

 Les runbooks peuvent prendre plusieurs formes selon le niveau de maturité de votre entreprise. Au minimum, ils doivent consister en un document texte détaillé. Le résultat souhaité doit être clairement indiqué. Documentez explicitement les autorisations spéciales ou outils nécessaires. Fournissez des conseils sur la gestion des erreurs et les remontées en cas de problème. Recherchez le propriétaire du runbook et publiez-le dans un emplacement central. Une fois votre runbook documenté, validez-le en demandant à un membre de votre équipe de l’exécuter. À mesure que les procédures évoluent, mettez à jour vos runbooks conformément à votre processus de gestion des changements. 

 Vos runbooks texte doivent être automatisés à mesure que votre entreprise évolue. En utilisant des services tels que les [automatisations d’AWS Systems Manager](https://docs.aws.amazon.com/systems-manager/latest/userguide/systems-manager-automation.html), vous pouvez transformer un fichier texte en automatisations pouvant être exécutées sur votre charge de travail. Ces automatisations peuvent être exécutées en réponse aux événements, tout en réduisant la charge opérationnelle pour maintenir votre charge de travail. AWS Systems Manager Automation fournit également une [expérience de conception visuelle](https://docs.aws.amazon.com/systems-manager/latest/userguide/automation-visual-designer.html) à faible code pour créer plus facilement des runbooks d’automatisation. 

 **Exemple client** 

 AnyCompany Retail doit mettre à jour des schémas de bases de données lors de déploiements logiciels. L’équipe en charge des opérations de cloud en collaboration avec l’équipe responsable de l’administration des bases de données a créé un runbook, pour déployer manuellement ces changements. Le runbook répertoriait chacune des étapes du processus sous forme de liste de contrôle. Il comprenait une section sur la gestion des erreurs en cas de problème. Les équipes ont publié le runbook sur leur wiki interne contenant leurs autres runbooks. L’équipe en charge des opérations de cloud envisage d’automatiser le runbook dans un prochain sprint. 

### Étapes d’implémentation
Étapes d’implémentation

 Si vous ne disposez pas d’un référentiel de documents, un référentiel de contrôle de version est un emplacement idéal pour commencer à créer votre bibliothèque de runbooks. Vous pouvez créer vos runbooks en utilisant le format Markdown. Voici un exemple de modèle de runbook que vous pouvez utiliser pour commencer à créer vos runbooks. 

```
# Runbook Title
## Runbook Info
| Runbook ID | Description | Tools Used | Special Permissions | Runbook Author | Last Updated | Escalation POC | 
|-------|-------|-------|-------|-------|-------|-------|
| RUN001 | What is this runbook for? What is the desired outcome? | Tools | Permissions | Your Name | 2022-09-21 | Escalation Name |
## Steps
1. Step one
2. Step two
```

1.  Si vous ne possédez pas de référentiel de documentation ou de wiki existant, créez un référentiel de contrôle de version dans votre système de contrôle de version. 

1.  Identifiez un processus ne possédant pas de runbook. Le processus idéal doit être réalisé de manière semi-régulière, contenir peu d’étapes et avoir des échecs à faible impact. 

1.  Dans votre référentiel de documents, créer un brouillon au format Markdown en utilisant le modèle. Renseignez le titre du runbook et les champs obligatoires sous Runbook Info (Informations sur le runbook). 

1.  En commençant par la première étape, remplissez la section Steps (Étapes) du runbook. 

1.  Donnez le runbook à un membre de l’équipe. Demandez-lui d’utiliser le runbook pour valider les étapes. En cas d’élément manquant ou de besoin de clarification, mettez à jour le runbook. 

1.  Publiez le runbook sur votre référentiel de documentation interne. Une fois le runbook publié, partagez l’information avec votre équipe et les autres parties prenantes. 

1.  Au fil du temps, vous créerez une bibliothèque de runbooks. À mesure que cette bibliothèque s’étoffe, commencez à travailler sur l’automatisation des runbooks. 

 **Niveau d’effort du plan d’implémentation :** faible La norme minimum pour un runbook est un guide texte détaillé. L’automatisation des runbooks peut augmenter l’effort d’implémentation. 

## Ressources
Ressources

 **Bonnes pratiques associées :** 
+  [OPS02-BP02 Les processus et procédures ont des propriétaires identifiés](https://docs.aws.amazon.com/wellarchitected/latest/operational-excellence-pillar/ops_ops_model_def_proc_owners.html) 
+  [OPS07-BP04 Utilisation de playbooks pour analyser les problèmes](https://docs.aws.amazon.com/wellarchitected/latest/operational-excellence-pillar/ops_ready_to_support_use_playbooks.html) 
+  [OPS10-BP01 Utilisation d’un processus pour la gestion des événements, des incidents et des problèmes](https://docs.aws.amazon.com/wellarchitected/latest/operational-excellence-pillar/ops_event_response_event_incident_problem_process.html) 
+  [OPS10-BP02 Disposer d’un processus par alerte](https://docs.aws.amazon.com/wellarchitected/latest/operational-excellence-pillar/ops_event_response_process_per_alert.html) 
+  [OPS11-BP04 Gestion des connaissances](https://docs.aws.amazon.com/wellarchitected/latest/operational-excellence-pillar/ops_evolve_ops_knowledge_management.html) 

 **Documents connexes :** 
+  [Achieving Operational Excellence using automated playbook and runbook](https://aws.amazon.com/blogs/mt/achieving-operational-excellence-using-automated-playbook-and-runbook/) 
+  [AWS Systems Manager : utilisation des runbooks](https://docs.aws.amazon.com/systems-manager/latest/userguide/automation-documents.html) 
+  [Playbook d’atténuation des risques pour les importantes migrations AWS – Tâche 4 : amélioration de vos runbooks de migration](https://docs.aws.amazon.com/prescriptive-guidance/latest/large-migration-migration-playbook/task-four-migration-runbooks.html) 
+  [Utiliser les runbooks AWS Automation pour résoudre des tâches opérationnelles](https://aws.amazon.com/blogs/mt/use-aws-systems-manager-automation-runbooks-to-resolve-operational-tasks/) 

 **Vidéos connexes:** 
+  [AWS re:Invent 2019: DIY guide to runbooks, incident reports, and incident response](https://www.youtube.com/watch?v=E1NaYN_fJUo) 
+  [How to automate IT Operations on AWS \$1 Amazon Web Services](https://www.youtube.com/watch?v=GuWj_mlyTug) 
+  [Intégrate Scripts into AWS Systems Manager](https://www.youtube.com/watch?v=Seh1RbnF-uE) 

 **Exemples connexes:** 
+  [Ateliers Well-Architected : automatisation des opérations avec les playbooks et les runbooks](https://wellarchitectedlabs.com/operational-excellence/200_labs/200_automating_operations_with_playbooks_and_runbooks/) 
+  [AWS Article du blog  : Build a Cloud Automation Practice for Operational Excellence: Best Practices from AWS Managed Services](https://aws.amazon.com/blogs/mt/build-a-cloud-automation-practice-for-operational-excellence-best-practices-from-aws-managed-services/) 
+  [AWS Systems Manager : procédures détaillées sur l’automatisation](https://docs.aws.amazon.com/systems-manager/latest/userguide/automation-walk.html) 
+  [AWS Systems Manager : restaurer un volume racine à partir du dernier runbook d’instantanés](https://docs.aws.amazon.com/systems-manager/latest/userguide/automation-document-sample-restore.html) 
+  [Création d’un runbook de réponse à un incident AWS à l’aide des blocs-notes Jupyter et de CloudTrail Lake](https://catalog.us-east-1.prod.workshops.aws/workshops/a5801f0c-7bd6-4282-91ae-4dfeb926a035/en-US) 
+  [Gitlab – Runbooks](https://gitlab.com/gitlab-com/runbooks) 
+  [Rubix – Une bibliothèque Python pour créer des runbooks dans les blocs-notes Jupyter](https://github.com/Nurtch/rubix) 
+  [Utilisation de Document Builder pour créer un runbook personnalisé](https://docs.aws.amazon.com/systems-manager/latest/userguide/automation-walk-document-builder.html) 

 **Services connexes:** 
+  [AWS Systems Manager Automation](https://docs.aws.amazon.com/systems-manager/latest/userguide/systems-manager-automation.html) 

# OPS07-BP04 Utilisation de playbooks pour analyser les problèmes
OPS07-BP04 Utilisation de playbooks pour analyser les problèmes

 Les *playbooks* sont des guides étape par étape utilisés pour analyser un incident. Lorsque des incidents se produisent, les playbooks sont utilisés pour analyser, évaluer l’impact et identifier une cause racine. Les playbooks sont utilisés dans le cadre de différents scénarios allant des échecs de déploiement aux incidents de sécurité. Dans la plupart des cas, les playbooks identifient la cause racine qui est atténuée par l’utilisation d’un runbook. Les playbooks sont une composante essentielle des plans de réponse de votre organisation en cas d’incident. 

 Un playbook efficace comporte plusieurs fonctionnalités clés. Il guide l’utilisateur, étape par étape, dans le processus de découverte. Si vous optez pour un point de vue extérieur, quelles étapes devez-vous suivre pour diagnostiquer un incident ? Définissez clairement dans le playbook si des outils spéciaux ou des autorisations élevées sont nécessaires. Il est essentiel d’élaborer un plan de communication pour informer les parties prenantes du statut de l’analyse. Lorsqu’il est impossible de déterminer la cause racine, le playbook doit comporter un plan de remontée des informations vers la hiérarchie. Si la cause racine est identifiée, le playbook doit faire référence à un runbook décrivant une solution pour la résoudre. Les playbooks doivent être stockés dans un emplacement central et mis à jour régulièrement. Si des playbooks sont utilisés pour des alertes précises, donnez aux membres de votre équipe des indications relatives au playbook dans le cadre de l’alerte. 

 Au fur et à mesure que votre organisation évolue, automatisez vos playbooks. Commencez par des playbooks qui couvrent les incidents à faible risque. Utilisez des scripts pour automatiser les étapes de découverte. Veillez à créer des runbooks complémentaires destinés à atténuer les causes racines courantes. 

 **Résultat escompté :** votre organisation dispose de playbooks pour les incidents courants. Les playbooks sont stockés dans un emplacement central et mis à la disposition des membres de votre équipe. Les playbooks sont souvent mis à jour. Pour toute cause racine connue, des runbooks complémentaires sont créés. 

 **Anti-modèles courants :** 
+  Il n’existe pas de façon standard d’analyser un incident. 
+  Les membres de l’équipe comptent sur la mémoire musculaire ou les connaissances institutionnelles pour résoudre un échec de déploiement. 
+  Les nouveaux membres de l’équipe apprennent à analyser les problèmes par un procédé de tâtonnement. 
+  Les bonnes pratiques d’analyse des problèmes ne sont pas partagées entre les équipes. 

 **Avantages liés au respect de cette bonne pratique :** 
+  Les playbooks dynamisent les efforts nécessaires pour atténuer les incidents. 
+  Différents membres de l’équipe peuvent utiliser le même playbook pour identifier une cause racine de façon cohérente. 
+  Les causes racines connues peuvent être associées à des runbooks développés spécialement pour leur résolution, ce qui permet d’accélérer le délai de récupération. 
+  Les playbooks permettent aux membres de l’équipe de commencer à apporter leur contribution plus tôt. 
+  Les équipes peuvent adapter leurs processus à l’aide de playbooks reproductibles. 

 **Niveau d’exposition au risque si cette bonne pratique n’est pas respectée :** moyen 

## Directives d’implémentation
Directives d’implémentation

 La façon dont vous créez et utilisez les playbooks dépend de la maturité de votre organisation. Si vous débutez dans le cloud, créez des playbooks sous forme de texte dans un référentiel de documents centralisé. Au fur et à mesure que votre organisation évolue, les playbooks peuvent devenir semi-automatisés avec des langages de script comme Python. Ces scripts peuvent être exécutés dans un bloc-notes Jupyter afin d’accélérer la découverte. Les organisations avancées ont des playbooks entièrement automatisés pour les problèmes courants qui sont corrigés automatiquement avec des runbooks. 

 Pour commencer à créer vos playbooks, répertoriez les incidents qui affectent couramment votre charge de travail. Pour commencer, choisissez des playbooks pour les incidents à faible risque dont la cause racine a été réduite à quelques problèmes. Une fois que vous disposez de playbooks pour des scénarios plus simples, passez aux scénarios à risque élevé ou à ceux dont la cause racine est peu connue. 

 Vos playbooks sous forme de texte doivent être automatisés à mesure que votre entreprise évolue. Grâce à des services comme [AWS Systems Manager Automations](https://docs.aws.amazon.com/systems-manager/latest/userguide/systems-manager-automation.html), les textes plats peuvent être transformés en automatismes. Ces automatisations peuvent être exécutées en fonction de votre charge de travail pour accélérer les analyses. Ces automatisations peuvent être activées en réponse à des événements, ce qui réduit le temps nécessaire pour découvrir et résoudre les incidents. 

 Les clients peuvent utiliser [AWS Systems Manager Incident Manager](https://docs.aws.amazon.com/incident-manager/latest/userguide/what-is-incident-manager.html) pour intervenir en cas d’incidents. Ce service offre une interface unique pour trier les incidents, informer les parties prenantes pendant la découverte et l’atténuation, et collaborer tout au long de l’incident. Il utilise AWS Systems Manager Automations afin d’accélérer la détection et la récupération. 

 **Exemple client** 

 AnyCompany Retail a dû faire face à un incident de production. L’ingénieur d’astreinte a utilisé un playbook pour analyser le problème. À mesure qu’il effectuait les différentes étapes, il a informé les parties prenantes identifiées dans le playbook de l’évolution de la situation. L’ingénieur a identifié que la cause racine était une condition de concurrence dans un service dorsal. À l’aide d’un runbook, il a relancé le service et a permis à AnyCompany Retail d’être à nouveau en ligne. 

### Étapes d’implémentation
Étapes d’implémentation

 Si vous n’avez pas de référentiel de documents existant, nous vous suggérons de créer un référentiel de contrôle de version pour votre bibliothèque de playbooks. Vous pouvez créer vos playbooks en utilisant Markdown, qui est compatible avec la plupart des systèmes d’automatisation de playbook. Si vous démarrez de zéro, utilisez l’exemple de modèle de playbook suivant. 

```
# Playbook Title
## Playbook Info
| Playbook ID | Description | Tools Used | Special Permissions | Playbook Author | Last Updated | Escalation POC | Stakeholders | Communication Plan |
|-------|-------|-------|-------|-------|-------|-------|-------|-------|
| RUN001 | What is this playbook for? What incident is it used for? | Tools | Permissions | Your Name | 2022-09-21 | Escalation Name | Stakeholder Name | How will updates be communicated during the investigation? |
## Steps
1. Step one
2. Step two
```

1.  Si vous ne possédez pas de référentiel de documents ni de wiki existant, créez un référentiel de contrôle de version pour vos playbooks dans votre système de contrôle de version. 

1.  Identifiez un problème courant qui doit être analysé. Il doit s’agir d’un scénario où la cause racine se limite à quelques problèmes et où la résolution présente peu de risques. 

1.  À l’aide du modèle Markdown, remplissez la section Playbook Name (Nom du playbook) et les champs sous Playbook Info (Informations sur le playbook). 

1.  Remplissez les étapes de résolution du problème. Soyez aussi clair que possible sur les actions à effectuer ou les domaines à analyser. 

1.  Remettez le playbook à un membre de l’équipe et demandez-lui de le passer en revue afin de le valider. S’il manque quelque chose ou si un point n’est pas clair, mettez à jour le playbook. 

1.  Publiez le playbook dans votre référentiel de documents et informez votre équipe et les parties prenantes. 

1.  Cette bibliothèque de playbooks s’enrichira à mesure que vous ajouterez d’autres playbooks. Une fois que vous avez plusieurs playbooks, commencez à les automatiser en utilisant des outils comme AWS Systems Manager Automations afin de garantir la synchronisation entre l’automatisation et les playbooks. 

 **Niveau d’effort du plan d’implémentation :** faible Vos playbooks doivent être des documents texte stockés dans un emplacement central. Les organisations plus avancées évolueront vers l’automatisation des playbooks. 

## Ressources
Ressources

 **Bonnes pratiques associées :** 
+  [OPS02-BP02 Les processus et procédures ont des propriétaires identifiés](https://docs.aws.amazon.com/wellarchitected/latest/operational-excellence-pillar/ops_ops_model_def_proc_owners.html) 
+  [OPS07-BP03 Utilisation de runbooks pour effectuer des procédures](https://docs.aws.amazon.com/wellarchitected/latest/operational-excellence-pillar/ops_ready_to_support_use_runbooks.html) 
+  [OPS10-BP01 Utilisation d’un processus pour la gestion des événements, des incidents et des problèmes](https://docs.aws.amazon.com/wellarchitected/latest/operational-excellence-pillar/ops_event_response_event_incident_problem_process.html) 
+  [OPS10-BP02 Disposer d’un processus par alerte](https://docs.aws.amazon.com/wellarchitected/latest/operational-excellence-pillar/ops_event_response_process_per_alert.html) 
+  [OPS11-BP04 Gestion des connaissances](https://docs.aws.amazon.com/wellarchitected/latest/operational-excellence-pillar/ops_evolve_ops_knowledge_management.html) 

 **Documents connexes :** 
+  [Achieving Operational Excellence using automated playbook and runbook](https://aws.amazon.com/blogs/mt/achieving-operational-excellence-using-automated-playbook-and-runbook/) 
+  [AWS Systems Manager : utilisation des runbooks](https://docs.aws.amazon.com/systems-manager/latest/userguide/automation-documents.html) 
+  [Utiliser les runbooks AWS Automation pour résoudre des tâches opérationnelles](https://aws.amazon.com/blogs/mt/use-aws-systems-manager-automation-runbooks-to-resolve-operational-tasks/) 

 **Vidéos connexes:** 
+  [AWS re:Invent 2019: DIY guide to runbooks, incident reports, and incident response (SEC318-R1)](https://www.youtube.com/watch?v=E1NaYN_fJUo) 
+  [AWSSystems Manager Incident Manager : ateliers AWS virtuels](https://www.youtube.com/watch?v=KNOc0DxuBSY) 
+  [Intégrate Scripts into AWS Systems Manager](https://www.youtube.com/watch?v=Seh1RbnF-uE) 

 **Exemples connexes:** 
+  [AWS Customer Playbook Framework](https://github.com/aws-samples/aws-customer-playbook-framework) 
+  [AWS Systems Manager : procédures détaillées sur l’automatisation](https://docs.aws.amazon.com/systems-manager/latest/userguide/automation-walk.html) 
+  [Création d’un runbook de réponse à un incident AWS à l’aide des blocs-notes Jupyter et de CloudTrail Lake](https://catalog.workshops.aws/workshops/a5801f0c-7bd6-4282-91ae-4dfeb926a035/en-US) 
+  [Rubix : une bibliothèque Python pour créer des runbooks dans les blocs-notes Jupyter](https://github.com/Nurtch/rubix) 
+  [Utilisation de Document Builder pour créer un runbook personnalisé](https://docs.aws.amazon.com/systems-manager/latest/userguide/automation-walk-document-builder.html) 

 **Services connexes:** 
+  [AWS Systems Manager Automation](https://docs.aws.amazon.com/systems-manager/latest/userguide/systems-manager-automation.html) 
+  [AWS Systems Manager Incident Manager](https://docs.aws.amazon.com/incident-manager/latest/userguide/what-is-incident-manager.html) 

# OPS07-BP05 Prise de décisions avisées pour déployer des systèmes et des modifications
OPS07-BP05 Prise de décisions avisées pour déployer des systèmes et des modifications

Mettez en place des processus pour les modifications réussies et ratées de votre charge de travail. Un pré-mortem est un exercice où une équipe simule un échec pour développer des stratégies d’atténuation. Utilisez des pré-mortems pour anticiper les échecs et créer des procédures le cas échéant. Évaluez les avantages et les risques liés au déploiement de modifications dans votre charge de travail. Vérifiez que toutes les modifications sont conformes à la gouvernance. 

 **Résultat escompté :** 
+  Vous prenez des décisions éclairées lorsque vous déployez des modifications dans votre charge de travail. 
+  Les modifications sont conformes à la gouvernance. 

 **Anti-modèles courants :** 
+ Déploiement d’une modification dans notre charge de travail sans disposer de processus pour gérer un déploiement raté.
+ Modifications apportées à votre environnement de production qui ne sont pas conformes aux exigences de gouvernance.
+ Déploiement une nouvelle version de votre charge de travail sans établir une base de référence pour l’utilisation des ressources.

 **Avantages liés au respect de cette bonne pratique :** 
+  Vous êtes préparé à des modifications ratées de votre charge de travail. 
+  Les modifications apportées à votre charge de travail sont conformes aux politiques de gouvernance. 

 **Niveau d’exposition au risque si cette bonne pratique n’est pas respectée :** bas 

## Directives d’implémentation
Directives d’implémentation

 Utilisez des pré-mortems pour développer des processus pour les modifications ratées. Documentez vos processus pour les modifications ratées. Veillez à ce que toutes les modifications soient conformes à la gouvernance. Évaluez les avantages et les risques liés au déploiement de modifications dans votre charge de travail. 

 **Exemple client** 

 AnyCompany Retail effectue régulièrement des pré-mortems pour valider ses processus en cas de modification ratée. La société documente ses processus dans un wiki partagé et le met à jour fréquemment. Toutes les modifications sont conformes aux exigences de gouvernance. 

 **Étapes d’implémentation** 

1.  Prenez des décisions éclairées lorsque vous déployez des modifications dans votre charge de travail. Définissez et révisez les critères d’un déploiement réussi. Développez des scénarios ou des critères qui déclencheraient la restauration d’une modification. Comparez les avantages du déploiement des modifications avec les risques associés à l’échec d’une modification. 

1.  Vérifiez que toutes les modifications sont conformes aux politiques de gouvernance. 

1.  Utilisez les pré-mortems pour planifier les modifications ratées et documenter les stratégies d’atténuation. Réalisez un exercice théorique pour modéliser une modification qui n’a pas abouti et valider les procédures de restauration. 

 **Niveau d’effort du plan d’implémentation :** modéré La mise en œuvre d’une pratique de pré-mortems nécessite une coordination et des efforts de la part des parties prenantes de votre organisation. 

## Ressources
Ressources

 **Bonnes pratiques associées :** 
+  [OPS01-BP03 Évaluer les exigences de gouvernance](ops_priorities_governance_reqs.md) – Les exigences de gouvernance sont un facteur clé pour déterminer s’il faut déployer une modification. 
+  [OPS06-BP01 Planifier les modifications infructueuses](ops_mit_deploy_risks_plan_for_unsucessful_changes.md) – Établissez des plans pour atténuer les effets d’un déploiement raté et utilisez des pré-mortems pour les valider. 
+  [OPS06-BP02 Déploiements de tests](ops_mit_deploy_risks_test_val_chg.md) – Chaque modification apportée à un logiciel doit être correctement testée avant le déploiement afin de réduire les défauts en production. 
+  [OPS07-BP01 Garantie des compétences du personnel](ops_ready_to_support_personnel_capability.md) – Il est essentiel de disposer de suffisamment de membres du personnel formés pour gérer la charge de travail afin de prendre une décision éclairée quant au déploiement d’une modification du système. 

 **Documents connexes :** 
+ [Amazon Web Services : risques et conformité](https://docs.aws.amazon.com/whitepapers/latest/aws-risk-and-compliance/welcome.html)
+ [Modèle de responsabilité partagée AWS](https://aws.amazon.com/compliance/shared-responsibility-model/)
+ [ Governance in the AWS Cloud: The Right Balance Between Agility and Safety ](https://aws.amazon.com/blogs/apn/governance-in-the-aws-cloud-the-right-balance-between-agility-and-safety/)

# OPS07-BP06 Création de plans de support pour les charges de travail de production
OPS07-BP06 Création de plans de support pour les charges de travail de production

 Activez la prise en charge de tous les logiciels et services sur lesquels repose votre charge de travail de production. Sélectionnez un niveau de support approprié pour répondre à vos besoins en matière de niveau de service de production. Il convient de prévoir des plans de support pour ces dépendances en cas d’interruption de service ou de problème logiciel. Documentez les plans de support et les procédures de demande de support pour tous les fournisseurs de services et de logiciels. Mettez en œuvre des mécanismes permettant de vérifier que les points de contact du support sont tenus à jour. 

 **Résultat escompté :** 
+  Mettez en œuvre des plans de support pour les logiciels et les services sur lesquels reposent les charges de travail de production. 
+  Choisissez une formule de support appropriée en fonction des besoins du niveau de service. 
+  Documentez les formules de support, les niveaux de support et les procédures de demande de support. 

 **Anti-modèles courants :** 
+  Vous n’avez pas de plan de support pour un fournisseur de logiciels critiques. Votre charge de travail en est affectée et vous ne pouvez rien faire pour accélérer la mise en place d’une solution ou obtenir des mises à jour en temps voulu de la part du fournisseur. 
+  Un développeur qui était le principal point de contact d’un fournisseur de logiciels a quitté l’entreprise. Vous n’arrivez pas à joindre directement le support du fournisseur. Vous devez passer du temps à rechercher et à naviguer dans des systèmes de contact génériques, ce qui augmente le temps nécessaire pour répondre en cas de besoin. 
+  Un fournisseur de logiciels connaît un arrêt de production. Il n’existe pas de documentation sur la manière de déposer un dossier de support. 

 **Avantages liés au respect de cette bonne pratique :** 
+  En adoptant le niveau de support approprié, vous êtes en mesure d’obtenir une réponse dans le délai nécessaire pour répondre aux besoins du niveau de service. 
+  En tant que client bénéficiant du support, vous pouvez faire remonter les problèmes de production. 
+  Les fournisseurs de logiciels et de services peuvent contribuer au dépannage pendant un incident. 

 **Niveau d’exposition au risque si cette bonne pratique n’est pas respectée :** bas 

## Directives d’implémentation
Directives d’implémentation

 Activez les plans de support pour tous les fournisseurs de logiciels et de services sur lesquels repose votre charge de travail de production. Mettez en place des plans de support appropriés pour répondre aux besoins du niveau de service. Pour les clients AWS, cela signifie qu’il faut activer l’offre AWS Business Support ou supérieure sur tous les comptes où vous avez des charges de travail de production. Rencontrez régulièrement les fournisseurs de services de support afin d’obtenir des informations actualisées sur les offres de support, les processus et les contacts. Documentez les procédures de demande de support auprès des fournisseurs de logiciels et de services, y compris la manière de faire remonter les informations en cas de panne. Mettez en œuvre des mécanismes permettant de tenir à jour les contacts du support. 

 **Exemple client** 

 Chez AnyCompany Retail, toutes les dépendances des logiciels et services commerciaux disposent de plans de support. Par exemple, l’offre AWS Enterprise Support est activée sur tous les comptes comportant des charges de travail de production. Tout développeur peut créer une demande de support en cas de problème. Il existe une page wiki contenant des informations sur la manière de demander de l’aide, sur les personnes à prévenir et sur les bonnes pratiques pour accélérer le traitement d’un incident. 

 **Étapes d’implémentation** 

1.  Travaillez avec les parties prenantes de votre organisation pour identifier les fournisseurs de logiciels et de services sur lesquels repose votre charge de travail. Documentez ces dépendances. 

1.  Déterminez les besoins en matière de niveau de service pour votre charge de travail. Sélectionnez un plan de support qui leur corresponde. 

1.  Pour les logiciels et services commerciaux, mettez en place une formule de support avec les fournisseurs. 

   1.  Nous vous conseillons vivement de souscrire à AWS Business Support ou à un niveau supérieur pour tous les comptes de production, ce qui vous permettra de bénéficier de temps de réponse plus courts de la part de AWS Support. Si vous ne disposez pas d’une offre de support premium, mettez en place un plan d’action pour gérer les problèmes qui nécessitent l’aide d’AWS Support. AWS Support fournit une combinaison d’outils et de technologies, de personnes et de programmes conçus pour vous aider à optimiser les performances, à réduire les coûts et à innover plus rapidement. En outre, AWS Business Support offre des avantages supplémentaires, notamment un accès par API à AWS Trusted Advisor et à AWS Health pour une intégration programmatique avec vos systèmes, ainsi que d’autres méthodes d’accès telles que la AWS Management Console et les canaux Amazon EventBridge. 

1.  Documentez le plan de support dans votre outil de gestion des connaissances. Il s’agit notamment de savoir comment demander de l’aide, qui avertir en cas de demande de support et comment faire remonter l’information pendant un incident. Un wiki constitue un bon mécanisme pour permettre à quiconque d’apporter les mises à jour nécessaires à la documentation lorsqu’il prend connaissance de changements dans les processus ou les contacts de support. 

 **Niveau d’effort du plan d’implémentation :** faible La plupart des fournisseurs de logiciels et de services proposent des plans de support à l’inscription. La documentation et le partage des bonnes pratiques en matière de support sur votre système de gestion des connaissances permettent de vérifier que votre équipe sait ce qu’il faut faire en cas d’incident de production. 

## Ressources
Ressources

 **Bonnes pratiques associées :** 
+  [OPS02-BP02 Les processus et procédures ont des propriétaires identifiés](ops_ops_model_def_proc_owners.md) 

 **Documents connexes :** 
+ [AWS Support Plans](https://docs.aws.amazon.com/awssupport/latest/user/aws-support-plans.html)

 **Services connexes :** 
+ [AWS Business Support ](https://aws.amazon.com/premiumsupport/plans/business/)
+ [AWS Enterprise Support](https://aws.amazon.com/premiumsupport/plans/enterprise/)