# Excellence opérationnelle
<a name="a-operational-excellence"></a>

**Topics**
+ [Organisation](a-organization.md)
+ [Préparation](a-prepare.md)
+ [Exploiter](a-operate.md)
+ [Évolution](a-evolve.md)

# Organisation
<a name="a-organization"></a>

**Topics**
+ [OPS 1  Comment déterminer vos priorités ?](w2aac19b5b5b5.md)
+ [OPS 2  Comment structurer votre entreprise pour soutenir les résultats métier ?](w2aac19b5b5b7.md)
+ [OPS 3  Comment votre culture d'entreprise soutient-elle vos résultats métier ?](w2aac19b5b5b9.md)

# OPS 1  Comment déterminer vos priorités ?
<a name="w2aac19b5b5b5"></a>

 Chacun doit comprendre le rôle qu'il a à jouer pour permettre la réussite de l'entreprise. Établissez des objectifs partagés afin de définir des priorités pour les ressources. Cela permet de maximiser le fruit de vos efforts. 

**Topics**
+ [OPS01-BP01 Évaluer les besoins des clients externes](ops_priorities_ext_cust_needs.md)
+ [OPS01-BP02 Évaluer les besoins des clients internes](ops_priorities_int_cust_needs.md)
+ [OPS01-BP03 Évaluer les exigences de gouvernance](ops_priorities_governance_reqs.md)
+ [OPS01-BP04 Évaluer les exigences de conformité](ops_priorities_compliance_reqs.md)
+ [OPS01-BP05 Évaluer les menaces existantes](ops_priorities_eval_threat_landscape.md)
+ [OPS01-BP06 Évaluer les compromis](ops_priorities_eval_tradeoffs.md)
+ [OPS01-BP07 Gérer les avantages et les risques](ops_priorities_manage_risk_benefit.md)

# OPS01-BP01 Évaluer les besoins des clients externes
<a name="ops_priorities_ext_cust_needs"></a>

 Impliquez les principales parties prenantes, notamment les équipes commerciales, de développement et d'exploitation, pour déterminer où il est nécessaire de concentrer les efforts sur les besoins des clients externes. Vous aurez ainsi une compréhension approfondie du soutien opérationnel nécessaire pour atteindre les résultats opérationnels souhaités. 

 **Anti-modèles courants :** 
+  Vous avez décidé de ne pas bénéficier du service client en dehors des heures de bureau, mais vous n'avez pas examiné les données historiques des demandes d'assistance. Vous ne savez pas si cela aura un impact sur vos clients. 
+  Vous développez une nouvelle fonctionnalité, mais n'avez pas contacté vos clients pour déterminer si elle est souhaitée, sous quelle forme, et sans expérimentation pour valider le besoin et la méthode de distribution. 

 **Avantages liés au respect de cette bonne pratique :** Les clients dont les besoins sont satisfaits sont beaucoup plus susceptibles de rester fidèles. L'évaluation et la compréhension des besoins des clients externes vous permettent d'établir des priorités dans vos efforts pour apporter de la valeur ajoutée à votre entreprise. 

 **Niveau de risque exposé si cette bonne pratique n'est pas respectée :** Débit 

## Directives d'implémentation
<a name="implementation-guidance"></a>
+  Comprendre les besoins de l'entreprise : la réussite s'obtient en établissant des objectifs et une compréhension communs entre les différents acteurs, y compris les équipes commerciales, de développement et d'opérations. 
  +  Analyser les objectifs de l'entreprise, les besoins et les priorités des clients externes : impliquez les acteurs clés, notamment, les équipes commerciales, du développement et des opérations, pour discuter des objectifs, besoins et priorités des clients externes. Cela permet de vérifier que vous comprenez bien le soutien opérationnel requis pour atteindre les résultats de l’entreprise et des clients. 
  +  Établir une compréhension commune : établissez une compréhension commune des fonctions opérationnelles de la charge de travail, des rôles de chacune des équipes dans l'exploitation de la charge de travail, et de la manière dont ces facteurs soutiennent les objectifs opérationnels partagés chez les clients internes et externes. 

## Ressources
<a name="resources"></a>

 **Documents connexes :** 
+  [Concepts AWS Well-Architected Framework – Boucle de rétroaction](https://wa.aws.amazon.com/wellarchitected/2020-07-02T19-33-23/wat.concept.feedback-loop.en.html) 

# OPS01-BP02 Évaluer les besoins des clients internes
<a name="ops_priorities_int_cust_needs"></a>

 Impliquez les principales parties prenantes, notamment les équipes commerciales, de développement et d'exploitation, lorsqu'il s'agit de déterminer où il est nécessaire de concentrer les efforts sur les besoins des clients internes. Ainsi, vous aurez une connaissance approfondie du soutien opérationnel requis pour atteindre les résultats opérationnels. 

 Tenez compte des priorités que vous avez établies pour concentrer vos efforts d'amélioration là où ils auront le plus d'impact (par exemple, le développement des compétences de l'équipe, l'amélioration des performances des charges de travail, la réduction des coûts, l'automatisation des runbooks ou encore l'amélioration de la surveillance). Mettez à jour vos priorités en fonction de vos besoins. 

 **Anti-modèles courants :** 
+  Vous avez décidé de modifier l'attribution des adresses IP de vos équipes de produits sans les consulter, afin de faciliter la gestion de votre réseau. Vous ne connaissez pas l'impact que cela aura sur vos équipes de produits. 
+  Vous mettez en place un nouvel outil de développement, mais vous n'avez pas demandé à vos clients internes s'ils en ont besoin ou s'il est compatible avec leurs pratiques existantes. 
+  Vous mettez en place un nouveau système de surveillance, mais vous demandez à vos clients internes s'ils ont des besoins en matière de surveillance ou de rapports à prendre en compte. 

 **Avantages liés au respect de cette bonne pratique :** L'évaluation et la compréhension des besoins des clients internes vous permettent d'établir des priorités dans vos efforts pour apporter de la valeur ajoutée à votre entreprise. 

 **Niveau de risque exposé si cette bonne pratique n'est pas respectée :** Débit 

## Directives d'implémentation
<a name="implementation-guidance"></a>
+  Comprendre les besoins de l'entreprise : la réussite s'obtient en établissant des objectifs et une compréhension communs entre les différents acteurs, y compris les équipes commerciales, de développement et d'opérations. 
  +  Analyser les objectifs de l'entreprise, les besoins et les priorités des clients internes : impliquez les acteurs clés, notamment, les équipes commerciales, du développement et des opérations, pour discuter des objectifs, besoins et priorités des clients internes. Cela permet de vérifier que vous comprenez bien le soutien opérationnel requis pour atteindre les résultats de l’entreprise et des clients. 
  +  Établir une compréhension commune : établissez une compréhension commune des fonctions opérationnelles de la charge de travail, des rôles de chacune des équipes dans l'exploitation de la charge de travail, et de la manière dont ces facteurs soutiennent les objectifs opérationnels partagés chez les clients internes et externes. 

## Ressources
<a name="resources"></a>

 **Documents connexes :** 
+  [Concepts AWS Well-Architected Framework – Boucle de rétroaction](https://wa.aws.amazon.com/wellarchitected/2020-07-02T19-33-23/wat.concept.feedback-loop.en.html) 

# OPS01-BP03 Évaluer les exigences de gouvernance
<a name="ops_priorities_governance_reqs"></a>

 Vérifiez que vous connaissez les lignes directrices ou les obligations définies par votre organisation qui peuvent imposer ou mettre l'accent sur un point particulier. Évaluer les facteurs internes, tels que la politique, les normes et les exigences de l'organisation. Vérifiez que vous disposez de mécanismes permettant d'identifier les changements de gouvernance. Si aucune exigence de gouvernance n'est identifiée, assurez-vous d’avoir effectué les vérifications préalables dans cette détermination. 

 **Anti-modèles courants :** 
+  Vous êtes soumis à un audit et il vous est demandé de fournir la preuve du respect de la gouvernance interne. Vous ne savez pas si vous êtes en conformité, car vous n'avez jamais évalué vos exigences de conformité. 
+  Votre sécurité a été compromise et vous avez subi une perte financière. Vous découvrez que l'assurance qui aurait couvert la perte financière était subordonnée à la mise en œuvre de contrôles de sécurité spécifiques qui ne sont pas en place et exigés par votre gouvernance. 
+  Votre compte d'administration a été compromis, ce qui a entraîné l'arrêt du site Web de votre entreprise et nuit à la confiance des clients. Votre gouvernance interne nécessite l'utilisation de l'authentification multifacteur (MFA) pour sécuriser les comptes d'administration. Vous n'avez pas sécurisé votre compte d'administration avec MFA et vous êtes soumis à des mesures disciplinaires. 

 **Avantages liés au respect de cette bonne pratique :** L'évaluation et la compréhension des exigences de gouvernance que votre organisation applique à votre charge de travail vous permettent d'établir des priorités dans vos efforts pour apporter de la valeur ajoutée. 

 **Niveau de risque exposé si cette bonne pratique n'est pas respectée :** Débit 

## Directives d'implémentation
<a name="implementation-guidance"></a>
+  Comprendre les exigences de gouvernance : évaluez les facteurs de gouvernance interne, tels que la politique du programme ou de l'organisation, les politiques du programme, les politiques spécifiques à une question ou à un système, les normes, les procédures, les points de référence et les lignes directrices. Vérifiez que vous disposez de mécanismes permettant d'identifier les changements de gouvernance. Si aucune exigence de gouvernance n'est identifiée, assurez-vous d’avoir effectué les vérifications préalables dans cette détermination. 

## Ressources
<a name="resources"></a>

 **Documents connexes :** 
+  [Conformité du AWS Cloud](https://aws.amazon.com/compliance/) 

# OPS01-BP04 Évaluer les exigences de conformité
<a name="ops_priorities_compliance_reqs"></a>

 Évaluez les facteurs externes, tels que les exigences de conformité réglementaire et les normes sectorielles, afin de vous assurer que vous connaissez les lignes directrices ou les obligations qui pourraient imposer ou exiger de mettre l'accent sur un point particulier. Si aucune exigence n'est identifiée, assurez-vous d’avoir effectué les vérifications préalables dans cette détermination. 

 **Anti-modèles courants :** 
+  Vous faites l'objet d'un audit et vous êtes invité à fournir une preuve de conformité aux réglementations du secteur. Vous ne savez pas si vous êtes en conformité, car vous n'avez jamais évalué vos exigences de conformité. 
+  Votre compte administratif a été compromis, ce qui a entraîné le téléchargement des données client et nuit à la confiance des clients. Vos bonnes pratiques du secteur nécessitent l'utilisation de MFA pour sécuriser les comptes d'administration. Vous n'avez pas sécurisé votre compte d’administration avec MFA et vous faites l'objet d'un litige de votre part. 

 **Avantages liés au respect de cette bonne pratique :** L'évaluation et la compréhension des exigences de conformité qui s'appliquent à votre charge de travail détermineront la façon dont vous priorisez vos efforts pour produire de la valeur ajoutée. 

 **Niveau de risque exposé si cette bonne pratique n'est pas respectée :** Débit 

## Directives d'implémentation
<a name="implementation-guidance"></a>
+  Comprendre les exigences de conformité : évaluez les facteurs externes, tels que les exigences de conformité réglementaire et les normes sectorielles, afin de vous assurer que vous connaissez les lignes directrices ou les obligations qui pourraient imposer ou exiger de mettre l'accent sur un point particulier. Si aucune exigence n'est identifiée, assurez-vous d’avoir effectué les vérifications préalables dans cette détermination. 
  +  Comprendre les exigences de conformité réglementaires : identifiez les exigences de conformité réglementaires auxquelles vous devez légalement vous conformer. Utilisez ces exigences pour concentrer vos efforts. Il s'agit par exemple des obligations découlant des lois sur la protection de la vie privée et des données. 
    +  [Conformité AWS](https://aws.amazon.com/compliance/) 
    +  [Programmes de conformité AWS](https://aws.amazon.com/compliance/programs/) 
    +  [Dernières actualités sur la conformité AWS](https://aws.amazon.com/compliance/compliance-latest-news/) 
  +  Comprendre les normes et bonnes pratiques du secteur : identifiez les normes du secteur et les exigences de bonnes pratiques qui s'appliquent à votre charge de travail, telles que la norme de sécurité des données du secteur des cartes de paiement (PCI DSS). Utilisez ces exigences pour concentrer vos efforts. 
    +  [Programmes de conformité AWS](https://aws.amazon.com/compliance/programs/) 
  +  Comprendre les exigences de conformité internes : identifiez les exigences en matière de conformité et les bonnes pratiques qui sont établies par votre organisation. Utilisez ces exigences pour concentrer vos efforts. Les politiques de sécurité de l'information et les normes de classification des données sont des exemples. 

## Ressources
<a name="resources"></a>

 **Documents connexes :** 
+  [Conformité du AWS Cloud](https://aws.amazon.com/compliance/) 
+  [Conformité AWS](https://aws.amazon.com/compliance/) 
+  [Dernières actualités sur la conformité AWS](https://aws.amazon.com/compliance/compliance-latest-news/) 
+  [Programmes de conformité AWS](https://aws.amazon.com/compliance/programs/) 

# OPS01-BP05 Évaluer les menaces existantes
<a name="ops_priorities_eval_threat_landscape"></a>

 Évaluez les menaces pesant sur l'entreprise (par exemple, la concurrence, les risques commerciaux et les responsabilités, les risques opérationnels et les menaces sur la sécurité des informations) et tenez à jour les informations dans un registre des risques. Incluez l'impact des risques pour déterminer où concentrer les efforts. 

 La version [Le cadre AWS Well-Architected](https://aws.amazon.com/architecture/well-architected/) met l'accent sur l'apprentissage, les évaluations et l'amélioration. Il vous fournit une approche cohérente pour évaluer les architectures et mettre en œuvre des conceptions qui évoluent dans le temps. AWS fournit l'outil [AWS Well-Architected Tool](https://aws.amazon.com/well-architected-tool/) pour vous aider à vérifier votre approche avant le développement et l'état de vos charges de travail avant et pendant la production. Vous pouvez les comparer aux dernières bonnes pratiques architecturales AWS, surveiller l'état général de vos charges de travail et avoir un aperçu des risques potentiels. 

 Les clients AWS peuvent bénéficier d'une vérification guidée Well-Architected de leurs charges de travail stratégiques afin [d'évaluer la conformité de leurs architectures](https://aws.amazon.com/premiumsupport/programs/) par rapport aux bonnes pratiques AWS. Les clients ayant souscrit au programme Enterprise Support peuvent bénéficier d'une [vérification des opérations,](https://aws.amazon.com/premiumsupport/programs/)conçue pour les aider à identifier les failles de leur approche d'exploitation dans le cloud. 

 L'implication des équipes dans ces vérifications contribue à établir une compréhension partagée de vos charges de travail et de la façon dont les rôles de chacun contribuent à la réussite de l'équipe. Les besoins identifiés par la vérification peuvent vous aider à définir vos priorités. 

 [AWS Trusted Advisor](https://aws.amazon.com/premiumsupport/technology/trusted-advisor/) est un outil qui donne accès à un ensemble de base de vérifications qui recommandent des optimisations pouvant vous aider à définir vos priorités. [Clients ayant un plan de support Business ou Enterprise](https://aws.amazon.com/premiumsupport/plans/) Les clients ayant un plan de support Business ou Enterprise ont accès à des vérifications supplémentaires axées sur la sécurité, la fiabilité, les performances et l'optimisation des coûts, qui peuvent les aider à définir leurs priorités. 

 **Anti-modèles courants :** 
+  Vous utilisez une ancienne version d'une bibliothèque de logiciels dans votre produit. Vous n'êtes pas au courant des mises à jour de sécurité de la bibliothèque pour les questions qui peuvent avoir un impact involontaire sur votre charge de travail. 
+  Votre concurrent vient de lancer une version de son produit qui répond aux nombreuses plaintes de vos clients concernant votre produit. Vous n'avez pas priorisé la résolution des problèmes connus. 
+  Les régulateurs ont poursuivi des entreprises comme la vôtre qui ne respectaient pas les exigences légales de conformité réglementaire. Vous n'avez pas priorisé la résolution des vos exigences de conformité en suspens. 

 **Avantages liés au respect de cette bonne pratique :** L'identification et la compréhension des menaces qui pèsent sur votre organisation et votre charge de travail vous permettent de déterminer les menaces à traiter, leur priorité et les ressources nécessaires pour y parvenir. 

 **Niveau de risque exposé si cette bonne pratique n'est pas respectée :** Moyenne entreprise 

## Directives d'implémentation
<a name="implementation-guidance"></a>
+  Évaluer les menaces existantes : évaluez les menaces qui pèsent sur l'entreprise (par exemple, la concurrence, les risques commerciaux et les responsabilités, les risques opérationnels et les menaces sur la sécurité des données) afin de pouvoir tenir compte de leur impact lorsque vous déterminez où concentrer vos efforts. 
  +  [Derniers bulletins de sécurité AWS](https://aws.amazon.com/security/security-bulletins/) 
  +  [AWS Trusted Advisor](https://aws.amazon.com/premiumsupport/trustedadvisor/) 
  +  Gérer un modèle de menace : établissez et gérez un modèle de menace identifiant les menaces potentielles, les mesures d'atténuation prévues et en place, et leur priorité. Examinez la probabilité que les menaces se manifestent par des incidents, le coût de la récupération après ces incidents, le préjudice attendu et le coût de la prévention de ces incidents. Modifiez les priorités au fur et à mesure que le contenu du modèle de menace change. 

## Ressources
<a name="resources"></a>

 **Documents connexes :** 
+  [Conformité du AWS Cloud](https://aws.amazon.com/compliance/) 
+  [Derniers bulletins de sécurité AWS](https://aws.amazon.com/security/security-bulletins/) 
+  [AWS Trusted Advisor](https://aws.amazon.com/premiumsupport/trustedadvisor/) 

# OPS01-BP06 Évaluer les compromis
<a name="ops_priorities_eval_tradeoffs"></a>

 Évaluez l'impact des compromis entre des intérêts concurrents ou des approches alternatives pour prendre des décisions éclairées au moment de déterminer où concentrer les efforts ou choisir une ligne de conduite. Par exemple, l'accélération de la mise sur le marché de nouvelles fonctionnalités peut être privilégiée par rapport à l'optimisation des coûts, ou vous pouvez choisir une base de données relationnelle pour les données non relationnelles afin de simplifier l'effort de migration d'un système, plutôt que de migrer vers une base de données optimisée pour votre type de données et de mettre à jour votre application. 

 AWS peut vous aider à former vos équipes à AWS et à ses services afin qu'elles comprennent mieux comment leurs choix peuvent avoir un impact sur votre charge de travail. Vous pouvez utiliser les ressources fournies par [AWS Support](https://aws.amazon.com/premiumsupport/programs/) ([le centre de connaissances AWS](https://aws.amazon.com/premiumsupport/knowledge-center/), [les forums de discussion AWS](https://forums.aws.amazon.com/index.jspa)et [le centre AWS Support](https://console.aws.amazon.com/support/home/)) et la [documentation AWS](https://docs.aws.amazon.com/) pour former vos équipes. Contactez AWS Support via le centre AWS Support pour obtenir des réponses à vos questions AWS. 

 AWS partage également les bonnes pratiques et les modèles tirés de l'expérience AWS dans la [Bibliothèque Amazon Builders' Library](https://aws.amazon.com/builders-library/). Une grande variété d'autres informations utiles sont disponibles via le [blog AWS](https://aws.amazon.com/blogs/) et [le podcast AWS officiel](https://aws.amazon.com/podcasts/aws-podcast/). 

 **Anti-modèles courants :** 
+  Vous utilisez une base de données relationnelle pour gérer les séries chronologiques et les données non relationnelles. Il existe des options de base de données qui sont optimisées pour prendre en charge les types de données que vous utilisez, mais vous ne connaissez pas les avantages, car vous n'avez pas évalué les compromis entre les solutions. 
+  Vos investisseurs vous demandent de prouver que vous respectez les normes de sécurité des données du secteur des cartes de paiement (PCI DSS). Vous n'envisagez pas les compromis entre la satisfaction de leur demande et la poursuite de vos efforts de développement actuels. Au lieu de cela, vous poursuivez vos efforts de développement sans en démontrer la conformité. Vos investisseurs cessent de soutenir votre entreprise en raison de préoccupations concernant la sécurité de votre plate-forme et de leurs investissements. 

 **Avantages liés au respect de cette bonne pratique :** Comprendre les implications et les conséquences de vos choix permet de prioriser vos options. 

 **Niveau de risque exposé si cette bonne pratique n'est pas respectée :** Moyenne entreprise 

## Directives d'implémentation
<a name="implementation-guidance"></a>
+  Évaluer les compromis : évaluez l'impact des compromis entre des intérêts concurrents afin de prendre des décisions éclairées lorsqu'il s'agit de déterminer où concentrer les efforts. Par exemple, l'accélération de la mise sur le marché de nouvelles fonctionnalités pourrait être privilégiée par rapport à l'optimisation des coûts. 
+  AWS peut vous aider à former vos équipes à AWS et à ses services afin qu'elles comprennent mieux comment leurs choix peuvent avoir un impact sur votre charge de travail. Vous devez utiliser les ressources fournies par AWS Support (Centre de connaissances AWS, forums de discussion AWSet AWS Support Center) et la documentation AWS pour former vos équipes. Contactez AWS Support via le centre AWS Support pour obtenir des réponses à vos questions AWS. 
+  AWS partage également les bonnes pratiques et les modèles que nous avons appris grâce à l'exploitation d'AWS dans Amazon Builders' Library. Un grand nombre d'autres informations utiles sont disponibles sur le blog AWS et sur le podcast officiel AWS. 

## Ressources
<a name="resources"></a>

 **Documents connexes :** 
+  [blog AWS](https://aws.amazon.com/blogs/) 
+  [Conformité du AWS Cloud](https://aws.amazon.com/compliance/) 
+  [les forums de discussion AWS](https://forums.aws.amazon.com/index.jspa) 
+  [documentation AWS](https://docs.aws.amazon.com/) 
+  [le centre de connaissances AWS](https://aws.amazon.com/premiumsupport/knowledge-center/) 
+  [AWS Support](https://aws.amazon.com/premiumsupport/) 
+  [le centre AWS Support](https://console.aws.amazon.com/support/home/) 
+  [Bibliothèque Amazon Builders' Library](https://aws.amazon.com/builders-library/) 
+  [le podcast AWS officiel](https://aws.amazon.com/podcasts/aws-podcast/) 

# OPS01-BP07 Gérer les avantages et les risques
<a name="ops_priorities_manage_risk_benefit"></a>

 Gérez les avantages et les risques afin de prendre des décisions éclairées lorsqu'il s'agit de déterminer où il est nécessaire de concentrer les efforts. Par exemple, il peut être avantageux de déployer une charge de travail comportant des problèmes non résolus afin que de nouvelles fonctionnalités importantes puissent être mises à la disposition des clients. Il peut être possible d'atténuer les risques associés, ou il peut devenir inacceptable de laisser un risque subsister, auquel cas vous prendrez des mesures pour y remédier. 

 Vous pouvez décider à un moment donné de mettre l'accent sur un petit sous-ensemble de priorités opérationnelles. Utilisez une approche équilibrée sur le long terme pour garantir le développement des capacités nécessaires et de la gestion des risques. Mettez à jour vos priorités en fonction de vos besoins. 

 **Anti-modèles courants :** 
+  Vous avez décidé d'inclure une bibliothèque qui fait « tout ce dont vous avez besoin », une bibliothèque que l'un de vos développeurs « a trouvé sur Internet ». Vous n'avez pas évalué les risques d'adoption de cette bibliothèque d’une source inconnue et ne savez pas si elle contient des failles ou du code malveillant. 
+  Vous avez décidé de développer et de déployer une nouvelle fonctionnalité au lieu de résoudre un problème existant. Vous n'avez pas évalué les risques de ne pas traiter le problème jusqu'au déploiement de la fonctionnalité et ne savez pas quel sera l'impact sur vos clients. 
+  Vous avez décidé de ne pas déployer une fonctionnalité fréquemment demandée par les clients en raison de préoccupations non spécifiées de votre équipe de conformité. 

 **Avantages liés au respect de cette bonne pratique :** Identifier les avantages de vos choix et connaître les risques pour votre organisation permet de prendre des décisions en connaissance de cause. 

 **Niveau de risque exposé si cette bonne pratique n'est pas respectée :** Faible 

## Directives d'implémentation
<a name="implementation-guidance"></a>
+  Gérer les avantages et les risques : trouvez un juste milieu entre les avantages des décisions et les risques impliqués. 
  +  Identifier les avantages : identifiez les avantages en fonction des objectifs, des besoins et des priorités de l'entreprise. Les exemples incluent les délais de commercialisation, la sécurité, la fiabilité, la performance et les coûts. 
  +  Identifier les risques : identifiez les risques en fonction des objectifs, des besoins et des priorités de l'entreprise. Les exemples incluent les délais de commercialisation, la sécurité, la fiabilité, la performance et les coûts. 
  +  Évaluer les avantages par rapport aux risques et prendre des décisions avisées : déterminez l'impact des avantages et des risques en fonction des objectifs, des besoins et des priorités de vos acteurs clés, notamment les équipes commerciales, le développement et les opérations. Évaluez la valeur ajoutée de l'avantage par rapport à la probabilité de réalisation du risque et au coût de son impact. Par exemple, mettre l'accent sur la rapidité de mise sur le marché plutôt que sur la fiabilité pourrait fournir un avantage concurrentiel. Toutefois, cela peut entraîner une réduction du temps de fonctionnement en cas de problèmes de fiabilité. 

# OPS 2  Comment structurer votre entreprise pour soutenir les résultats métier ?
<a name="w2aac19b5b5b7"></a>

 Vos équipes doivent comprendre leur rôle dans l'obtention des résultats de l’entreprise. Les équipes doivent comprendre leur rôle dans la réussite des autres équipes, le rôle des autres équipes dans leur réussite, et avoir des objectifs communs. Comprendre la responsabilité, la propriété, la manière dont les décisions sont prises et qui a le pouvoir de prendre des décisions vous aide à concentrer les efforts et à maximiser les avantages de vos équipes. 

**Topics**
+ [OPS02-BP01 Les ressources ont des propriétaires identifiés](ops_ops_model_def_resource_owners.md)
+ [OPS02-BP02 Les processus et procédures ont des propriétaires identifiés](ops_ops_model_def_proc_owners.md)
+ [OPS02-BP03 Les activités opérationnelles ont des propriétaires identifiés responsables de leurs performances](ops_ops_model_def_activity_owners.md)
+ [OPS02-BP04 Les membres de l'équipe savent de quoi ils sont responsables](ops_ops_model_know_my_job.md)
+ [OPS02-BP05 Des mécanismes sont en place pour identifier la responsabilité et la propriété](ops_ops_model_find_owner.md)
+ [OPS02-BP06 Des mécanismes sont en place pour demander des ajouts, des modifications et des dérogations](ops_ops_model_req_add_chg_exception.md)
+ [OPS02-BP07 Les responsabilités entre les équipes sont prédéfinies ou négociées](ops_ops_model_def_neg_team_agreements.md)

# OPS02-BP01 Les ressources ont des propriétaires identifiés
<a name="ops_ops_model_def_resource_owners"></a>

 Déterminez qui est propriétaire de chaque application, charge de travail, plate-forme et composant d'infrastructure, quelle valeur ajoutée le composant apporte et pourquoi cette propriété existe. La détermination de la valeur ajoutée de ces composants individuels et de la manière dont elles soutiennent les résultats de l'entreprise permet d'éclairer les processus et les procédures appliqués à leur égard. 

 **Avantages liés au respect de cette bonne pratique :** La détermination de la propriété permet de savoir qui peut approuver les améliorations, mettre en œuvre ces améliorations, ou les deux. 

 **Niveau de risque exposé si cette bonne pratique n'est pas respectée :** Débit 

## Directives d'implémentation
<a name="implementation-guidance"></a>
+  Les ressources ont des propriétaires identifiés : définissez ce que signifie la propriété pour les cas d'utilisation des ressources dans votre environnement. Précisez et enregistrez les propriétaires des ressources, y compris, au minimum, le nom, les coordonnées, l'organisation et l'équipe. Stockez les informations de propriété des ressources avec des ressources utilisant des métadonnées telles que des balises ou des groupes de ressources. Utilisez AWS Organizations pour structurer les comptes et mettre en œuvre des politiques afin de capturer les informations de propriété et de contact. 
  +  Définir des formes de propriété et la façon dont elles sont attribuées : la propriété peut avoir plusieurs définitions dans votre organisation avec différents cas d'utilisation. Vous pouvez définir un « propriétaire de charge de travail » comme la personne qui assume le risque et la responsabilité de l'exploitation d'une charge de travail et qui, en dernier ressort, a le pouvoir de prendre des décisions la concernant. Vous pouvez définir la propriété en terme de responsabilité financière ou administrative lorsqu'elle revient à une organisation mère. Un développeur peut être propriétaire de son environnement de développement et être responsable des incidents que son exploitation provoque. Son responsable produit peut être responsable des coûts financiers associés au fonctionnement de ses environnements de développement. 
  +  Définir qui possède une organisation, un compte, un ensemble de ressources ou des composants individuels : définissez et enregistrez la propriété dans un emplacement approprié et organisé qui peut être identifié. Mettez à jour les définitions et les informations de propriété au fur et à mesure qu'elles changent. 
  +  Capturer la propriété dans les métadonnées des ressources : capturez la propriété des ressources à l'aide de métadonnées telles que des balises ou des groupes de ressources, en spécifiant les informations de propriété et de contact. Utilisez AWS Organizations pour structurer les comptes et mettre en œuvre des politiques afin de capturer les informations de propriété et de contact. 

# OPS02-BP02 Les processus et procédures ont des propriétaires identifiés
<a name="ops_ops_model_def_proc_owners"></a>

 Déterminez qui est propriétaire de la définition des différents processus et procédures individuels, pourquoi ces processus et procédures sont utilisés et pourquoi cette propriété existe. La détermination des raisons pour lesquelles des processus et des procédures spécifiques sont utilisés permet d'identifier les possibilités d'amélioration. 

 **Avantages liés au respect de cette bonne pratique :** La détermination de la propriété permet d'identifier qui peut approuver les améliorations, les mettre en œuvre ou les deux. 

 **Niveau de risque exposé si cette bonne pratique n'est pas respectée :** Débit 

## Directives d'implémentation
<a name="implementation-guidance"></a>
+  Les processus et procédures ont des propriétaires identifiés responsables de leur définition : capturez les processus et procédures utilisés dans votre environnement, ainsi que la personne ou l'équipe responsable de leur définition. 
  +  Identifier les processus et les procédures : identifiez les activités opérationnelles réalisées à l'aide de vos charges de travail. Documentez ces activités dans un emplacement détectable. 
  +  Déterminer qui est responsable de la définition d'un processus ou d'une procédure : identifiez de façon unique l'individu ou l'équipe responsable de la spécification d'une activité. Il leur incombe de s'assurer qu'elle peut être exécutée avec succès par un membre de l'équipe disposant des autorisations, des accès et des outils appropriés. En cas de problème lié à l'exécution de l'activité, les membres de l'équipe qui l'exécutent sont tenus de fournir les commentaires détaillés nécessaires à son amélioration. 
  +  Capturer la propriété dans les métadonnées de l'artefact d'activité : les procédures automatisées dans des services tels qu'AWS Systems Manager, via des documents et AWS Lambda, en tant que fonctions, prennent en charge la capture des informations de métadonnées sous forme de balises. Capturez la propriété des ressources à l'aide de balises ou de groupes de ressources, en spécifiant les informations de propriété et de contact. Utilisez AWS Organizations pour créer des politiques de balisage et vous assurer que les informations de propriété et de contact sont capturées. 

# OPS02-BP03 Les activités opérationnelles ont des propriétaires identifiés responsables de leurs performances
<a name="ops_ops_model_def_activity_owners"></a>

 Déterminez qui est responsable d'exécuter des activités spécifiques sur des charges de travail définies et pourquoi cette responsabilité existe. La détermination de qui est responsable de l'exécution des activités indique qui va mener l'activité, valider le résultat et fournir des commentaires au propriétaire de l'activité. 

 **Avantages liés au respect de cette bonne pratique :** La détermination de qui est responsable de l'exécution d'une activité indique qui doit être notifier quand une action est nécessaire et qui doit exécuter l'action, valider le résultats et fournir des commentaires au propriétaire de l'activité. 

 **Niveau de risque exposé si cette bonne pratique n'est pas respectée :** Débit 

## Directives d'implémentation
<a name="implementation-guidance"></a>
+  Les activités opérationnelles ont des propriétaires identifiés responsables de leurs performances . capturez la responsabilité de l'exécution des processus et procédures utilisés dans votre environnement. 
  +  Identifier les processus et les procédures : identifiez les activités opérationnelles réalisées à l'aide de vos charges de travail. Documentez ces activités dans un emplacement détectable. 
  +  Définir qui est responsable de chaque activité : identifiez l'équipe responsable d'une activité. Assurez-vous qu'elle dispose des informations de l'activité, des compétences nécessaires et des autorisations et outils corrects pour exécuter l'activité. Elle doit comprendre la condition de son exécution (par exemple, en cas d'événement ou selon un calendrier). Rendez ces informations accessibles afin que les membres de votre organisation puissent identifier les personnes qu'ils doivent contacter, équipe ou personne, pour des besoins spécifiques. 

# OPS02-BP04 Les membres de l'équipe savent de quoi ils sont responsables
<a name="ops_ops_model_know_my_job"></a>

 La compréhension des responsabilités de votre rôle et de la manière dont vous contribuez aux résultats de l'entreprise permet de définir les priorités de vos tâches et de comprendre pourquoi votre rôle est important. Cela permet aux membres d'équipe de reconnaître les besoins et de répondre de manière appropriée. 

 **Avantages liés au respect de cette bonne pratique :** La compréhension de vos responsabilités indique les décisions que vous prenez, les actions que vous exécutez et vos activités à leurs propriétaires. 

 **Niveau de risque exposé si cette bonne pratique n'est pas respectée :** Débit 

## Directives d'implémentation
<a name="implementation-guidance"></a>
+  Veiller à ce que les membres de l'équipe comprennent leurs rôles et responsabilités : identifiez les rôles et responsabilités des membres de l'équipe et assurez-vous qu'ils comprennent les attentes liées à leur rôle. Rendez ces informations accessibles afin que les membres de votre organisation puissent identifier les personnes qu'ils doivent contacter, équipe ou personne, pour des besoins spécifiques. 

# OPS02-BP05 Des mécanismes sont en place pour identifier la responsabilité et la propriété
<a name="ops_ops_model_find_owner"></a>

 Lorsque aucune personne ou équipe n'est identifiée, il existe des chemins de remontée vers une personne ayant le pouvoir d'attribuer la propriété ou le plan pour traiter le besoin. 

 **Avantages liés au respect de cette bonne pratique :** Savoir qui est responsable ou propriétaire permet de faire appel à l'équipe ou au membre de l'équipe approprié pour faire une demande ou transférer une tâche. Le fait d'avoir une personne identifiée qui est autorisée à attribuer la responsabilité ou la propriété ou à planifier pour répondre aux besoins réduit le risque d'inaction et de voir les besoins non satisfaits. 

 **Niveau de risque exposé si cette bonne pratique n'est pas respectée :** Débit 

## Directives d'implémentation
<a name="implementation-guidance"></a>
+  Des mécanismes sont en place pour identifier la responsabilité et la propriété : proposez des mécanismes accessibles aux membres de votre organisation pour découvrir et identifier la propriété et la responsabilité. Ils leur permettront d'identifier les personnes à contacter, équipe ou individu, pour des besoins spécifiques. 

# OPS02-BP06 Des mécanismes sont en place pour demander des ajouts, des modifications et des dérogations
<a name="ops_ops_model_req_add_chg_exception"></a>

 Vous pouvez adresser des demandes aux propriétaires des processus, des procédures et des ressources. Prenez des décisions avisées pour approuver les demandes lorsque celles-ci sont viables et appropriées après une évaluation des avantages et des risques. 

 **Avantages liés au respect de cette bonne pratique :** Il est essentiel que des mécanismes existent pour demander des ajouts, des changements et des exceptions afin de soutenir les activités des équipes. Sans cette option, l'état actuel devient une contrainte sur l'innovation. 

 **Niveau de risque exposé si cette bonne pratique n'est pas respectée :** Moyenne entreprise 

## Directives d'implémentation
<a name="implementation-guidance"></a>
+  Des mécanismes sont en place pour demander des ajouts, des modifications et des dérogations : lorsque les normes sont rigides, l'innovation est limitée. Fournissez des mécanismes permettant aux membres de votre organisation d'adresser des demandes aux propriétaires des processus, des procédures et des ressources à l'appui de leurs besoins opérationnels. 

# OPS02-BP07 Les responsabilités entre les équipes sont prédéfinies ou négociées
<a name="ops_ops_model_def_neg_team_agreements"></a>

 Utilisez des accords définis ou négociés entre les équipes, accords qui décrivent la manière dont elles travaillent ensemble et se soutiennent mutuellement (par exemple, les temps de réponse, les objectifs de niveau de service ou les contrats de niveau de service). La compréhension de l'impact du travail des équipes sur les résultats opérationnels et les résultats des autres équipes et organisations indique la priorité de leurs tâches et permet de répondre de manière appropriée. 

 Lorsque la responsabilité et la propriété ne sont pas définies ou sont inconnues, vous risquez de ne pas traiter les activités nécessaires en temps opportun et de déployer des efforts redondants et potentiellement contradictoires pour répondre à ces besoins. 

 **Avantages liés au respect de cette bonne pratique :** L'établissement des responsabilités entre les équipes, des objectifs et des méthodes de communication des besoins facilite le flux des demandes et permet de fournir les informations nécessaires. Cela réduit le délai introduit par les tâches de transition entre les équipes et contribue à l'obtention des résultats opérationnels. 

 **Niveau de risque exposé si cette bonne pratique n'est pas respectée :** Faible 

## Directives d'implémentation
<a name="implementation-guidance"></a>
+  Les responsabilités entre les équipes sont prédéfinies ou négociées : le fait de spécifier les méthodes d'interaction des équipes et les informations nécessaires pour qu'elles se soutiennent mutuellement peut contribuer à minimiser les délais, car les demandes sont examinées et clarifiées de manière itérative. Le fait de disposer d'accords spécifiques qui définissent les attentes (par exemple, le temps de réponse ou de réalisation) permet aux équipes d'établir des plans efficaces et d'utiliser les ressources de manière appropriée. 

# OPS 3  Comment votre culture d'entreprise soutient-elle vos résultats métier ?
<a name="w2aac19b5b5b9"></a>

 Offrez un support aux membres de votre équipe afin qu'ils puissent agir plus efficacement et soutenir les résultats opérationnels. 

**Topics**
+ [OPS03-BP01 Parrainage de la direction](ops_org_culture_executive_sponsor.md)
+ [OPS03-BP02 Les membres de l'équipe sont habilités à agir lorsque les résultats sont remis en cause](ops_org_culture_team_emp_take_action.md)
+ [OPS03-BP03 La remontée hiérarchique est encouragée](ops_org_culture_team_enc_escalation.md)
+ [OPS03-BP04 Les communications sont opportunes, claires et exploitables](ops_org_culture_effective_comms.md)
+ [OPS03-BP05 L'expérimentation est encouragée](ops_org_culture_team_enc_experiment.md)
+ [OPS03-BP06 Les membres de l'équipe sont invités à maintenir et à développer leurs compétences](ops_org_culture_team_enc_learn.md)
+ [OPS03-BP07 Fournir aux équipes les ressources appropriées](ops_org_culture_team_res_appro.md)
+ [OPS03-BP08 La diversité des opinions est encouragée et recherchée au sein des équipes et entre elles](ops_org_culture_diverse_inc_access.md)

# OPS03-BP01 Parrainage de la direction
<a name="ops_org_culture_executive_sponsor"></a>

 Les principaux dirigeants définissent clairement les attentes de l'organisation et évaluent le succès. Les principaux dirigeants sont le parrain, l’avocat et le moteur de l'adoption des bonnes pratiques et de l'évolution de l'organisation 

 **Avantages liés au respect de cette bonne pratique :** Une direction engagée, des attentes clairement communiquées et des objectifs partagés permettent aux membres de l'équipe de savoir ce qu'on attend d'eux. L'évaluation du succès permet d'identifier les obstacles au succès afin qu'ils puissent être éliminés par l'intervention du parrain, de l’avocat ou de leurs délégués. 

 **Niveau de risque exposé si cette bonne pratique n'est pas respectée :** Débit 

## Directives d'implémentation
<a name="implementation-guidance"></a>
+  Parrainage de la direction : les équipes de direction définissent clairement les attentes de l'organisation et évaluent la réussite. Les principaux dirigeants sont le parrain, l’avocat et le moteur de l'adoption des bonnes pratiques et de l'évolution de l'organisation 
  +  Définir les attentes : spécifiez et publiez des objectifs pour vos organisations, y compris la façon dont elles sont évaluées. 
  +  Suivre la réalisation des objectifs : évaluez régulièrement la réalisation progressive des objectifs et partagez les résultats afin que les mesures appropriées puissent être prises si les résultats sont remis en cause. 
  +  Fournir les ressources nécessaires pour atteindre vos objectifs : vérifiez régulièrement si les ressources sont toujours appropriées ou si des ressources supplémentaires sont nécessaires en fonction des nouvelles informations, des modifications des objectifs, des responsabilités ou de l'environnement de l'entreprise. 
  +  Défendre vos équipes : restez impliqué avec vos équipes afin que vous compreniez comment elles évoluent et s'il existe des facteurs externes qui les affectent. Lorsque vos équipes sont affectées par des facteurs externes, réévaluez les objectifs et ajustez les cibles le cas échéant. Identifiez les obstacles qui entravent la progression de vos équipes. Agissez au nom de vos équipes pour surmonter les obstacles et éliminer les charges inutiles. 
  +  Être un moteur de l'adoption des bonnes pratiques : acceptez les bonnes pratiques qui apporte des avantages quantifiables et montrez de la reconnaissance pour les créateurs et les adoptants. Encouragez une adoption plus large pour amplifier les avantages obtenus. 
  +  Être un moteur d'évolution pour vos équipes : instaurez une culture d'amélioration continue. Encouragez la croissance et le développement personnels et organisationnels. Fixez des objectifs à long terme qui nécessiteront une réalisation progressive dans le temps. Adaptez cette vision à vos besoins et à vos objectifs et votre environnement opérationnels à mesure qu'ils évoluent. 

# OPS03-BP02 Les membres de l'équipe sont habilités à agir lorsque les résultats sont remis en cause
<a name="ops_org_culture_team_emp_take_action"></a>

 Le responsable de la charge de travail a défini des orientations et un champ d'action permettant aux membres de l'équipe de réagir lorsque les résultats sont menacés. Des mécanismes de remontée sont utilisés pour obtenir des orientations lorsque les événements outrepassent le champ d'action défini. 

 **Avantages liés au respect de cette bonne pratique :** En testant et validant rapidement les modifications, vous êtes en mesure de résoudre les problèmes avec des coûts réduits, et de limiter l'impact sur vos clients. En testant avant le déploiement, vous minimisez l'introduction d'erreurs. 

 **Niveau de risque exposé si cette bonne pratique n'est pas respectée :** Débit 

## Directives d'implémentation
<a name="implementation-guidance"></a>
+  Les membres de l'équipe sont habilités à agir lorsque les résultats sont remis en cause : fournissez aux membres de votre équipe les autorisations, les outils et la possibilité de mettre en pratique les compétences nécessaires pour réagir efficacement. 
  +  Donner aux membres de votre équipe la possibilité de mettre en pratique les compétences nécessaires pour réagir : fournissez d'autres environnements sûrs où les processus et les procédures peuvent être testés et entraînés en toute sécurité. Effectuez des simulations pour permettre aux membres de l'équipe d'acquérir de l'expérience dans la gestion d'incidents concrets dans des environnements simulés et sûrs. 
  +  Définir et reconnaître l'autorité des membres de l'équipe pour agir : définissez spécifiquement le pouvoir des membres de l'équipe d'agir en leur attribuant des autorisations et un accès aux charges de travail et aux composants qu'ils prennent en charge. Acceptez qu'ils sont habilités à agir lorsque les résultats sont menacés. 

# OPS03-BP03 La remontée hiérarchique est encouragée
<a name="ops_org_culture_team_enc_escalation"></a>

 Les membres de l'équipe disposent de mécanismes et sont encouragés à faire part de leurs préoccupations aux décideurs et aux parties prenantes s'ils estiment que les résultats sont menacés. Les remontées doivent être effectuées tôt et souvent afin que les risques puissent être identifiés et les incidents évités. 

 **Niveau de risque exposé si cette bonne pratique n'est pas respectée :** Débit 

## Directives d'implémentation
<a name="implementation-guidance"></a>
+  Encourager une remontée hiérarchique précoce et fréquente : reconnaissez sur le plan organisationnel qu'une remontée hiérarchique précoce et fréquente est conseillée. Reconnaissez et acceptez sur le plan organisationnel que les remontées peuvent s'avérer non fondées et qu'il est préférable d'avoir la possibilité d'éviter un incident que de manquer cette opportunité en ne la faisant pas remonter. 
  +  Disposer d'un mécanisme de remontée : élaborez des procédures documentées définissant quand et comment la remontée doit avoir lieu. Documentez les séries de personnes ayant un pouvoir croissant pour prendre ou approuver des mesures, et leurs informations de contact. La remontée doit se poursuivre jusqu'à ce que le membre de l'équipe soit convaincu qu'il a transféré le risque à une personne capable d'y faire face, ou qu'il a contacté la personne qui assume le risque et la responsabilité de l'exploitation de la charge de travail. C'est cette personne qui, en fin de compte, détient toutes les décisions concernant sa charge de travail. Les remontées doivent inclure la nature du risque, la criticité de la charge de travail, les personnes impactées, l'impact et l'urgence, c'est-à-dire le moment où l'impact est attendu. 
  +  Protéger les employés qui font remonter les informations : créez une politique qui protège les membres de l'équipe contre les représailles s'ils font remonter des informations autour d'un décideur ou d'une partie prenante non réceptifs. Mettez en place des mécanismes permettant d'identifier si cela se produit et de répondre de manière appropriée. 

# OPS03-BP04 Les communications sont opportunes, claires et exploitables
<a name="ops_org_culture_effective_comms"></a>

 Des mécanismes existent et sont utilisés pour informer en temps opportun les membres de l'équipe des risques connus et des événements planifiés. Le contexte, les informations et le temps nécessaires (dans la mesure du possible) sont communiqués pour déterminer si une action est nécessaire, quelle action est requise et prendre des mesures en temps opportun. Par exemple, la notification des failles logicielles afin d'accélérer l'application des correctifs, ou la notification des promotions de vente prévues afin qu'un gel des modifications puisse être mis en œuvre pour éviter le risque d'interruption de service. 

 Les événements planifiés peuvent être reportés dans un calendrier de modifications ou un calendrier de maintenance afin que les membres de l'équipe puissent identifier les activités en attente. 

 Sur AWS, [AWS Systems Manager Modifier le calendrier](https://docs.aws.amazon.com/systems-manager/latest/userguide/systems-manager-change-calendar.html) peut être utilisé pour enregistrer ces détails. Il prend en charge les vérifications par programmation de l'état des calendriers afin de déterminer si le calendrier est ouvert ou fermé à une activité à un moment donné. Les activités opérationnelles peuvent être planifiées *autour de fenêtres de temps approuvées* spécifiques qui sont réservées aux activités potentiellement perturbatrices. AWS Systems Manager Maintenance Windows vous permet de planifier des activités sur des instances et d'autres [ressources prises en charge](https://docs.aws.amazon.com/ARG/latest/userguide/supported-resources.html#supported-resources-console) pour automatiser les activités et rendre ces activités détectables. 

 **Niveau de risque exposé si cette bonne pratique n'est pas respectée :** Débit 

## Directives d'implémentation
<a name="implementation-guidance"></a>
+  Les communications sont opportunes, claires et exploitables : des mécanismes sont en place pour notifier les risques ou les événements prévus d'une manière claire et exploitable, avec un préavis suffisant pour permettre des réponses appropriées. 
  +  Documenter les activités planifiées sur un calendrier de modifications et envoyer des notifications : mettez à disposition une source d'informations accessible où les événements planifiés peuvent être découverts. Envoyez des notifications d'événements planifiés à partir du même système. 
  +  Suivre les événements et l'activité susceptibles d'avoir un impact sur votre charge de travail : surveillez les notifications de failles et les informations sur les correctifs pour comprendre les failles dangereuses et les risques potentiels associés aux éléments de votre charge de travail. Envoyez une notification aux membres de l'équipe afin qu'ils puissent agir. 

## Ressources
<a name="resources"></a>

 **Documents connexes :** 
+  [AWS Systems Manager Modifier le calendrier](https://docs.aws.amazon.com/systems-manager/latest/userguide/systems-manager-change-calendar.html) 
+  [fenêtres de maintenance AWS Systems Manager](https://docs.aws.amazon.com/systems-manager/latest/userguide/systems-manager-maintenance.html) 

# OPS03-BP05 L'expérimentation est encouragée
<a name="ops_org_culture_team_enc_experiment"></a>

 L'expérimentation accélère la formation et permet aux membres de l'équipe de s'intéresser et d'être engagés. Un résultat indésirable est une expérience positive qui a identifié un chemin qui ne conduira pas au succès. Les membres de l'équipe ne sont pas sanctionnés pour les expérimentations réussies produisant des résultats indésirables. L'expérimentation est nécessaire pour que l'innovation se produise et transforme les idées en résultats. 

 **Niveau de risque exposé si cette bonne pratique n'est pas respectée :** Moyenne entreprise 

## Directives d'implémentation
<a name="implementation-guidance"></a>
+  L'expérimentation est encouragée : encouragez l'expérimentation pour soutenir la formation et l'innovation. 
  +  Tester diverses technologies : encouragez l'expérimentation de technologies susceptibles d'être applicables dès maintenant ou dans le futur pour atteindre vos résultats commerciaux. Ces connaissances peuvent influer sur l'innovation future. 
  +  Expérimenter avec un objectif à l'esprit : encouragez l'expérimentation avec des objectifs spécifiques que les membres de l'équipe peuvent atteindre, ou avec des technologies susceptibles d'être applicables dans un avenir proche. Ces connaissances peuvent influer sur votre innovation. 
  +  Allouer du temps à l'expérimentation : dédiez des moments spécifiques où les membres de l'équipe peuvent se défaire de leurs responsabilités habituelles, afin de pouvoir se concentrer sur leur expérimentation. 
  +  Fournir les ressources nécessaires pour soutenir l'expérimentation : financez les ressources nécessaires à la réalisation d'expérimentations (par exemple, des logiciels ou des ressources cloud). 
  +  Reconnaître le succès : reconnaissez les avantages générés par l'expérimentation. Comprenez que les expérimentations avec des résultats indésirables sont réussies et ont identifié un chemin qui ne conduira pas au succès. Les membres de l'équipe ne sont pas sanctionnés pour des résultats indésirables résultant de leurs expérimentations. 

# OPS03-BP06 Les membres de l'équipe sont invités à maintenir et à développer leurs compétences
<a name="ops_org_culture_team_enc_learn"></a>

 Les équipes doivent accroître leurs compétences pour adopter les nouvelles technologies, et pour faire face à l'évolution de la demande et des responsabilités afin de supporter votre charge de travail. Le développement des compétences dans les nouvelles technologies est souvent une source de satisfaction pour les membres de l'équipe et favorise l'innovation. Soutenez les membres de votre équipe dans la recherche et le maintien de certifications sectorielles qui valident et reconnaissent leurs compétences croissantes. Mettez en place la formation croisée pour promouvoir le transfert de connaissances et réduire le risque d'impact significatif lorsque vous perdez des membres d'équipe qualifiés et expérimentés ayant un savoir institutionnel. Mettez en place des créneaux dédiés à la formation. 

 AWS fournit des ressources, y compris le [Centre de ressources de démarrage AWS](https://aws.amazon.com/getting-started/), [les blogs AWS](https://aws.amazon.com/blogs/), [les conférences techniques en ligne AWS](https://aws.amazon.com/getting-started/), [les événements et webinaires AWS](https://aws.amazon.com/events/)et les [ateliers AWS Well-Architected](https://wellarchitectedlabs.com/)AWS, qui fournissent des conseils, des exemples et des démonstrations détaillées pour former vos équipes. 

 AWS partage également les bonnes pratiques et les modèles tirés de l'expérience AWS dans la [Bibliothèque Amazon Builders' Library](https://aws.amazon.com/builders-library/) et d'une grande variété d'autres supports pédagogiques utiles via le [Blog AWS](https://aws.amazon.com/blogs/) et [Podcast AWS officiel](https://aws.amazon.com/podcasts/aws-podcast/). 

 Tirez parti des ressources pédagogiques fournies par AWS, telles que les ateliers Well-Architected, [AWS Support](https://aws.amazon.com/premiumsupport/programs/) ([Centre de connaissances AWS](https://aws.amazon.com/premiumsupport/knowledge-center/), [les forums de discussion AWS](https://forums.aws.amazon.com/index.jspa)et [Centre AWS Support](https://console.aws.amazon.com/support/home/)) et la [Documentation AWS](https://docs.aws.amazon.com/whitepapers/latest/aws-security-incident-response-guide/welcome.html) pour former vos équipes. Contactez AWS Support via le centre AWS Support pour obtenir des réponses à vos questions AWS. 

 [AWS Training and Certification](https://aws.amazon.com/training/) offre une formation gratuite par le biais de cours en ligne d'auto-formation sur les principes fondamentaux d'AWS. Vous pouvez également vous inscrire à une formation dirigée par un formateur afin de soutenir le développement des compétences AWS de vos équipes. 

 **Niveau de risque exposé si cette bonne pratique n'est pas respectée :** Moyenne entreprise 

## Directives d'implémentation
<a name="implementation-guidance"></a>
+  Les membres de l'équipe sont invités à maintenir et à développer leurs compétences : pour adopter les nouvelles technologies, soutenir l'innovation et accompagner l'évolution de la demande et des responsabilités à l'appui de vos charges de travail, la formation continue est nécessaire. 
  +  Fournir des ressources de formation : fournissez un temps structuré dédié, l'accès à des supports de formation, des ressources d'atelier et la possibilité de se joindre à des conférences et à des organisations professionnelles qui offrent des possibilités de formation auprès de formateurs et de pairs. Offrez aux membres juniors de l'équipe l'accès aux membres chevronnés en tant que mentors ou autorisez-les à suivre leur travail et à être exposés à leurs méthodes et compétences. Encouragez l'apprentissage du contenu qui n’est pas directement lié au travail afin d'avoir une perspective plus large. 
  +  Formation des équipes et engagement inter-équipe : planifiez les besoins de formation continue des membres de votre équipe. Offrir aux membres de l'équipe la possibilité de rejoindre d'autres équipes (temporairement ou définitivement) pour partager les compétences et les bonnes pratiques au profit de l'ensemble de votre organisation 
  +  Soutenir l'obtention et la conservation des certifications du secteur : aidez les membres de votre équipe à acquérir et à conserver les certifications sectorielles qui valident ce qu'ils ont appris, et reconnaissez leurs réalisations. 

## Ressources
<a name="resources"></a>

 **Documents connexes :** 
+  [Centre de ressources de démarrage AWS](https://aws.amazon.com/getting-started/) 
+  [les blogs AWS](https://aws.amazon.com/blogs/) 
+  [Conformité du AWS Cloud](https://aws.amazon.com/compliance/) 
+  [les forums de discussion AWS](https://forums.aws.amazon.com/index.jspa) 
+  [Documentation AWS](https://docs.aws.amazon.com/whitepapers/latest/aws-security-incident-response-guide/welcome.html) 
+  [les conférences techniques en ligne AWS](https://aws.amazon.com/getting-started/) 
+  [les événements et webinaires AWS](https://aws.amazon.com/events/) 
+  [Centre de connaissances AWS](https://aws.amazon.com/premiumsupport/knowledge-center/) 
+  [AWS Support](https://aws.amazon.com/premiumsupport/programs/) 
+  [AWS Training and Certification](https://aws.amazon.com/training/) 
+  [ateliers AWS Well-Architected](https://wellarchitectedlabs.com/), 
+  [Bibliothèque Amazon Builders' Library](https://aws.amazon.com/builders-library/) 
+  [Podcast AWS officiel](https://aws.amazon.com/podcasts/aws-podcast/). 

# OPS03-BP07 Fournir aux équipes les ressources appropriées
<a name="ops_org_culture_team_res_appro"></a>

 Maintenez les aptitudes des membres de l'équipe et fournissez les outils et les ressources nécessaires pour répondre aux besoins de votre charge de travail. Surmener les membres d'équipe augmente le risque d'incidents résultant d'une erreur humaine. Les investissements dans les outils et les ressources (par exemple, l'automatisation des activités fréquemment exécutées) peuvent accroître l'efficacité de votre équipe, lui permettant de soutenir des activités supplémentaires. 

 **Niveau de risque exposé si cette bonne pratique n'est pas respectée :** Moyenne entreprise 

## Directives d'implémentation
<a name="implementation-guidance"></a>
+  Fournir aux équipes les ressources appropriées : veillez à bien comprendre le succès de vos équipes et les facteurs qui contribuent à ce succès ou à leur échec. Agissez pour soutenir les équipes avec les ressources appropriées. 
  +  Comprendre les performances de l'équipe : mesurez la réalisation des résultats opérationnels et le développement des atouts par vos équipes. Suivez l'évolution de la production et du taux d'erreur dans le temps. Collaborez avec les équipes pour comprendre les défis liés au travail qui les impactent (par exemple, augmentation des responsabilités, modifications technologiques, perte de personnel ou augmentation du nombre de clients pris en charge). 
  +  Comprendre les impacts sur les performances des équipes : restez impliqué avec vos équipes afin que vous compreniez comment elles évoluent et s'il existe des facteurs externes qui les affectent. Lorsque vos équipes sont affectées par des facteurs externes, réévaluez les objectifs et ajustez les cibles le cas échéant. Identifiez les obstacles qui entravent la progression de vos équipes. Agissez au nom de vos équipes pour surmonter les obstacles et éliminer les charges inutiles. 
  +  Fournir les ressources nécessaires pour assurer le succès des équipes : vérifiez régulièrement si les ressources sont toujours appropriées et si des ressources supplémentaires sont nécessaires, et procédez aux ajustements appropriés pour les équipes de support. 

# OPS03-BP08 La diversité des opinions est encouragée et recherchée au sein des équipes et entre elles
<a name="ops_org_culture_diverse_inc_access"></a>

 Exploitez la diversité inter-organisationnelle pour rechercher des perspectives multiples et uniques. Utilisez cette perspective pour accroître l'innovation, remettre en question vos hypothèses et réduire le risque de biais de confirmation. Développez l'inclusion, la diversité et l'accessibilité au sein de vos équipes afin d'obtenir des perspectives bénéfiques. 

 La culture organisationnelle a un impact direct sur la satisfaction professionnelle et la fidélisation des membres de l'équipe. Favorisez l'engagement et l'exploitation des capacités des membres de votre équipe pour assurer la réussite de votre entreprise. 

 **Niveau de risque exposé si cette bonne pratique n'est pas respectée :** Faible 

## Directives d'implémentation
<a name="implementation-guidance"></a>
+  Rechercher des opinions et des perspectives variées : encouragez les contributions de chacun. Donnez la parole aux groupes sous-représentés. Effectuez une rotation des rôles et des responsabilités lors des réunions. 
  +  Élargir les rôles et les responsabilités : offrez aux membres de l'équipe l'opportunité d'assumer des rôles qu'ils n'auraient pas autrement. Ils acquièrent de l'expérience et du point de vue du rôle et des interactions avec les nouveaux membres de l'équipe avec lesquels ils n'interagissent pas autrement. Ils apporteront leur expérience et leur point de vue au nouveau rôle et aux membres de l'équipe avec lesquels ils interagissent. À mesure que les perspectives s'élargissent, de nouvelles opportunités commerciales peuvent se présenter, ou de nouvelles possibilités d'amélioration peuvent être identifiées. Demandez aux membres d'une équipe d'effectuer à tour de rôle des tâches communes que les autres exécutent habituellement afin de comprendre les exigences et l'impact de leur exécution. 
  +  Fournir un environnement sûr et accueillant : mettez en place une politique et des contrôles qui protègent la sécurité mentale et physique des membres de l'équipe au sein de votre organisation. Les membres de l'équipe doivent être en mesure d'interagir sans craindre de représailles. Lorsque les membres de l'équipe se sentent en sécurité et sont les bienvenus, ils sont plus susceptibles d'être impliqués et productifs. Plus votre organisation est diversifiée, mieux vous pouvez comprendre les personnes que vous soutenez, y compris vos clients. Lorsque les membres de votre équipe sont à l'aise, se sentent libres de parler et sont sûrs d'être entendus, ils sont plus susceptibles de partager des informations précieuses (par exemple, les possibilités de marketing, les besoins d'accessibilité, les segments de marché délaissés, les risques non reconnus dans votre environnement). 
  +  Permettre aux membres de l'équipe de participer pleinement : fournissez les ressources nécessaires pour que vos employés puissent participer pleinement à toutes les activités liées à leur travail. Les membres de l'équipe qui font face à des défis quotidiens ont développé des compétences pour s’y atteler. Ces compétences développées de manière unique peuvent apporter des avantages considérables à votre organisation. L'accompagnement des membres de l'équipe avec les ajustements nécessaires augmente les avantages que vous pouvez tirer de leurs contributions. 

# Préparation
<a name="a-prepare"></a>

**Topics**
+ [OPS 4  Comment concevoir votre charge de travail de sorte à en comprendre l'état ?](w2aac19b5b7b5.md)
+ [OPS 5  Comment réduire les défauts, faciliter les corrections et améliorer l'entrée dans la production ?](w2aac19b5b7b7.md)
+ [OPS 6  Comment réduire les risques liés au déploiement ?](w2aac19b5b7b9.md)
+ [OPS 7  Comment savoir si vous êtes prêt à gérer une charge de travail ?](w2aac19b5b7c11.md)

# OPS 4  Comment concevoir votre charge de travail de sorte à en comprendre l'état ?
<a name="w2aac19b5b7b5"></a>

 Concevez votre charge de travail de manière à ce qu'elle fournisse les informations nécessaires à tous les composants (par exemple, les mesures, les journaux et les traces) pour que vous puissiez comprendre son état interne. Cela vous permet de fournir des réponses efficaces, le cas échéant. 

**Topics**
+ [OPS04-BP01 Implémenter la télémétrie de l'application](ops_telemetry_application_telemetry.md)
+ [OPS04-BP02 Mettre en œuvre et configurer la télémétrie de la charge de travail](ops_telemetry_workload_telemetry.md)
+ [OPS04-BP03 Mettre en œuvre la télémétrie pour l'activité des utilisateurs](ops_telemetry_customer_telemetry.md)
+ [OPS04-BP04 Mettre en œuvre la télémétrie pour les dépendances](ops_telemetry_dependency_telemetry.md)
+ [OPS04-BP05 Mettre en œuvre la traçabilité des transactions](ops_telemetry_dist_trace.md)

# OPS04-BP01 Implémenter la télémétrie de l'application
<a name="ops_telemetry_application_telemetry"></a>

 La télémétrie de l'application est la pierre angulaire de l'observabilité de votre charge de travail. Votre application devrait émettre des données de télémétrie qui donnent un aperçu de son état et du niveau de réalisation des résultats commerciaux. Du dépannage à la mesure de l'impact d'une nouvelle fonctionnalité, la télémétrie de l'application informe sur la façon dont vous créez, exploitez et faites évoluer votre charge de travail. 

 La télémétrie d'une application se compose de métriques et de journaux. Les métriques sont des informations de diagnostic, telles que votre pouls ou votre température. Elles sont utilisées collectivement pour décrire l'état de votre application. La collecte de métriques au fil du temps permet de développer des points de référence et de détecter les anomalies. Les journaux sont des messages que l'application envoie à propos de son état interne ou des événements qui se produisent. Les codes d'erreur, les identificateurs de transaction et les actions de l'utilisateur sont des exemples d'événements consignés. 

 **Résultat souhaité :** 
+  Votre application émet des métriques et des journaux qui donnent un aperçu de son état et de la réalisation des résultats commerciaux. 
+  Les métriques et les journaux sont stockés de manière centralisée pour toutes les applications de la charge de travail. 

 **Anti-modèles courants :** 
+  Votre application n'émet pas de télémesures. Vous êtes contraint de compter sur vos clients pour savoir quand quelque chose ne fonctionne pas correctement. 
+  Un client a signalé que votre application ne répond pas. Vous n'avez pas de télémesures et êtes incapable de confirmer l'existence du problème ou de le caractériser sans utiliser vous-même l'application pour comprendre l'expérience actuelle de l'utilisateur. 

 **Avantages liés au respect de cette bonne pratique :** 
+  Vous pouvez déterminer l'état de votre application, l'expérience utilisateur et la réalisation des résultats commerciaux. 
+  Vous pouvez réagir rapidement aux changements d'état de votre application. 
+  Vous pouvez développer des tendances liées à l'état de l'application. 
+  Vous pouvez prendre des décisions éclairées sur l'amélioration de votre application. 
+  Vous pouvez détecter et résoudre les problèmes d'application plus rapidement. 

 **Niveau de risque exposé si cette bonne pratique n'est pas respectée :** Débit 

## Directives d'implémentation
<a name="implementation-guidance"></a>

 La mise en œuvre de la télémétrie de l'application comprend trois étapes : identifier un emplacement pour stocker les données de télémétrie, identifier les données de télémétrie qui décrivent l'état de l'application et instrumenter l'application pour émettre les données de télémétrie. 

 Prenons l'exemple d'une entreprise de commerce électronique dont l'architecture est basée sur des microservices. Dans le cadre de son processus de conception architecturale, elle a identifié la télémétrie de l'application qui l'aiderait à déterminer l'état de chaque microservice. Par exemple, le service de panier utilisateur a émis des données de télémétrie sur des événements tels que l'ajout d'un article au panier, l'abandon du panier et le temps nécessaire pour ajouter un article au panier. Tous les microservices ont enregistré les erreurs, les avertissements et les informations de transaction. La télémétrie a été envoyée à Amazon CloudWatch pour le stockage et l'analyse. 

 **Étapes d'implémentation** 

 La première étape consiste à identifier un emplacement central pour le stockage des données de télémétrie pour les applications de votre charge de travail. Si vous n'avez pas de plateforme [Amazon CloudWatch](https://aws.amazon.com/cloudwatch) fournit des fonctionnalités de collecte des données de télémétrie, de tableaux de bord, d'analyse et de génération d'événements. 

 Pour identifier les données de télémétrie dont vous avez besoin, commencez par les questions suivantes : 
+  Mon application est-elle saine ? 
+  Mon application atteint-elle les résultats commerciaux ? 

   Votre application doit émettre des journaux et des métriques qui répondent collectivement à ces questions. Si vous ne parvenez pas à répondre à ces questions avec la télémétrie de l'application existante, collaborez avec les parties prenantes de l'entreprise et de l'ingénierie pour créer une liste de télémétrie qui le permet. Vous pouvez demander des conseils techniques d'experts à votre équipe Compte AWS lorsque vous identifiez et développez de nouvelles applications de télémétrie. 

   Une fois que la télémétrie de l'application supplémentaire a été identifiée, travaillez avec les parties prenantes en ingénierie pour instrumenter l'application. [AWS Distro for OpenTelemetry](https://aws-otel.github.io/) fournit des API, des bibliothèques et des agents qui collectent la télémétrie de l'application. [Cet exemple illustre comment instrumenter une application JavaScript avec des métriques personnalisées](https://aws-otel.github.io/docs/getting-started/js-sdk/metric-manual-instr). 

   Les clients qui souhaitent comprendre les services d'observabilité proposés par AWS peuvent parcourir [Un atelier sur l'observabilité](https://catalog.workshops.aws/observability/en-US) seuls ou demander l'aide de leur équipe Compte AWS pour les guider. Cet atelier vous guide à travers les solutions d'observabilité sur AWS et fournit des exemples pratiques de leur utilisation. 

   Pour en savoir plus sur la télémétrie de l'application, lisez l'article [Instrumentation des systèmes distribués au profit de la visibilité opérationnelle](https://aws.amazon.com/builders-library/instrumenting-distributed-systems-for-operational-visibility/) dans Amazon Builders' Library. Il explique comment Amazon instrumente les applications et peut servir de guide pour développer vos propres directives d'instrumentation. 

 **Niveau d'effort du plan d'implémentation :** Moyenne entreprise 

## Ressources
<a name="resources"></a>

 **Bonnes pratiques associées :** 

[OPS04-BP02 Mettre en œuvre et configurer la télémétrie de la charge de travail](ops_telemetry_workload_telemetry.md) – La télémétrie de l'application est un composant de la télémétrie de la charge de travail. Afin de comprendre l'état de la charge de travail globale, vous devez comprendre celui des applications individuelles qui la composent. 

[OPS04-BP03 Mettre en œuvre la télémétrie pour l'activité des utilisateurs](ops_telemetry_customer_telemetry.md) – La télémétrie de l'activité des utilisateurs est souvent un sous-ensemble de la télémétrie de l'application. L'activité de l'utilisateur, comme les événements d'ajout au panier, les flux de clics ou les transactions terminées, donne un aperçu de l'expérience utilisateur. 

[OPS04-BP04 Mettre en œuvre la télémétrie pour les dépendances](ops_telemetry_dependency_telemetry.md) – Les contrôles de dépendance sont liés à la télémétrie de l'application et peuvent être instrumentés dans votre application. Si votre application s'appuie sur des dépendances externes telles qu'un DNS ou une base de données, votre application peut émettre des métriques et des journaux sur l'accessibilité, les délais d'attente et d'autres événements. 

[OPS04-BP05 Mettre en œuvre la traçabilité des transactions](ops_telemetry_dist_trace.md) – Le suivi des transactions sur une charge de travail nécessite que chaque application émette des informations sur la manière dont elle traite les événements partagés. La manière dont les applications individuelles gèrent ces événements est émise via la télémétrie de leur application. 

[OPS08-BP02 Définir les métriques de la charge de travail](ops_workload_health_design_workload_metrics.md) – Les métriques de charge de travail sont les principaux indicateurs de l'état de votre charge de travail. Les métriques clés de l'application font partie des métriques de la charge de travail. 

 **Documents connexes :** 
+  [AWS Builders' Library : Instrumentation des systèmes distribués au profit de la visibilité opérationnelle](https://aws.amazon.com/builders-library/instrumenting-distributed-systems-for-operational-visibility/) 
+  [AWS Distro for OpenTelemetry](https://aws-otel.github.io/) 
+  [Livre blanc du pilier Excellence opérationnelle AWS Well-Architected – Concevoir la télémétrie](https://docs.aws.amazon.com/wellarchitected/latest/operational-excellence-pillar/design-telemetry.html) 
+  [Création de métriques à partir d'événements de journaux à l'aide de filtres](https://docs.aws.amazon.com/AmazonCloudWatch/latest/logs/MonitoringLogData.html) 
+  [Mise en œuvre de la journalisation et de la surveillance avec Amazon CloudWatch](https://docs.aws.amazon.com/prescriptive-guidance/latest/implementing-logging-monitoring-cloudwatch/welcome.html) 
+  [Surveillance de l'état et des performances d'une application avec AWS Distro for OpenTelemetry](https://aws.amazon.com/blogs/opensource/monitoring-application-health-and-performance-with-aws-distro-for-opentelemetry/) 
+  [Nouveau – Comment mieux surveiller les métriques de votre application personnalisée à l'aide de l'agent Amazon CloudWatch](https://aws.amazon.com/blogs/devops/new-how-to-better-monitor-your-custom-application-metrics-using-amazon-cloudwatch-agent/) 
+  [Observabilité sur AWS](https://aws.amazon.com/products/management-and-governance/use-cases/monitoring-and-observability/) 
+  [Scénario – Publier des métriques sur CloudWatch](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/PublishMetrics.html) 
+  [Passez à l'action – Comment surveiller efficacement vos applications](https://aws.amazon.com/startups/start-building/how-to-monitor-applications/) 
+  [Utiliser CloudWatch avec un kit SDK AWS](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/sdk-general-information-section.html) 

 **Vidéos connexes :** 
+  [AWS re:Invent 2021 - Observability the open-source way](https://www.youtube.com/watch?v=vAnIhIwE5hY) 
+  [Collect Metrics and Logs from Amazon EC2 instances with the CloudWatch Agent](https://www.youtube.com/watch?v=vAnIhIwE5hY) 
+  [How to Easily Setup Application Monitoring for Your AWS Workloads - AWS Online Tech Talks](https://www.youtube.com/watch?v=LKCth30RqnA) 
+  [Mastering Observability of Your Serverless Applications - AWS Online Tech Talks](https://www.youtube.com/watch?v=CtsiXhiAUq8) 
+  [Open Source Observability with AWS - AWS Virtual Workshop](https://www.youtube.com/watch?v=vAnIhIwE5hY) 

 **Exemples connexes :** 
+  [Exemples de ressources de journalisation et de surveillance AWS](https://github.com/aws-samples/logging-monitoring-apg-guide-examples) 
+  [Solution AWS : framework de surveillance Amazon CloudWatch](https://aws.amazon.com/solutions/implementations/amazon-cloudwatch-monitoring-framework/?did=sl_card&trk=sl_card) 
+  [Solution AWS : journalisation centralisée](https://aws.amazon.com/solutions/implementations/centralized-logging/) 
+  [Un atelier sur l'observabilité](https://catalog.workshops.aws/observability/en-US) 

# OPS04-BP02 Mettre en œuvre et configurer la télémétrie de la charge de travail
<a name="ops_telemetry_workload_telemetry"></a>

 Concevez et configurez votre charge de travail afin d'émettre des informations sur son état interne et son statut actuel (par exemple, le volume des appels d'API, les codes de statut HTTP et les événements de dimensionnement). Utilisez ces informations pour déterminer à quel moment une réponse est nécessaire. 

 Utilisez un service comme [Amazon CloudWatch](https://aws.amazon.com/cloudwatch/) pour regrouper les journaux et les métriques des composants de charge de travail (par exemple, les journaux d'API provenant de [AWS CloudTrail](https://aws.amazon.com/cloudtrail/), [les métriques AWS Lambda](https://docs.aws.amazon.com/lambda/latest/dg/lambda-monitoring.html), [les journaux de flux Amazon VPC](https://docs.aws.amazon.com/vpc/latest/userguide/flow-logs.html)et [les autres services](https://docs.aws.amazon.com/AmazonCloudWatch/latest/logs/aws-services-sending-logs.html)). 

 **Anti-modèles courants :** 
+  Vos clients se plaignent des performances médiocres. Aucune modification récente n'a été apportée à votre application, et vous soupçonnez donc un problème lié à la charge de travail. Vous n'avez aucune télémesure à analyser pour déterminer les composants qui contribuent aux performances médiocres. 
+  Votre application est inaccessible. Vous n'avez pas de télémesures pour déterminer s'il s'agit d'un problème de mise en réseau. 

 **Avantages liés au respect de cette bonne pratique :** Comprendre ce qui se passe à l'intérieur de votre charge de travail vous permet de réagir si nécessaire. 

 **Niveau de risque exposé si cette bonne pratique n'est pas respectée :** Débit 

## Directives d'implémentation
<a name="implementation-guidance"></a>
+  Mettre en œuvre la télémétrie pour les journaux et les métriques : instrumentez votre charge de travail pour émettre des informations sur son état interne, son statut et la réalisation des résultats opérationnels. Utilisez ces informations pour déterminer à quel moment une réponse est nécessaire. 
  +  [Gaining better observability of your VMs with Amazon CloudWatch - AWS Online Tech Talks](https://youtu.be/1Ck_me4azMw) 
  +  [Fonctionnement d'Amazon CloudWatch](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/cloudwatch_architecture.html) 
  +  [Qu'est-ce qu'Amazon CloudWatch ?](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/WhatIsCloudWatch.html) 
  +  [Utilisation des métriques Amazon CloudWatch](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/working_with_metrics.html) 
  +  [Qu'est-ce qu'Amazon CloudWatch Logs ?](https://docs.aws.amazon.com/AmazonCloudWatch/latest/logs/WhatIsCloudWatchLogs.html) 
    +  Mettre en œuvre et configurer la télémétrie de la charge de travail : concevez et configurez votre charge de travail afin d'émettre des informations sur son état interne et son statut actuel (par exemple, le volume des appels d'API, les codes de statut HTTP et les événements de dimensionnement). 
      +  [Référence aux dimensions et métriques Amazon CloudWatch](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/CW_Support_For_AWS.html) 
      +  [AWS CloudTrail](https://aws.amazon.com/cloudtrail/) 
      +  [Qu'est-ce qu'AWS CloudTrail ?](https://docs.aws.amazon.com/awscloudtrail/latest/userguide/cloudtrail-user-guide.html) 
      +  [Journaux de flux VPC](https://docs.aws.amazon.com/vpc/latest/userguide/flow-logs.html) 

## Ressources
<a name="resources"></a>

 **Documents connexes :** 
+  [AWS CloudTrail](https://aws.amazon.com/cloudtrail/) 
+  [Documentation Amazon CloudWatch](https://docs.aws.amazon.com/cloudwatch/index.html) 
+  [Référence aux dimensions et métriques Amazon CloudWatch](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/CW_Support_For_AWS.html) 
+  [Fonctionnement d'Amazon CloudWatch](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/cloudwatch_architecture.html) 
+  [Utilisation des métriques Amazon CloudWatch](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/working_with_metrics.html) 
+  [Journaux de flux VPC](https://docs.aws.amazon.com/vpc/latest/userguide/flow-logs.html) 
+  [Qu'est-ce qu'AWS CloudTrail ?](https://docs.aws.amazon.com/awscloudtrail/latest/userguide/cloudtrail-user-guide.html) 
+  [Qu'est-ce qu'Amazon CloudWatch Logs ?](https://docs.aws.amazon.com/AmazonCloudWatch/latest/logs/WhatIsCloudWatchLogs.html) 
+  [Qu'est-ce qu'Amazon CloudWatch ?](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/WhatIsCloudWatch.html) 

 **Vidéos connexes :** 
+  [Application Performance Management on AWS](https://www.youtube.com/watch?v=5T4stR-HFas) 
+  [Gaining Better Observability of Your VMs with Amazon CloudWatch](https://youtu.be/1Ck_me4azMw) 
+  [Gaining better observability of your VMs with Amazon CloudWatch - AWS Online Tech Talks](https://youtu.be/1Ck_me4azMw) 

# OPS04-BP03 Mettre en œuvre la télémétrie pour l'activité des utilisateurs
<a name="ops_telemetry_customer_telemetry"></a>

 Instrumentez le code de votre application pour émettre des informations sur l'activité de l'utilisateur, par exemple, clic sur des flux, ou lancement, abandon et fin des transactions. Utilisez ces informations pour vous aider à comprendre la manière dont l'application est utilisée, les modèles d'utilisation, et pour déterminer si une réponse est obligatoire. 

 **Anti-modèles courants :** 
+  Vos développeurs ont déployé une nouvelle fonctionnalité sans télémesure utilisateur et l'utilisation a augmenté. Vous ne pouvez pas déterminer si l'utilisation accrue provient de l'utilisation de la nouvelle fonction ou s'il s'agit d'un problème introduit avec le nouveau code. 
+  Vos développeurs ont déployé une nouvelle fonctionnalité sans télémesure utilisateur. Vous ne pouvez pas savoir si vos clients l'utilisent sans les contacter et leur demander. 

 **Avantages liés au respect de cette bonne pratique :** Comprenez comment vos clients utilisent votre application afin d’identifier les schémas d'utilisation, les comportements inattendus et pouvoir réagir si nécessaire. 

 **Niveau de risque exposé si cette bonne pratique n'est pas respectée :** Moyenne entreprise 

## Directives d'implémentation
<a name="implementation-guidance"></a>
+  Implémenter la télémétrie pour l'activité des utilisateurs : concevez votre code d'application afin d'émettre des informations sur l'activité des utilisateurs (par exemple, le nombre de clics ou les transactions commencées, abandonnées et terminées). Utilisez ces informations pour vous aider à comprendre la manière dont l'application est utilisée, les modèles d'utilisation, et pour déterminer si une réponse est obligatoire. 

# OPS04-BP04 Mettre en œuvre la télémétrie pour les dépendances
<a name="ops_telemetry_dependency_telemetry"></a>

 Concevez et configurez votre charge de travail pour qu'elle émette des informations sur l'état (par exemple, accessibilité ou temps de réponse) des ressources dont elle dépend. Les exemples de dépendances externes incluent les bases de données externes, DNS et la connectivité réseau. Utilisez ces informations pour déterminer à quel moment une réponse est nécessaire. 

 **Anti-modèles courants :** 
+  Vous ne pouvez pas déterminer si la raison pour laquelle votre application est inaccessible est un problème DNS sans effectuer manuellement une vérification pour vérifier que votre fournisseur DNS fonctionne. 
+  Votre application de panier ne finalise pas les transactions. Vous ne pouvez pas déterminer s'il s'agit d'un problème avec le fournisseur de traitement des cartes de crédit sans le contacter pour le vérifier. 

 **Avantages liés au respect de cette bonne pratique :** La compréhension de l'état de vos dépendances vous permet de répondre si nécessaire. 

 **Niveau de risque exposé si cette bonne pratique n'est pas respectée :** Moyenne entreprise 

## Directives d'implémentation
<a name="implementation-guidance"></a>
+  Mettre en œuvre la télémétrie pour les dépendances : concevez et configurez votre charge de travail afin d'émettre des informations sur l'état et le statut des systèmes dont elle dépend. Voici quelques exemples : bases de données externes, DNS, connectivité réseau et services externes de traitement des cartes de crédit. 
  +  [Intégration de l'agent Amazon CloudWatch avec AWS Systems Manager : métriques unifiées et collecte de journaux pour Linux et Windows](https://aws.amazon.com/blogs/aws/new-amazon-cloudwatch-agent-with-aws-systems-manager-integration-unified-metrics-log-collection-for-linux-windows/) 
  +  [Collecte des métriques et des journaux des instances Amazon EC2 et serveurs sur site avec l'agent CloudWatch](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/Install-CloudWatch-Agent.html) 

## Ressources
<a name="resources"></a>

 **Documents connexes :** 
+  [Intégration de l'agent Amazon CloudWatch avec AWS Systems Manager : métriques unifiées et collecte de journaux pour Linux et Windows](https://aws.amazon.com/blogs/aws/new-amazon-cloudwatch-agent-with-aws-systems-manager-integration-unified-metrics-log-collection-for-linux-windows/) 
+  [Collecte des métriques et des journaux des instances Amazon EC2 et serveurs sur site avec l'agent CloudWatch](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/Install-CloudWatch-Agent.html) 

   **Exemples connexes :** 
+  [Ateliers Well-Architected : surveillance des dépendances](https://wellarchitectedlabs.com/operational-excellence/100_labs/100_dependency_monitoring/) 

# OPS04-BP05 Mettre en œuvre la traçabilité des transactions
<a name="ops_telemetry_dist_trace"></a>

 Mettez en œuvre le code de votre application et configurez vos composants de charge de travail afin d'émettre des informations sur le flux des transactions dans cette dernière. Utilisez ces informations pour déterminer à quel moment une réponse est requise et identifier les facteurs d’un problème. 

 Sur AWS, vous pouvez utiliser des services de suivi distribués, tels que [AWS X-Ray](https://aws.amazon.com/xray/)pour collecter et enregistrer des suivis au fur et à mesure que les transactions transitent par votre charge de travail, générer des cartes pour voir comment les transactions circulent dans votre charge de travail et vos services, obtenir des informations sur les relations entre les composants et identifier et analyser les problèmes en temps réel. 

 **Anti-modèles courants :** 
+  Vous avez mis en œuvre une architecture de microservices sans serveur couvrant plusieurs comptes. Vos clients rencontrent des problèmes de performances intermittents. Vous ne pouvez pas découvrir quelle fonction ou quel composant est responsable parce qu'il vous manque les traces qui vous permettraient d'identifier où, dans l'application, le problème de performance existe et sa cause. 
+  Vous essayez de déterminer où se situent les goulets d'étranglement en matière de performance dans votre charge de travail afin de pouvoir y remédier dans vos efforts de développement. Vous ne pouvez pas voir la relation entre vos composants d'application, et les services avec lesquels ils interagissent, pour déterminer où se situent les goulets d'étranglement, car vous ne disposez pas des traces qui vous permettraient d'analyser les services et chemins spécifiques ayant un impact sur les performances de l'application. 

 **Avantages liés au respect de cette bonne pratique :** La compréhension du flux des transactions de votre charge de travail permet de comprendre le comportement attendu des transactions de cette dernière, ainsi que les variations par rapport au comportement attendu de votre charge de travail, ce qui vous permet de réagir si nécessaire. 

 **Niveau de risque exposé si cette bonne pratique n'est pas respectée :** Faible 

## Directives d'implémentation
<a name="implementation-guidance"></a>
+  Mettre en œuvre la traçabilité des transactions : concevez votre application et votre charge de travail de manière à émettre des informations sur le flux des transactions entre les composants du système, telles que l'étape de la transaction, le composant actif et le temps nécessaire pour terminer l'activité. Utilisez ces informations pour déterminer ce qui est en cours, ce qui est terminé et les résultats des activités terminées. Cela vous permet de déterminer à quel moment une réponse est nécessaire. Par exemple, des temps de réponse plus longs que prévu pour une transaction attendue au sein d'un composant peuvent indiquer des problèmes avec ledit composant. 
  +  [AWS X-Ray](https://aws.amazon.com/xray/) 
  +  [Qu'est-ce que AWS X-Ray ?](https://docs.aws.amazon.com/xray/latest/devguide/aws-xray.html) 

## Ressources
<a name="resources"></a>

 **Documents connexes :** 
+  [AWS X-Ray](https://aws.amazon.com/xray/) 
+  [Qu'est-ce que AWS X-Ray ?](https://docs.aws.amazon.com/xray/latest/devguide/aws-xray.html) 

# OPS 5  Comment réduire les défauts, faciliter les corrections et améliorer l'entrée dans la production ?
<a name="w2aac19b5b7b7"></a>

 Adoptez des approches qui améliorent l'entrée des modifications dans la production et permettent une refactorisation, une rétroaction de qualité rapide et la correction de bogues. Cela permet d'accélérer l'entrée des modifications bénéfiques dans la production, de limiter le déploiement de problèmes et d'identifier et de corriger rapidement les problèmes introduits par les activités de déploiement. 

**Topics**
+ [OPS05-BP01 Utiliser le contrôle de version](ops_dev_integ_version_control.md)
+ [OPS05-BP02 Tester et valider les modifications](ops_dev_integ_test_val_chg.md)
+ [OPS05-BP03 Utiliser des systèmes de gestion de la configuration](ops_dev_integ_conf_mgmt_sys.md)
+ [OPS05-BP04 Utiliser des systèmes de gestion du développement et du déploiement](ops_dev_integ_build_mgmt_sys.md)
+ [OPS05-BP05 Procéder à la gestion des correctifs](ops_dev_integ_patch_mgmt.md)
+ [OPS05-BP06 Partager les normes de conception](ops_dev_integ_share_design_stds.md)
+ [OPS05-BP07 Mettre en œuvre des pratiques visant à améliorer la qualité du code](ops_dev_integ_code_quality.md)
+ [OPS05-BP08 Utiliser plusieurs environnements](ops_dev_integ_multi_env.md)
+ [OPS05-BP09 Effectuer des modifications fréquentes, légères et réversibles](ops_dev_integ_freq_sm_rev_chg.md)
+ [OPS05-BP10 Automatiser complètement l'intégration et le déploiement](ops_dev_integ_auto_integ_deploy.md)

# OPS05-BP01 Utiliser le contrôle de version
<a name="ops_dev_integ_version_control"></a>

 Utilisez le contrôle de version pour permettre le suivi des modifications et des versions. 

 De nombreux services AWS offrent des fonctionnalités de contrôle de version. Utilisez un système de contrôle de source ou de révision comme [AWS CodeCommit](https://aws.amazon.com/codecommit/) pour gérer le code et d'autres artefacts, tels que les modèles [AWS CloudFormation](https://aws.amazon.com/cloudformation/) avec contrôle de version de votre infrastructure. 

 **Anti-modèles courants :** 
+  Vous avez développé et stocké le code sur votre poste de travail. Un problème de stockage s’est produit sur le poste de travail et vous avez perdu le code. 
+  Après avoir remplacé le code existant par vos modifications, vous redémarrez votre application et elle n'est plus utilisable. Vous ne pouvez pas revenir à la modification. 
+  Vous disposez d'un verrou d'écriture sur un fichier de rapport que quelqu'un d'autre doit modifier. Il vous contacte pour vous demander d'arrêter de travailler dessus afin qu'il puisse effectuer ses tâches. 
+  Votre équipe de recherche a travaillé sur une analyse détaillée qui façonnera vos futurs travaux. Quelqu'un a accidentellement enregistré sa liste d'achats sur le rapport final. Vous ne pouvez pas annuler la modification et vous devrez recréer le rapport. 

 **Avantages liés au respect de cette bonne pratique :** En utilisant les fonctionnalités de contrôle des versions, vous pouvez revenir facilement aux bons états connus, aux versions précédentes et limiter le risque de perte de ressources. 

 **Niveau de risque exposé si cette bonne pratique n'est pas respectée :** Débit 

## Directives d'implémentation
<a name="implementation-guidance"></a>
+  Utiliser le contrôle de version : gérez les ressources dans des référentiels avec contrôle de version. Cela permet le suivi des modifications, le déploiement de nouvelles versions, la détection des modifications apportées aux versions existantes, et le retour à des versions antérieures (par exemple, la restauration à un état correct connu en cas de défaillance). Intégrez les fonctionnalités de contrôle de version de vos systèmes de gestion de la configuration dans vos procédures. 
  +  [Présentation d'AWS CodeCommit](https://youtu.be/46PRLMW8otg) 
  +  [Qu'est-ce qu'AWS CodeCommit ?](https://docs.aws.amazon.com/codecommit/latest/userguide/welcome.html) 

## Ressources
<a name="resources"></a>

 **Documents connexes :** 
+  [Qu'est-ce qu'AWS CodeCommit ?](https://docs.aws.amazon.com/codecommit/latest/userguide/welcome.html) 

 **Vidéos connexes :** 
+  [Présentation d'AWS CodeCommit](https://youtu.be/46PRLMW8otg) 

# OPS05-BP02 Tester et valider les modifications
<a name="ops_dev_integ_test_val_chg"></a>

 Testez et valider les modifications afin de limiter et de détecter les erreurs. Automatisez les tests pour réduire les erreurs causées par les processus manuels et diminuer le niveau d'efforts nécessaires aux tests. 

 De nombreux services AWS offrent des fonctionnalités de contrôle de version. Utilisez un système de contrôle de source ou de révision comme [AWS CodeCommit](https://aws.amazon.com/codecommit/) pour gérer le code et d'autres artefacts, tels que les modèles [AWS CloudFormation](https://aws.amazon.com/cloudformation/) avec contrôle de version de votre infrastructure. 

 **Anti-modèles courants :** 
+  Vous déployez votre nouveau code en production et les clients commencent à appeler, car votre application ne fonctionne plus. 
+  Vous appliquez de nouveaux groupes de sécurité pour améliorer la sécurité de votre périmètre. Il fonctionne avec des conséquences imprévues, et vos utilisateurs ne sont pas en mesure d'accéder à vos applications. 
+  Vous modifiez une méthode appelée par votre nouvelle fonction. Une autre fonction dépendait également de cette méthode et ne fonctionne plus. Le problème n'est pas détecté et entre en production. L'autre fonction n'est pas appelée pendant un certain temps et échoue finalement en production sans aucune corrélation avec la cause. 

 **Avantages liés au respect de cette bonne pratique :** En testant et validant rapidement les modifications, vous êtes en mesure de résoudre les problèmes avec des coûts réduits, et de limiter l'impact sur vos clients. En testant avant le déploiement, vous minimisez l'introduction d'erreurs. 

 **Niveau de risque exposé si cette bonne pratique n'est pas respectée :** Débit 

## Directives d'implémentation
<a name="implementation-guidance"></a>
+  Tester et valider les modifications : les modifications doivent être testées et les résultats validés à toutes les phases du cycle de vie (par exemple, le développement, le test et la production). Utilisez les résultats des tests pour confirmer les nouvelles fonctionnalités et atténuer les risques et les effets des échecs de déploiements. Automatisez les tests et la validation pour assurer la cohérence de l'examen, réduire les erreurs causées par les processus manuels et diminuer le niveau d'effort. 
  +  [Qu'est-ce qu'AWS CodeBuild ?](https://docs.aws.amazon.com/codebuild/latest/userguide/welcome.html) 
  +  [Prise en charge de build local pour AWS CodeBuild](https://aws.amazon.com/blogs/devops/announcing-local-build-support-for-aws-codebuild/) 

## Ressources
<a name="resources"></a>

 **Documents connexes :** 
+  [Outils pour développeurs AWS](https://aws.amazon.com/products/developer-tools/) 
+  [Prise en charge de build local pour AWS CodeBuild](https://aws.amazon.com/blogs/devops/announcing-local-build-support-for-aws-codebuild/) 
+  [Qu'est-ce qu'AWS CodeBuild ?](https://docs.aws.amazon.com/codebuild/latest/userguide/welcome.html) 

# OPS05-BP03 Utiliser des systèmes de gestion de la configuration
<a name="ops_dev_integ_conf_mgmt_sys"></a>

 Utilisez des systèmes de gestion de la configuration pour effectuer et suivre les modifications de la configuration. Ces systèmes réduisent les erreurs causées par les processus manuels et diminuent le niveau d'effort nécessaire au déploiement des modifications. 

 La gestion de la configuration statique définit des valeurs lors de l'initialisation d'une ressource. Elles doivent rester cohérentes tout au long de la durée de vie de cette ressource. Certains exemples incluent la définition de la configuration d'un serveur web ou d'applications sur une instance, ou la définition de la configuration d'un service AWS dans [AWS Management Console](https://docs.aws.amazon.com/awsconsolehelpdocs/index.html) ou via l'interface [AWS CLI](https://aws.amazon.com/cli/). 

 La gestion dynamique de la configuration définit des valeurs à l'initialisation qui peuvent ou sont censées changer pendant la durée de vie d'une ressource. Par exemple, vous pouvez définir un mécanisme d'activation et de désactivation d'un fonctionnalité dans votre code via un changement de configuration, ou modifier le niveau de détail du journal pendant un incident pour capturer plus de données, puis revenir en arrière après l'incident en éliminant les journaux désormais inutiles et les dépenses associées. 

 Si des configurations dynamiques sont appliquées à vos applications exécutées sur des instances, des conteneurs, des fonctions sans serveur ou des appareils, vous pouvez utiliser [AWS AppConfig](https://docs.aws.amazon.com/appconfig/latest/userguide/what-is-appconfig.html) pour les gérer et les déployer dans vos environnements. 

 Sur AWS, vous pouvez utiliser [AWS Config](https://docs.aws.amazon.com/config/latest/developerguide/WhatIsConfig.html) pour surveiller en permanence vos configurations de ressources AWS [entre les comptes et les régions](https://docs.aws.amazon.com/config/latest/developerguide/aggregate-data.html). Il vous permet de suivre leur historique de configuration, de comprendre comment une modification de la configuration affecterait d'autres ressources et de les auditer par rapport aux configurations attendues ou souhaitées avec [AWS Config Rules](https://docs.aws.amazon.com/config/latest/developerguide/evaluate-config.html) et [les packs de conformité AWS Config](https://docs.aws.amazon.com/config/latest/developerguide/conformance-packs.html). 

 Dans AWS, vous pouvez créer des pipelines d'intégration continue/de déploiement continu (CI/CD) à l'aide de services tels que les [Outils pour développeurs AWS](https://aws.amazon.com/products/developer-tools/) (par exemple, AWS CodeCommit, [AWS CodeBuild](https://aws.amazon.com/codebuild/), [AWS CodePipeline](https://aws.amazon.com/codepipeline/), [AWS CodeDeploy](https://aws.amazon.com/codedeploy/)et [AWS CodeStar](https://aws.amazon.com/codestar/)). 

 Maintenez un calendrier des modifications et suivez la planification d'activités ou d'événements métier ou opérationnels importants susceptibles d'être affectés par la mise en œuvre d'un changement. Ajustez les activités pour gérer les risques liés à ces plans. [AWS Systems Manager Modifier le calendrier](https://docs.aws.amazon.com/systems-manager/latest/userguide/systems-manager-change-calendar.html) fournit un mécanisme permettant de documenter les fenêtres temporelles ouvertes ou fermées aux modifications et pourquoi elles le sont et de [partager ces informations](https://docs.aws.amazon.com/systems-manager/latest/userguide/change-calendar-share.html) avec d'autres Comptes AWS. Les scripts AWS Systems Manager peuvent être configurés pour respecter l'état du calendrier de modifications. 

 [fenêtres de maintenance AWS Systems Manager](https://docs.aws.amazon.com/systems-manager/latest/userguide/systems-manager-maintenance.html) peuvent être utilisées pour planifier les performances des scripts AWS SSM Run Command ou Automation, des appels AWS Lambda ou des activités AWS Step Functions à des heures spécifiées. Marquez ces activités dans votre calendrier de modifications afin qu'elles puissent être incluses dans votre évaluation. 

 **Anti-modèles courants :** 
+  Vous mettez manuellement à jour la configuration des serveurs Web de votre flotte, et un certain nombre de serveurs ne répondent plus en raison d'erreurs de mise à jour. 
+  Vous mettez à jour manuellement votre flotte de serveurs d'applications pendant plusieurs heures. L'incohérence de la configuration pendant la modification entraîne des comportements inattendus. 
+  Quelqu'un a mis à jour vos groupes de sécurité et vos serveurs Web ne sont plus accessibles. Sans savoir ce qui a changé, vous passez beaucoup de temps à enquêter sur la question, ce qui prolonge votre temps de reprise. 

 **Avantages liés au respect de cette bonne pratique :** L'adoption de systèmes de gestion de la configuration réduit le niveau d'effort nécessaire pour effectuer et suivre les changements, ainsi que la fréquence des erreurs causées par les procédures manuelles. 

 **Niveau de risque exposé si cette bonne pratique n'est pas respectée :** Moyenne entreprise 

## Directives d'implémentation
<a name="implementation-guidance"></a>
+  Utiliser des systèmes de gestion de la configuration : exploitez des systèmes de gestion de la configuration afin de suivre et de mettre en œuvre les modifications, de réduire les erreurs causées par les processus manuels et de réduire le niveau d'effort. 
  +  [Gestion de la configuration d'infrastructure](https://aws.amazon.com/answers/configuration-management/aws-infrastructure-configuration-management/) 
  +  [AWS Config](https://aws.amazon.com/config/) 
  +  [Qu'est-ce qu'AWS Config ?](https://docs.aws.amazon.com/config/latest/developerguide/WhatIsConfig.html) 
  +  [Présentation d'AWS CloudFormation](https://youtu.be/Omppm_YUG2g) 
  +  [Qu'est-ce qu'AWS CloudFormation ?](https://docs.aws.amazon.com/AWSCloudFormation/latest/UserGuide/Welcome.html) 
  +  [AWS OpsWorks](https://aws.amazon.com/opsworks/) 
  +  [Qu'est-ce qu'AWS OpsWorks ?](https://docs.aws.amazon.com/opsworks/latest/userguide/welcome.html) 
  +  [Présentation d'AWS Elastic Beanstalk](https://youtu.be/SrwxAScdyT0) 
  +  [Qu'est-ce qu'AWS Elastic Beanstalk ?](https://docs.aws.amazon.com/elasticbeanstalk/latest/dg/Welcome.html) 

## Ressources
<a name="resources"></a>

 **Documents connexes :** 
+  [AWS AppConfig](https://docs.aws.amazon.com/appconfig/latest/userguide/what-is-appconfig.html) 
+  [Outils pour développeurs AWS](https://aws.amazon.com/products/developer-tools/) 
+  [AWS OpsWorks](https://aws.amazon.com/opsworks/) 
+  [AWS Systems Manager Modifier le calendrier](https://docs.aws.amazon.com/systems-manager/latest/userguide/systems-manager-change-calendar.html) 
+  [fenêtres de maintenance AWS Systems Manager](https://docs.aws.amazon.com/systems-manager/latest/userguide/systems-manager-maintenance.html) 
+  [Gestion de la configuration d'infrastructure](https://aws.amazon.com/answers/configuration-management/aws-infrastructure-configuration-management/) 
+  [Qu'est-ce qu'AWS CloudFormation ?](https://docs.aws.amazon.com/AWSCloudFormation/latest/UserGuide/Welcome.html) 
+  [Qu'est-ce qu'AWS Config ?](https://docs.aws.amazon.com/config/latest/developerguide/WhatIsConfig.html) 
+  [Qu'est-ce qu'AWS Elastic Beanstalk ?](https://docs.aws.amazon.com/elasticbeanstalk/latest/dg/Welcome.html) 
+  [Qu'est-ce qu'AWS OpsWorks ?](https://docs.aws.amazon.com/opsworks/latest/userguide/welcome.html) 

 **Vidéos connexes :** 
+  [Présentation d'AWS CloudFormation](https://youtu.be/Omppm_YUG2g) 
+  [Présentation d'AWS Elastic Beanstalk](https://youtu.be/SrwxAScdyT0) 

# OPS05-BP04 Utiliser des systèmes de gestion du développement et du déploiement
<a name="ops_dev_integ_build_mgmt_sys"></a>

 Utilisez des systèmes de gestion du développement et du déploiement. Ces systèmes réduisent les erreurs causées par les processus manuels et diminuent le niveau d'effort nécessaire au déploiement des modifications. 

 Dans AWS, vous pouvez créer des pipelines d'intégration continue/de déploiement continu (CI/CD) à l'aide de services tels que les [Outils pour développeurs AWS](https://aws.amazon.com/products/developer-tools/) (par exemple, AWS CodeCommit, [AWS CodeBuild](https://aws.amazon.com/codebuild/), [AWS CodePipeline](https://aws.amazon.com/codepipeline/), [AWS CodeDeploy](https://aws.amazon.com/codedeploy/)et [AWS CodeStar](https://aws.amazon.com/codestar/)). 

 **Anti-modèles courants :** 
+  Après avoir compilé votre code sur votre système de développement, vous copiez l'exécutable sur vos systèmes de production et il ne démarre pas. Les fichiers journaux locaux indiquent qu’il n’a pas fonctionné en raison de dépendances manquantes. 
+  Vous créez avec succès votre application avec de nouvelles fonctionnalités dans votre environnement de développement et soumettez le code à l'assurance qualité (QA). L'assurance qualité échoue, car il manque des ressources statiques. 
+  Vendredi, après de nombreux efforts, vous avez réussi à créer manuellement votre application dans votre environnement de développement, y compris vos nouvelles fonctionnalités codées. Lundi, vous ne pouvez pas répéter les étapes qui vous ont permis de créer votre application avec succès. 
+  Vous effectuez les tests que vous avez créés pour votre nouvelle version. Ensuite, vous passez la semaine suivante à configurer un environnement de test et à exécuter tous les tests d'intégration existants, suivis des tests de performances. Le nouveau code a un impact inacceptable sur les performances et doit être redéveloppé, puis retesté. 

 **Avantages liés au respect de cette bonne pratique :** En fournissant des mécanismes pour gérer les activités de construction et de déploiement, vous réduisez le niveau d'effort nécessaire pour effectuer des tâches répétitives, vous libérez les membres de votre équipe pour qu'ils puissent se concentrer sur leurs tâches créatives de grande valeur et vous limitez l'introduction d'erreurs provenant des procédures manuelles. 

 **Niveau de risque exposé si cette bonne pratique n'est pas respectée :** Moyenne entreprise 

## Directives d'implémentation
<a name="implementation-guidance"></a>
+  Utiliser des systèmes de gestion du développement et du déploiement : servez-vous de systèmes de gestion du développement et du déploiement afin de suivre et de mettre en œuvre les modifications, de réduire les erreurs causées par les processus manuels et de réduire le niveau d'efforts. Automatisez entièrement le pipeline d'intégration et de déploiement à partir du code d'enregistrement et par le biais du développement, des tests, du déploiement et de la validation. Cela permet de réduire les délais, d'augmenter la fréquence des changements et de diminuer le niveau d'effort. 
  +  [Qu'est-ce qu'AWS CodeBuild ?](https://docs.aws.amazon.com/codebuild/latest/userguide/welcome.html) 
  +  [Bonnes pratiques d'intégration continue pour le développement de logiciels](https://www.youtube.com/watch?v=GEPJ7Lo346A) 
  +  [Slalom: CI/CD for serverless applications on AWS](https://www.youtube.com/watch?v=tEpx5VaW4WE) 
  +  [Introduction to AWS CodeDeploy - automated software deployment with Amazon Web Services](https://www.youtube.com/watch?v=Wx-ain8UryM) 
  +  [Qu'est-ce qu'AWS CodeDeploy ?](https://docs.aws.amazon.com/codedeploy/latest/userguide/welcome.html) 

## Ressources
<a name="resources"></a>

 **Documents connexes :** 
+  [Outils pour développeurs AWS](https://aws.amazon.com/products/developer-tools/) 
+  [Qu'est-ce qu'AWS CodeBuild ?](https://docs.aws.amazon.com/codebuild/latest/userguide/welcome.html) 
+  [Qu'est-ce qu'AWS CodeDeploy ?](https://docs.aws.amazon.com/codedeploy/latest/userguide/welcome.html) 

 **Vidéos connexes :** 
+  [Bonnes pratiques d'intégration continue pour le développement de logiciels](https://www.youtube.com/watch?v=GEPJ7Lo346A) 
+  [Introduction to AWS CodeDeploy - automated software deployment with Amazon Web Services](https://www.youtube.com/watch?v=Wx-ain8UryM) 
+  [Slalom: CI/CD for serverless applications on AWS](https://www.youtube.com/watch?v=tEpx5VaW4WE) 

# OPS05-BP05 Procéder à la gestion des correctifs
<a name="ops_dev_integ_patch_mgmt"></a>

 Procédez à la gestion des correctifs afin de profiter des fonctionnalités, de résoudre les problèmes et de rester conforme à la gouvernance. Automatisez la gestion des correctifs pour réduire les erreurs causées par les processus manuels et le niveau d'efforts nécessaires aux correctifs. 

 La gestion des correctifs et des vulnérabilités fait partie de vos activités de gestion des bénéfices et des risques. Il est préférable d'avoir des infrastructures immuables et de déployer des charges de travail dans des états de bon fonctionnement connus et vérifiés. Lorsque cela n'est pas viable, l'application de correctifs est la seule solution. 

 La mise à jour des images de machine, des images de conteneur ou [des exécutions personnalisées et des bibliothèques supplémentaires Lambda](https://docs.aws.amazon.com/lambda/latest/dg/security-configuration.html) pour supprimer les vulnérabilités fait partie de la gestion des correctifs. Vous devez gérer les mises à jour des [Amazon Machine Images](https://docs.aws.amazon.com/AWSEC2/latest/UserGuide/AMIs.html) (AMI) pour les images Linux ou Windows Server à l'aide de [EC2 Image Builder](https://aws.amazon.com/image-builder/). Vous pouvez utiliser [Amazon Elastic Container Registry](https://docs.aws.amazon.com/AmazonECR/latest/userguide/what-is-ecr.html) avec votre pipeline existant pour [gérer les images Amazon ECS](https://docs.aws.amazon.com/AmazonECR/latest/userguide/ECR_on_ECS.html) et [les images Amazon EKS](https://docs.aws.amazon.com/AmazonECR/latest/userguide/ECR_on_EKS.html). AWS Lambda inclut [des fonctionnalités](https://docs.aws.amazon.com/lambda/latest/dg/configuration-versions.html) de gestion des versions. 

 L'application de correctifs ne doit pas être effectuée sur les systèmes de production sans avoir effectué un test préalable dans un environnement sûr. Les correctifs ne doivent être appliqués que s'ils favorisent la réalisation d'un résultat opérationnel ou métier. Sur AWS, vous pouvez utiliser [le gestionnaire de correctifs AWS Systems Manager](https://docs.aws.amazon.com/systems-manager/latest/userguide/systems-manager-patch.html) pour automatiser le processus d'application des correctifs sur les systèmes gérés et planifier l'activité à l'aide des [fenêtres de maintenance AWS Systems Manager](https://docs.aws.amazon.com/systems-manager/latest/userguide/systems-manager-maintenance.html). 

 **Anti-modèles courants :** 
+  On vous demande d'appliquer tous les nouveaux correctifs de sécurité dans un délai de deux heures, ce qui entraîne de multiples pannes dues à l'incompatibilité de l'application avec les correctifs. 
+  Une bibliothèque non corrigée entraîne des conséquences imprévues, car des parties inconnues y utilisent des failles pour accéder à votre charge de travail. 
+  Vous corrigez automatiquement les environnements de développement sans en informer les développeurs. Vous recevez plusieurs réclamations des développeurs indiquant que leur environnement ne fonctionne plus correctement. 
+  Vous n'avez pas corrigé le logiciel sur une instance persistante. Lorsque vous rencontrez un problème avec le logiciel et que vous contactez le fournisseur, celui-ci vous informe que la version n'est pas prise en charge et que vous devez appliquer un correctif à un niveau spécifique pour recevoir de l'aide. 
+  Un correctif récemment publié pour le logiciel de chiffrement que vous avez utilisé présente des améliorations significatives de performances. Votre système non corrigé présente des problèmes de performances qui persistent suite à l'absence de correctifs. 

 **Avantages liés au respect de cette bonne pratique :** En établissant un processus de gestion des correctifs, y compris vos critères de correctifs et la méthodologie de distribution dans vos environnements, vous serez en mesure de bénéficier de leurs avantages et de contrôler leur impact. Cela permettra l'adoption des fonctions et fonctionnalités désirées, d’éliminer les problèmes et de respecter durablement la gouvernance. Mettez en œuvre des systèmes de gestion des correctifs et d'automatisation pour réduire le niveau d'effort nécessaire au déploiement des correctifs et limiter les erreurs causées par les processus manuels. 

 **Niveau de risque exposé si cette bonne pratique n'est pas respectée :** Moyenne entreprise 

## Directives d'implémentation
<a name="implementation-guidance"></a>
+  Gestion des correctifs : appliquez des correctifs aux systèmes pour corriger les problèmes, obtenir les fonctionnalités souhaitées et rester conforme à la politique de gouvernance et aux exigences de support du fournisseur. Dans les systèmes immuables, déployez avec l'ensemble de correctifs approprié pour obtenir le résultat souhaité. Automatisez le mécanisme de gestion des correctifs afin de réduire le temps écoulé avant l'application des correctifs, de limiter les erreurs causées par les processus manuels et de réduire le niveau d'efforts nécessaire pour appliquer les correctifs. 
  +  [le gestionnaire de correctifs AWS Systems Manager](https://docs.aws.amazon.com/systems-manager/latest/userguide/systems-manager-patch.html) 

## Ressources
<a name="resources"></a>

 **Documents connexes :** 
+  [Outils pour développeurs AWS](https://aws.amazon.com/products/developer-tools/) 
+  [le gestionnaire de correctifs AWS Systems Manager](https://docs.aws.amazon.com/systems-manager/latest/userguide/systems-manager-patch.html) 

 **Vidéos connexes :** 
+  [CI/CD for Serverless Applications on AWS](https://www.youtube.com/watch?v=tEpx5VaW4WE) 
+  [Design with Ops in Mind](https://youtu.be/uh19jfW7hw4) 

   **Exemples connexes :** 
+  [Ateliers Well-Architected : inventaire et gestion des correctifs](https://wellarchitectedlabs.com/operational-excellence/100_labs/100_inventory_patch_management/) 

# OPS05-BP06 Partager les normes de conception
<a name="ops_dev_integ_share_design_stds"></a>

 Partagez les bonnes pratiques entre les équipes pour sensibiliser et maximiser les bénéfices des efforts de développement. 

 Sur AWS, l'application, le calcul, l'infrastructure, et les opérations peuvent être définis et gérés à l'aide des méthodologies de code. Cela permet une publication, un partage et une adoption simples. 

 De nombreux services et ressources AWS sont conçus pour être partagés entre les comptes, ce qui vous permet de partager des ressources créées et des connaissances entre vos équipes. Par exemple, vous pouvez partager [CodeCommit](https://docs.aws.amazon.com/codecommit/latest/userguide/cross-account.html) des référentiels, [Lambda](https://docs.aws.amazon.com/lambda/latest/dg/lambda-permissions.html) des fonctions, [des compartiments Amazon S3](https://aws.amazon.com/premiumsupport/knowledge-center/cross-account-access-s3/)et [des AMI](https://docs.aws.amazon.com/AWSEC2/latest/UserGuide/sharingamis-explicit.html) vers des comptes spécifiques. 

 Lorsque vous publiez de nouvelles ressources ou mises à jour, utilisez Amazon SNS pour publier [des notifications entre les comptes](https://docs.aws.amazon.com/lambda/latest/dg/with-sns-example.html). Les abonnés peuvent utiliser Lambda pour obtenir de nouvelles versions. 

 Si des normes partagées sont appliquées dans votre entreprise, il est essentiel que des mécanismes soient mis en place pour demander des ajouts, des modifications et des dérogations aux normes afin de soutenir les activités des équipes. Sans cette possibilité, les normes deviennent une contrainte à l'innovation. 

 **Anti-modèles courants :** 
+  Vous avez créé votre propre mécanisme d'authentification des utilisateurs, tout comme chacune des autres équipes de développement de votre organisation. Vos utilisateurs doivent conserver un ensemble distinct d'informations d'identification pour chaque partie du système auquel ils souhaitent accéder. 
+  Vous avez créé votre propre mécanisme d'authentification des utilisateurs, tout comme chacune des autres équipes de développement de votre organisation. Votre organisation reçoit une nouvelle exigence de conformité qui doit être satisfaite. Chaque équipe de développement doit désormais investir les ressources pour mettre en œuvre la nouvelle exigence. 
+  Vous avez créé votre propre configuration d'écran, comme chacune des autres équipes de développement de votre organisation. Vos utilisateurs se plaignent de la difficulté de naviguer dans les interfaces incohérentes. 

 **Avantages liés au respect de cette bonne pratique :** Utilisez des normes communes pour soutenir l'adoption des bonnes pratiques et pour maximiser les avantages des efforts de développement lorsque les normes répondent aux exigences de plusieurs applications ou organisations. 

 **Niveau de risque exposé si cette bonne pratique n'est pas respectée :** Moyenne entreprise 

## Directives d'implémentation
<a name="implementation-guidance"></a>
+  Partager les normes de conception : partagez les bonnes pratiques, normes de conception, listes de contrôle, procédures opérationnelles, instructions et exigences de gouvernance entre équipes pour réduire la complexité et optimiser les avantages résultant des efforts de développement. Veillez à mettre en place des procédures pour demander des modifications, des ajouts et des exceptions aux normes de conception, afin de soutenir l'amélioration et l'innovation en continu. Assurez-vous que les équipes sont informées du contenu publié afin qu'elles puissent tirer parti du contenu, et limiter les reprises de travail et les tâches inutiles. 
  +  [Déléguer l'accès à votre environnement AWS](https://www.youtube.com/watch?v=0zJuULHFS6A&t=849s) 
  +  [Partager un référentiel AWS CodeCommit](https://docs.aws.amazon.com/codecommit/latest/userguide/how-to-share-repository.html) 
  +  [Facilité d'autorisation des fonctions AWS Lambda](https://aws.amazon.com/blogs/compute/easy-authorization-of-aws-lambda-functions/) 
  +  [Partager une AMI avec des comptes Comptes AWS spécifiques](https://docs.aws.amazon.com/AWSEC2/latest/UserGuide/sharingamis-explicit.html) 
  +  [Accélérer le partage de modèles avec une URL de concepteur AWS CloudFormation](https://aws.amazon.com/blogs/devops/speed-template-sharing-with-an-aws-cloudformation-designer-url/) 
  +  [Utilisation d'AWS Lambda avec Amazon SNS](https://docs.aws.amazon.com/lambda/latest/dg/with-sns-example.html) 

## Ressources
<a name="resources"></a>

 **Documents connexes :** 
+  [Facilité d'autorisation des fonctions AWS Lambda](https://aws.amazon.com/blogs/compute/easy-authorization-of-aws-lambda-functions/) 
+  [Partager un référentiel AWS CodeCommit](https://docs.aws.amazon.com/codecommit/latest/userguide/how-to-share-repository.html) 
+  [Partager une AMI avec des comptes Comptes AWS spécifiques](https://docs.aws.amazon.com/AWSEC2/latest/UserGuide/sharingamis-explicit.html) 
+  [Accélérer le partage de modèles avec une URL de concepteur AWS CloudFormation](https://aws.amazon.com/blogs/devops/speed-template-sharing-with-an-aws-cloudformation-designer-url/) 
+  [Utilisation d'AWS Lambda avec Amazon SNS](https://docs.aws.amazon.com/lambda/latest/dg/with-sns-example.html) 

 **Vidéos connexes :** 
+  [Déléguer l'accès à votre environnement AWS](https://www.youtube.com/watch?v=0zJuULHFS6A&t=849s) 

# OPS05-BP07 Mettre en œuvre des pratiques visant à améliorer la qualité du code
<a name="ops_dev_integ_code_quality"></a>

 Mettez en place des pratiques pour améliorer la qualité du code et limiter les failles. Parmi les exemples possibles, citons le développement basé sur les tests, les révisions de code et l'adoption de normes. 

 Sur AWS, vous pouvez intégrer des services comme [Amazon CodeGuru](https://docs.aws.amazon.com/codeguru/latest/reviewer-ug/welcome.html) à votre pipeline pour identifier automatiquement [les problèmes potentiels de code et de sécurité](https://docs.aws.amazon.com/codeguru/latest/reviewer-ug/how-codeguru-reviewer-works.html) à l'aide de l'analyse de programme et de machine learning. CodeGuru fournit des recommandations sur la manière de mettre en œuvre les bonnes pratiques AWS pour résoudre ces problèmes. 

 **Anti-modèles courants :** 
+  Pour pouvoir tester votre fonctionnalité plus tôt, vous avez décidé de ne pas intégrer votre bibliothèque standard d'assainissement des entrées. Après avoir effectué les tests, vous validez votre code en oubliant d'effectuer l'incorporation complète de la bibliothèque. 
+  Vous n'avez qu'une expérience minimale de l'ensemble de données que vous traitez et vous ne savez pas qu'il peut exister une série de cas limites dans votre ensemble de données. Ces cas limites ne sont pas compatibles avec le code que vous avez implémenté. 

 **Avantages liés au respect de cette bonne pratique :** En adoptant des pratiques visant à améliorer la qualité du code, vous contribuez à minimiser les problèmes introduits dans la production. 

 **Niveau de risque exposé si cette bonne pratique n'est pas respectée :** Moyenne entreprise 

## Directives d'implémentation
<a name="implementation-guidance"></a>
+  Mettre en œuvre des pratiques pour améliorer la qualité du code : mettez en place des pratiques pour améliorer la qualité du code afin de limiter les failles et le risque qu'elles soient déployées. Par exemple, le développement orienté test, la programmation en binôme, les révisions du code et l'adoption de normes. 
  +  [Amazon CodeGuru](https://docs.aws.amazon.com/codeguru/latest/reviewer-ug/welcome.html) 

## Ressources
<a name="resources"></a>

 **Documents connexes :** 
+  [Amazon CodeGuru](https://docs.aws.amazon.com/codeguru/latest/reviewer-ug/welcome.html) 

# OPS05-BP08 Utiliser plusieurs environnements
<a name="ops_dev_integ_multi_env"></a>

 Utilisez plusieurs environnements pour expérimenter, développer et tester votre charge de travail. Utilisez des niveaux de contrôle croissants lorsque les environnements approchent de la production pour vous assurer que votre charge de travail fonctionnera correctement une fois déployée. 

 **Anti-modèles courants :** 
+  Vous effectuez un développement dans un environnement de développement partagé et un autre développeur remplace vos modifications de code. 
+  Les contrôles de sécurité restrictifs sur votre environnement de développement partagé vous empêchent d'expérimenter de nouveaux services et fonctionnalités. 
+  Vous effectuez des tests de charge sur vos systèmes de production et provoquez une panne pour vos utilisateurs. 
+  Une erreur critique entraînant une perte de données s'est produite en production. Dans votre environnement de production, vous essayez de recréer les conditions qui ont conduit à la perte de données afin de pouvoir identifier comment elle s'est produite et empêcher qu'elle ne se reproduise. Pour éviter toute perte de données supplémentaire pendant les tests, vous devez rendre l'application indisponible aux utilisateurs. 
+  Vous explorez un service multi-locataire et n'êtes pas en mesure de répondre à la demande d'un client pour un environnement dédié. 
+  Il est possible que vous ne procédiez pas toujours aux tests, mais lorsque vous le faites, vous le faites en production. 
+  Vous pensez que la simplicité d'un environnement unique l'emporte sur la portée de l'impact des modifications au sein de l'environnement. 

 **Avantages liés au respect de cette bonne pratique :** En déployant plusieurs environnements, vous pouvez prendre en charge plusieurs environnements de développement, de test et de production simultanément sans créer de conflits entre les développeurs ou les communautés d'utilisateurs. 

 **Niveau de risque exposé si cette bonne pratique n'est pas respectée :** Moyenne entreprise 

## Directives d'implémentation
<a name="implementation-guidance"></a>
+  Utiliser plusieurs environnements : fournissez aux développeurs des environnements de test avec des contrôles réduits au minimum pour permettre l'expérimentation. Fournissez des environnements de développement individuels pour permettre le travail en parallèle, ce qui augmente l'agilité du développement. Mettez en œuvre davantage de contrôles rigoureux dans les environnements proches de la production pour offrir aux développeurs la liberté d'innover. Utilisez l'infrastructure en tant que code et les systèmes de gestion de la configuration pour déployer des environnements configurés de manière cohérente par rapport aux contrôles de production pour veiller au bon fonctionnement des systèmes lorsqu'ils sont déployés. Lorsque les environnements ne sont pas en cours d'utilisation, désactivez-les pour éviter les coûts associés à des ressources inutilisées (par exemple, les systèmes de développement en soirée et les week-ends). Déployez des environnements équivalents à la production lors des tests de charge pour obtenir des résultats valides. 
  +  [Qu'est-ce qu'AWS CloudFormation ?](https://docs.aws.amazon.com/AWSCloudFormation/latest/UserGuide/Welcome.html) 
  +  [Comment arrêter et démarrer des instances Amazon EC2 à des intervalles réguliers avec AWS Lambda ?](https://aws.amazon.com/premiumsupport/knowledge-center/start-stop-lambda-cloudwatch/) 

## Ressources
<a name="resources"></a>

 **Documents connexes :** 
+  [Comment arrêter et démarrer des instances Amazon EC2 à des intervalles réguliers avec AWS Lambda ?](https://aws.amazon.com/premiumsupport/knowledge-center/start-stop-lambda-cloudwatch/) 
+  [Qu'est-ce qu'AWS CloudFormation ?](https://docs.aws.amazon.com/AWSCloudFormation/latest/UserGuide/Welcome.html) 

# OPS05-BP09 Effectuer des modifications fréquentes, légères et réversibles
<a name="ops_dev_integ_freq_sm_rev_chg"></a>

 Les modifications fréquentes, légères et réversibles limitent la portée et l'impact d'une modification. Cela facilite la résolution des problèmes, accélère les corrections et offre la possibilité d’annuler une modification. 

 **Anti-modèles courants :** 
+  Vous déployez une nouvelle version de votre application tous les trimestres. 
+  Vous apportez fréquemment des modifications à votre schéma de base de données. 
+  Vous effectuez des mises à jour manuelles sur place, en remplaçant les installations et configurations existantes. 

 **Avantages liés au respect de cette bonne pratique :** Vous reconnaissez plus rapidement les avantages des efforts de développement en déployant fréquemment de petites modifications. Lorsque les changements sont minimes, il est beaucoup plus facile d'identifier s'ils ont des conséquences inattendues. Lorsque les modifications sont réversibles, les risques liés à leur mise en œuvre sont minimes, car la récupération est simplifiée. 

 **Niveau de risque exposé si cette bonne pratique n'est pas respectée :** Faible 

## Directives d'implémentation
<a name="implementation-guidance"></a>
+  Effectuer des modifications fréquentes, légères et réversibles : les modifications fréquentes, petites et réversibles réduisent la portée et l'impact d'un changement. Cela facilite la résolution des problèmes, accélère les corrections et offre la possibilité d’annuler une modification. Cela augmente également la vitesse à laquelle vous pouvez apporter de la valeur à votre entreprise. 

# OPS05-BP10 Automatiser complètement l'intégration et le déploiement
<a name="ops_dev_integ_auto_integ_deploy"></a>

 Automatisez la création, le déploiement et le test de la charge de travail. Cela permet de réduire les erreurs découlant des processus manuels, ainsi que les efforts nécessaires au déploiement des modifications. 

 Appliquez des métadonnées à l'aide des [balises de ressources](https://docs.aws.amazon.com/general/latest/gr/aws_tagging.html) et [Groupes de ressources AWS](https://docs.aws.amazon.com/ARG/latest/APIReference/Welcome.html) en respectant une stratégie de balisage [cohérente](https://aws.amazon.com/answers/account-management/aws-tagging-strategies/) pour activer l'identification de vos ressources. Balisez vos ressources pour l’organisation, la comptabilité analytique, les contrôles des accès et le ciblage de l'exécution des activités des opérations automatisées. 

 **Anti-modèles courants :** 
+  Vendredi, vous avez fini de créer le nouveau code de votre branche de fonctionnalité. Lundi, après avoir exécuté vos scripts de test de la qualité du code et chacun de vos scripts de tests unitaires, vous vérifierez votre code pour la prochaine version prévue. 
+  Vous êtes chargé de coder un correctif pour un problème critique affectant un grand nombre de clients en production. Après avoir testé le correctif, vous validez votre code et envoyez un e-mail à l'équipe de gestion des modifications pour demander l'autorisation de le déployer en production. 

 **Avantages liés au respect de cette bonne pratique :** En mettant en œuvre des systèmes automatisés de gestion de la création et du déploiement, vous réduisez les erreurs causées par les processus manuels et diminuez l'effort de déploiement des modifications, ce qui permet aux membres de votre équipe de se concentrer sur la création de valeur ajoutée. 

 **Niveau de risque exposé si cette bonne pratique n'est pas respectée :** Faible 

## Directives d'implémentation
<a name="implementation-guidance"></a>
+  Utiliser des systèmes de gestion du développement et du déploiement : servez-vous de systèmes de gestion du développement et du déploiement afin de suivre et de mettre en œuvre les modifications, de réduire les erreurs causées par les processus manuels et de réduire le niveau d'efforts. Automatisez entièrement le pipeline d'intégration et de déploiement à partir du code d'enregistrement et par le biais du développement, des tests, du déploiement et de la validation. Cela permet de réduire les délais, d'augmenter la fréquence des changements et de diminuer le niveau d'effort. 
  +  [Qu'est-ce qu'AWS CodeBuild ?](https://docs.aws.amazon.com/codebuild/latest/userguide/welcome.html) 
  +  [Bonnes pratiques d'intégration continue pour le développement de logiciels](https://www.youtube.com/watch?v=GEPJ7Lo346A) 
  +  [Slalom: CI/CD for serverless applications on AWS](https://www.youtube.com/watch?v=tEpx5VaW4WE) 
  +  [Introduction to AWS CodeDeploy - automated software deployment with Amazon Web Services](https://www.youtube.com/watch?v=Wx-ain8UryM) 
  +  [Qu'est-ce qu'AWS CodeDeploy ?](https://docs.aws.amazon.com/codedeploy/latest/userguide/welcome.html) 

## Ressources
<a name="resources"></a>

 **Documents connexes :** 
+  [Qu'est-ce qu'AWS CodeBuild ?](https://docs.aws.amazon.com/codebuild/latest/userguide/welcome.html) 
+  [Qu'est-ce qu'AWS CodeDeploy ?](https://docs.aws.amazon.com/codedeploy/latest/userguide/welcome.html) 

 **Vidéos connexes :** 
+  [Bonnes pratiques d'intégration continue pour le développement de logiciels](https://www.youtube.com/watch?v=GEPJ7Lo346A) 
+  [Introduction to AWS CodeDeploy - automated software deployment with Amazon Web Services](https://www.youtube.com/watch?v=Wx-ain8UryM) 
+  [Slalom: CI/CD for serverless applications on AWS](https://www.youtube.com/watch?v=tEpx5VaW4WE) 

# OPS 6  Comment réduire les risques liés au déploiement ?
<a name="w2aac19b5b7b9"></a>

 Adoptez des approches qui fournissent un retour d'information rapide sur la qualité et permettent une reprise rapide à la suite de changements qui n'offrent pas les résultats escomptés. L'utilisation de ces pratiques diminue l'impact des problèmes découlant du déploiement des modifications. 

**Topics**
+ [OPS06-BP01 Planifier les modifications infructueuses](ops_mit_deploy_risks_plan_for_unsucessful_changes.md)
+ [OPS06-BP02 Tester et valider les modifications](ops_mit_deploy_risks_test_val_chg.md)
+ [OPS06-BP03 Utiliser des systèmes de gestion du déploiement](ops_mit_deploy_risks_deploy_mgmt_sys.md)
+ [OPS06-BP04 Effectuer des tests avec des déploiements limités](ops_mit_deploy_risks_test_limited_deploy.md)
+ [OPS06-BP05 Effectuer un déploiement avec des environnements parallèles](ops_mit_deploy_risks_deploy_to_parallel_env.md)
+ [OPS06-BP06 Déployer des modifications fréquentes, minimes, réversibles](ops_mit_deploy_risks_freq_sm_rev_chg.md)
+ [OPS06-BP07 Automatiser complètement l'intégration et le déploiement](ops_mit_deploy_risks_auto_integ_deploy.md)
+ [OPS06-BP08 Automatiser les tests et la restauration](ops_mit_deploy_risks_auto_testing_and_rollback.md)

# OPS06-BP01 Planifier les modifications infructueuses
<a name="ops_mit_deploy_risks_plan_for_unsucessful_changes"></a>

 Planifiez de revenir à un état antérieur connu pour être bon, ou corrigez l'environnement de production si une modification n'a pas le résultat escompté. Cette préparation accélère la reprise grâce à des réponses plus rapides. 

 **Anti-modèles courants :** 
+  Vous avez effectué un déploiement et votre application est devenue instable, mais il semble qu’il y ait des utilisateurs actifs sur le système. Vous devez décider entre annuler la modification et avoir un impact sur les utilisateurs actifs et attendre pour annuler la modification en sachant que les utilisateurs peuvent être impactés de toute façon. 
+  Après avoir modifié la routine, vos nouveaux environnements sont accessibles, mais l'un de vos sous-réseaux est devenu inaccessible. Vous devez décider de tout annuler ou d'essayer de réparer le sous-réseau inaccessible. Pendant cette période de détermination, le sous-réseau reste inaccessible. 

 **Avantages liés au respect de cette bonne pratique :** La mise en place d'une stratégie réduit le temps moyen de récupération (MTTR) après des modifications infructueuses, limitant ainsi l'impact sur les utilisateurs finaux. 

 **Niveau de risque exposé si cette bonne pratique n'est pas respectée :** Débit 

## Directives d'implémentation
<a name="implementation-guidance"></a>
+  Planifier les modifications infructueuses : planifiez de revenir à un état antérieur connu pour être bon (c'est-à-dire, annuler la modification) ou procédez à une correction dans l'environnement de production (c'est-à-dire, déployer davantage la modification) si une modification n'a pas le résultat escompté. Lorsque vous identifiez des modifications que vous ne pouvez pas annuler si elles échouent, effectuez les vérifications préalables avant de valider les modifications. 

# OPS06-BP02 Tester et valider les modifications
<a name="ops_mit_deploy_risks_test_val_chg"></a>

 Testez les modifications et validez les résultats à toutes les étapes du cycle de vie afin de vérifier les nouvelles fonctionnalités et de réduire les risques et l'impact des déploiements ayant échoué. 

 Sur AWS, vous pouvez créer des environnements parallèles temporaires, ce qui diminue les risques, les efforts et les frais liés à l'expérimentation et aux tests. Automatisez le déploiement de ces environnements à l'aide de [AWS CloudFormation](https://aws.amazon.com/cloudformation/) pour garantir leur mise en place cohérente. 

 **Anti-modèles courants :** 
+  Vous déployez une nouvelle superbe fonctionnalité dans votre application. Elle ne fonctionne pas. Vous ne savez pas. 
+  Vous mettez à jour vos certificats. Vous installez accidentellement les certificats sur les composants incorrects. Vous ne savez pas. 

 **Avantages liés au respect de cette bonne pratique :** En testant et validant les modifications à la suite du déploiement, vous êtes en mesure d'identifier rapidement les problèmes, ce qui vous permet d'atténuer l'impact sur vos clients. 

 **Niveau de risque exposé si cette bonne pratique n'est pas respectée :** Débit 

## Directives d'implémentation
<a name="implementation-guidance"></a>
+  Tester et valider les modifications : testez les changements et validez les résultats à tous les stades du cycle de vie (par exemple, développement, test et production), afin de valider les nouvelles fonctionnalités et de réduire les risques et l'impact des déploiements qui échouent. 
  +  [AWS Cloud9](https://aws.amazon.com/cloud9/) 
  +  [Qu'est-ce qu'AWS Cloud9 ?](https://docs.aws.amazon.com/cloud9/latest/user-guide/welcome.html) 
  +  [Comment tester et déboguer AWS CodeDeploy localement avant d'expédier votre code](https://aws.amazon.com/blogs/devops/how-to-test-and-debug-aws-codedeploy-locally-before-you-ship-your-code/) 

## Ressources
<a name="resources"></a>

 **Documents connexes :** 
+  [AWS Cloud9](https://aws.amazon.com/cloud9/) 
+  [Outils pour développeurs AWS](https://aws.amazon.com/products/developer-tools/) 
+  [Comment tester et déboguer AWS CodeDeploy localement avant d'expédier votre code](https://aws.amazon.com/blogs/devops/how-to-test-and-debug-aws-codedeploy-locally-before-you-ship-your-code/) 
+  [Qu'est-ce qu'AWS Cloud9 ?](https://docs.aws.amazon.com/cloud9/latest/user-guide/welcome.html) 

# OPS06-BP03 Utiliser des systèmes de gestion du déploiement
<a name="ops_mit_deploy_risks_deploy_mgmt_sys"></a>

 Utilisez les systèmes de gestion de déploiement pour suivre et mettre en œuvre des modifications. Cela permet de réduire les erreurs découlant des processus manuels, ainsi que les efforts nécessaires au déploiement des modifications. 

 Dans AWS, vous pouvez créer des pipelines d'intégration continue/de déploiement continu (CI/CD) à l'aide de services tels que les [Outils pour développeurs AWS](https://aws.amazon.com/products/developer-tools/) (par exemple, AWS CodeCommit, [AWS CodeBuild](https://aws.amazon.com/codebuild/), [AWS CodePipeline](https://aws.amazon.com/codepipeline/), [AWS CodeDeploy](https://aws.amazon.com/codedeploy/)et [AWS CodeStar](https://aws.amazon.com/codestar/)). 

 **Anti-modèles courants :** 
+  Vous déployez manuellement des mises à jour sur les serveurs d'applications de votre flotte, et un certain nombre de serveurs ne répondent plus en raison d'erreurs de mise à jour. 
+  Vous déployez manuellement sur votre flotte de serveurs d'applications pendant plusieurs heures. L'incohérence des versions pendant la modification entraîne des comportements inattendus. 

 **Avantages liés au respect de cette bonne pratique :** L'adoption de systèmes de gestion du déploiement réduit le niveau d'effort nécessaire pour déployer les modifications, ainsi que la fréquence des erreurs causées par les procédures manuelles. 

 **Niveau de risque exposé si cette bonne pratique n'est pas respectée :** Moyenne entreprise 

## Directives d'implémentation
<a name="implementation-guidance"></a>
+  Utiliser des systèmes de gestion du déploiement : utilisez des systèmes de gestion du déploiement pour suivre et mettre en œuvre les modifications. Cette démarche permet de réduire les erreurs causées par les processus manuels, mais aussi réduire le niveau d'efforts pour déployer des modifications. Automatisez le pipeline d'intégration et de déploiement à partir du code d'enregistrement et par le biais des tests, du déploiement et de la validation. Cela permet de réduire les délais, d'augmenter la fréquence des changements et de diminuer davantage le niveau d'effort. 
  +  [Introduction to AWS CodeDeploy - automated software deployment with Amazon Web Services](https://www.youtube.com/watch?v=Wx-ain8UryM) 
  +  [Qu'est-ce qu'AWS CodeDeploy ?](https://docs.aws.amazon.com/codedeploy/latest/userguide/welcome.html) 
  +  [Qu'est-ce qu'AWS Elastic Beanstalk ?](https://docs.aws.amazon.com/elasticbeanstalk/latest/dg/Welcome.html) 
  +  [Qu'est-ce qu'Amazon API Gateway ?](https://docs.aws.amazon.com/apigateway/latest/developerguide/welcome.html) 

## Ressources
<a name="resources"></a>

 **Documents connexes :** 
+  [Guide de l'utilisateur AWS CodeDeploy](https://docs.aws.amazon.com/codedeploy/latest/userguide/welcome.html) 
+  [Outils pour développeurs AWS](https://aws.amazon.com/products/developer-tools/) 
+  [Essayer un exemple de déploiement bleu/vert dans AWS CodeDeploy](https://docs.aws.amazon.com/codedeploy/latest/userguide/applications-create-blue-green.html) 
+  [Qu'est-ce qu'AWS CodeDeploy ?](https://docs.aws.amazon.com/codedeploy/latest/userguide/welcome.html) 
+  [Qu'est-ce qu'AWS Elastic Beanstalk ?](https://docs.aws.amazon.com/elasticbeanstalk/latest/dg/Welcome.html) 
+  [Qu'est-ce qu'Amazon API Gateway ?](https://docs.aws.amazon.com/apigateway/latest/developerguide/welcome.html) 

 **Vidéos connexes :** 
+  [Deep Dive on Advanced Continuous Delivery Techniques Using AWS](https://www.youtube.com/watch?v=Lrrgd0Kemhw) 
+  [Introduction to AWS CodeDeploy - automated software deployment with Amazon Web Services](https://www.youtube.com/watch?v=Wx-ain8UryM) 

# OPS06-BP04 Effectuer des tests avec des déploiements limités
<a name="ops_mit_deploy_risks_test_limited_deploy"></a>

 Faites le test avec des déploiements limités et avec des systèmes existants pour confirmer les résultats souhaités avant le déploiement à grande échelle. Par exemple, utilisez les tests Canary de déploiement ou des déploiements sur un seul hôte. 

 **Anti-modèles courants :** 
+  Vous déployez une modification infructueuse dans l'ensemble de l’environnement de production en une seule fois. Vous ne savez pas. 

 **Avantages liés au respect de cette bonne pratique :** En testant et en validant les modifications après un déploiement limité, vous êtes en mesure d'identifier rapidement les problèmes avec un impact minimal sur vos clients, ce qui vous permet d'atténuer davantage l'impact sur vos clients. 

 **Niveau de risque exposé si cette bonne pratique n'est pas respectée :** Moyenne entreprise 

## Directives d'implémentation
<a name="implementation-guidance"></a>
+  Effectuer des tests avec des déploiements limités : effectuez des tests avec des déploiements limités et avec des systèmes existants pour confirmer les résultats attendus avant le déploiement à grande échelle. Par exemple, utilisez les tests Canary de déploiement ou des déploiements sur un seul hôte. 
  +  [Guide de l'utilisateur AWS CodeDeploy](https://docs.aws.amazon.com/codedeploy/latest/userguide/welcome.html) 
  +  [Déploiements bleu/vert avec AWS Elastic Beanstalk](https://docs.aws.amazon.com/elasticbeanstalk/latest/dg/using-features.CNAMESwap.html) 
  +  [Configurer un déploiement de version API Gateway Canary](https://docs.aws.amazon.com/apigateway/latest/developerguide/canary-release.html) 
  +  [Essayer un exemple de déploiement bleu/vert dans AWS CodeDeploy](https://docs.aws.amazon.com/codedeploy/latest/userguide/applications-create-blue-green.html) 
  +  [Utilisation des configurations de déploiement AWS CodeDeploy](https://docs.aws.amazon.com/codedeploy/latest/userguide/deployment-configurations.html) 

## Ressources
<a name="resources"></a>

 **Documents connexes :** 
+  [Guide de l'utilisateur AWS CodeDeploy](https://docs.aws.amazon.com/codedeploy/latest/userguide/welcome.html) 
+  [Déploiements bleu/vert avec AWS Elastic Beanstalk](https://docs.aws.amazon.com/elasticbeanstalk/latest/dg/using-features.CNAMESwap.html) 
+  [Configurer un déploiement de version API Gateway Canary](https://docs.aws.amazon.com/apigateway/latest/developerguide/canary-release.html) 
+  [Essayer un exemple de déploiement bleu/vert dans AWS CodeDeploy](https://docs.aws.amazon.com/codedeploy/latest/userguide/applications-create-blue-green.html) 
+  [Utilisation des configurations de déploiement AWS CodeDeploy](https://docs.aws.amazon.com/codedeploy/latest/userguide/deployment-configurations.html) 

# OPS06-BP05 Effectuer un déploiement avec des environnements parallèles
<a name="ops_mit_deploy_risks_deploy_to_parallel_env"></a>

 Mettez en œuvre les modifications dans des environnements parallèles, puis passez au nouvel environnement. Conservez l'ancien environnement jusqu'à la confirmation de la réussite du déploiement. Procéder de la sorte réduit les durées de récupération en activant la restauration à l'ancien environnement. 

 **Anti-modèles courants :** 
+  Vous effectuez un déploiement mutable en modifiant vos systèmes existants. Après avoir découvert que la modification n'a pas abouti, vous êtes obligé de modifier à nouveau les systèmes pour restaurer l'ancienne version, ce qui prolonge votre délai de récupération. 
+  Pendant une fenêtre de maintenance, vous désactivez l'ancien environnement, puis vous commencez à créer votre nouvel environnement. Plusieurs heures après le début de la procédure, vous découvrez des problèmes irrémédiables liés au déploiement. Bien qu'extrêmement fatigué, vous êtes obligé de retrouver les procédures de déploiement précédentes et de commencer à recréer l'ancien environnement. 

 **Avantages liés au respect de cette bonne pratique :** En utilisant des environnements parallèles, vous pouvez pré-déployer le nouvel environnement et y passer lorsque vous le souhaitez. Si le nouvel environnement ne réussit pas, vous pouvez vous rétablir rapidement les opérations en restaurant votre environnement d'origine. 

 **Niveau de risque exposé si cette bonne pratique n'est pas respectée :** Moyenne entreprise 

## Directives d'implémentation
<a name="implementation-guidance"></a>
+  Effectuer un déploiement avec des environnements parallèles : implémentez les modifications dans des environnements parallèles, puis migrez vers le nouvel environnement. Conservez l'ancien environnement jusqu'à la confirmation de la réussite du déploiement. Cela réduit le temps de récupération en permettant la restauration de l'ancien environnement. Par exemple, utilisez des infrastructures immuables avec des déploiements de type bleu/vert. 
  +  [Utilisation des configurations de déploiement AWS CodeDeploy](https://docs.aws.amazon.com/codedeploy/latest/userguide/deployment-configurations.html) 
  +  [Déploiements bleu/vert avec AWS Elastic Beanstalk](https://docs.aws.amazon.com/elasticbeanstalk/latest/dg/using-features.CNAMESwap.html) 
  +  [Configurer un déploiement de version API Gateway Canary](https://docs.aws.amazon.com/apigateway/latest/developerguide/canary-release.html) 
  +  [Essayer un exemple de déploiement bleu/vert dans AWS CodeDeploy](https://docs.aws.amazon.com/codedeploy/latest/userguide/applications-create-blue-green.html) 

## Ressources
<a name="resources"></a>

 **Documents connexes :** 
+  [Guide de l'utilisateur AWS CodeDeploy](https://docs.aws.amazon.com/codedeploy/latest/userguide/welcome.html) 
+  [Déploiements bleu/vert avec AWS Elastic Beanstalk](https://docs.aws.amazon.com/elasticbeanstalk/latest/dg/using-features.CNAMESwap.html) 
+  [Configurer un déploiement de version API Gateway Canary](https://docs.aws.amazon.com/apigateway/latest/developerguide/canary-release.html) 
+  [Essayer un exemple de déploiement bleu/vert dans AWS CodeDeploy](https://docs.aws.amazon.com/codedeploy/latest/userguide/applications-create-blue-green.html) 
+  [Utilisation des configurations de déploiement AWS CodeDeploy](https://docs.aws.amazon.com/codedeploy/latest/userguide/deployment-configurations.html) 

 **Vidéos connexes :** 
+  [Deep Dive on Advanced Continuous Delivery Techniques Using AWS](https://www.youtube.com/watch?v=Lrrgd0Kemhw) 

# OPS06-BP06 Déployer des modifications fréquentes, minimes, réversibles
<a name="ops_mit_deploy_risks_freq_sm_rev_chg"></a>

 Utilisez les modifications fréquentes, légères et réversibles pour réduire la portée d'une modification. Ainsi, vous facilitez la résolution des problèmes et accélérez les corrections avec la possibilité d’annuler une modification. 

 **Anti-modèles courants :** 
+  Vous déployez une nouvelle version de votre application tous les trimestres. 
+  Vous apportez fréquemment des modifications à votre schéma de base de données. 
+  Vous effectuez des mises à jour manuelles sur place, en remplaçant les installations et configurations existantes. 

 **Avantages liés au respect de cette bonne pratique :** Vous reconnaissez plus rapidement les avantages des efforts de développement en déployant fréquemment de petites modifications. Lorsque les changements sont minimes, il est beaucoup plus facile d'identifier s'ils ont des conséquences inattendues. Lorsque les changements sont réversibles, les risques de mise en œuvre d’une modification sont minimes, car la récupération est simplifiée. 

 **Niveau de risque exposé si cette bonne pratique n'est pas respectée :** Faible 

## Directives d'implémentation
<a name="implementation-guidance"></a>
+  Déployer des modifications fréquentes, minimes, réversibles : des modifications fréquentes, petites et réversibles permettent de réduire la portée d'un changement. Ainsi, vous facilitez la résolution des problèmes et accélérez les corrections avec la possibilité d’annuler une modification. 

# OPS06-BP07 Automatiser complètement l'intégration et le déploiement
<a name="ops_mit_deploy_risks_auto_integ_deploy"></a>

 Automatisez la création, le déploiement et le test de la charge de travail. Cela permet de réduire les erreurs causées par les processus manuels et de diminuer l'effort de déploiement des modifications. 

 Appliquez des métadonnées à l'aide des [balises de ressources](https://docs.aws.amazon.com/general/latest/gr/aws_tagging.html) et [Groupes de ressources AWS](https://docs.aws.amazon.com/ARG/latest/APIReference/Welcome.html) en respectant une stratégie de balisage [cohérente](https://aws.amazon.com/answers/account-management/aws-tagging-strategies/) pour activer l'identification de vos ressources. Balisez vos ressources pour l’organisation, la comptabilité analytique, les contrôles des accès et le ciblage de l'exécution des activités des opérations automatisées. 

 **Anti-modèles courants :** 
+  Vendredi, vous avez fini de créer le code de votre branche de fonctionnalité. Lundi, après avoir exécuté vos scripts de test de la qualité du code et chacun de vos scripts de tests unitaires, vous vérifierez votre code pour la prochaine version prévue. 
+  Vous êtes chargé de coder un correctif pour un problème critique affectant un grand nombre de clients en production. Après avoir testé le correctif, vous validez votre code et envoyez un e-mail à l'équipe de gestion des modifications pour demander l'autorisation de le déployer en production. 

 **Avantages liés au respect de cette bonne pratique :** En mettant en œuvre des systèmes automatisés de gestion de la création et du déploiement, vous réduisez les erreurs causées par les processus manuels et diminuez l'effort de déploiement des changements, ce qui permet aux membres de votre équipe de se concentrer sur la création de valeur ajoutée. 

 **Niveau de risque exposé si cette bonne pratique n'est pas respectée :** Faible 

## Directives d'implémentation
<a name="implementation-guidance"></a>
+  Utiliser des systèmes de gestion du développement et du déploiement : servez-vous de systèmes de gestion du développement et du déploiement afin de suivre et de mettre en œuvre les modifications, de réduire les erreurs causées par les processus manuels et de réduire le niveau d'efforts. Automatisez entièrement le pipeline d'intégration et de déploiement à partir du code d'enregistrement et par le biais du développement, des tests, du déploiement et de la validation. Cela permet de réduire les délais, d'augmenter la fréquence des changements et de diminuer le niveau d'effort. 
  +  [Qu'est-ce qu'AWS CodeBuild ?](https://docs.aws.amazon.com/codebuild/latest/userguide/welcome.html) 
  +  [Bonnes pratiques d'intégration continue pour le développement de logiciels](https://www.youtube.com/watch?v=GEPJ7Lo346A) 
  +  [Slalom: CI/CD for serverless applications on AWS](https://www.youtube.com/watch?v=tEpx5VaW4WE) 
  +  [Introduction to AWS CodeDeploy - automated software deployment with Amazon Web Services](https://www.youtube.com/watch?v=Wx-ain8UryM) 
  +  [Qu'est-ce qu'AWS CodeDeploy ?](https://docs.aws.amazon.com/codedeploy/latest/userguide/welcome.html) 
  +  [Deep Dive on Advanced Continuous Delivery Techniques Using AWS](https://www.youtube.com/watch?v=Lrrgd0Kemhw) 

## Ressources
<a name="resources"></a>

 **Documents connexes :** 
+  [Essayer un exemple de déploiement bleu/vert dans AWS CodeDeploy](https://docs.aws.amazon.com/codedeploy/latest/userguide/applications-create-blue-green.html) 
+  [Qu'est-ce qu'AWS CodeBuild ?](https://docs.aws.amazon.com/codebuild/latest/userguide/welcome.html) 
+  [Qu'est-ce qu'AWS CodeDeploy ?](https://docs.aws.amazon.com/codedeploy/latest/userguide/welcome.html) 

 **Vidéos connexes :** 
+  [Bonnes pratiques d'intégration continue pour le développement de logiciels](https://www.youtube.com/watch?v=GEPJ7Lo346A) 
+  [Deep Dive on Advanced Continuous Delivery Techniques Using AWS](https://www.youtube.com/watch?v=Lrrgd0Kemhw) 
+  [Introduction to AWS CodeDeploy - automated software deployment with Amazon Web Services](https://www.youtube.com/watch?v=Wx-ain8UryM) 
+  [Slalom: CI/CD for serverless applications on AWS](https://www.youtube.com/watch?v=tEpx5VaW4WE) 

# OPS06-BP08 Automatiser les tests et la restauration
<a name="ops_mit_deploy_risks_auto_testing_and_rollback"></a>

 Automatisez le test des environnements déployés pour confirmer les résultats souhaités. Automatisez la restauration du dernier état connu de bonne qualité lorsque les résultats ne sont pas atteints, afin de minimiser les temps de récupération et de réduire les erreurs causées par les processus manuels. 

 **Anti-modèles courants :** 
+  Vous déployez les modifications apportées à votre charge de travail. Une fois la modification terminée, vous commencez les tests de post-déploiement. Une fois qu'elles sont terminées, vous vous rendez compte que votre charge de travail est inutilisable et que les clients sont déconnectés. Vous commencez les opérations pour restaurer la version précédente. Après un délai prolongé au cours duquel vous avez détecté le problème, le délai de reprise est allongé par votre redéploiement manuel. 

 **Avantages liés au respect de cette bonne pratique :** En testant et en validant les modifications après le déploiement, vous êtes en mesure d'identifier les problèmes immédiatement. En restaurant automatiquement la version précédente, vous réduisez l'impact sur vos clients. 

 **Niveau de risque exposé si cette bonne pratique n'est pas respectée :** Faible 

## Directives d'implémentation
<a name="implementation-guidance"></a>
+  Automatiser les tests et la restauration : automatisez les tests des environnements déployés pour confirmer les résultats souhaités. Automatisez la restauration du dernier état connu de bonne qualité lorsque les résultats ne sont pas atteints, afin de minimiser les temps de récupération et de réduire les erreurs causées par les processus manuels. Par exemple, effectuez des transactions utilisateur synthétiques détaillées après le déploiement, vérifiez les résultats et annulez en cas d'échec. 
  +  [Redéployer et annuler un déploiement avec AWS CodeDeploy](https://docs.aws.amazon.com/codedeploy/latest/userguide/deployments-rollback-and-redeploy.html) 

## Ressources
<a name="resources"></a>

 **Documents connexes :** 
+  [Redéployer et annuler un déploiement avec AWS CodeDeploy](https://docs.aws.amazon.com/codedeploy/latest/userguide/deployments-rollback-and-redeploy.html) 

# OPS 7  Comment savoir si vous êtes prêt à gérer une charge de travail ?
<a name="w2aac19b5b7c11"></a>

 Évaluez la disponibilité opérationnelle de votre charge de travail, des processus et des procédures, ainsi que le personnel pour comprendre les risques opérationnels liés à votre charge de travail. 

**Topics**
+ [OPS07-BP01 Garantir les compétences du personnel](ops_ready_to_support_personnel_capability.md)
+ [OPS07-BP02 Assurer un examen cohérent de l'état de préparation opérationnelle](ops_ready_to_support_const_orr.md)
+ [OPS07-BP03 Utiliser des runbooks pour effectuer des procédures](ops_ready_to_support_use_runbooks.md)
+ [OPS07-BP04 Utiliser des playbooks pour analyser les problèmes](ops_ready_to_support_use_playbooks.md)
+ [OPS07-BP05 Prendre des décisions avisées pour déployer des systèmes et des modifications](ops_ready_to_support_informed_deploy_decisions.md)

# OPS07-BP01 Garantir les compétences du personnel
<a name="ops_ready_to_support_personnel_capability"></a>

 Mettez en place un mécanisme permettant de vérifier que vous disposez du personnel formé pour répondre aux besoins opérationnels. Formez le personnel et ajustez ses compétences pour maintenir un support efficace. 

 Vous devez disposer de suffisamment de membres d'équipe pour couvrir toutes les activités (y compris des employés d'astreinte). Assurez-vous que vos équipes disposent des compétences nécessaires pour valider les formations relatives à votre charge de travail, vos outils d'exploitation et AWS. 

 AWS fournit des ressources, y compris le [Centre de ressources de démarrage AWS](https://aws.amazon.com/getting-started/), [les blogs AWS](https://aws.amazon.com/blogs/), [les conférences techniques en ligne AWS](https://aws.amazon.com/getting-started/), [les événements et webinaires AWS](https://aws.amazon.com/events/)et les [Ateliers AWS Well-Architected](https://wellarchitectedlabs.com/)AWS, qui fournissent des conseils, des exemples et des démonstrations détaillées pour former vos équipes. En outre, [AWS Training and Certification](https://aws.amazon.com/training/) offre une formation gratuite par le biais de cours en ligne d'auto-formation sur les principes fondamentaux d'AWS. Vous pouvez également vous inscrire à une formation dirigée par un formateur afin de soutenir le développement des compétences AWS de vos équipes. 

 **Anti-modèles courants :** 
+  Déploiement d’une charge de travail sans que les membres de l'équipe soient qualifiés pour prendre la plate-forme et les services utilisés. 
+  Déploiement d'une charge de travail sans membres de l'équipe disponibles pendant les heures de support prévues. 
+  Déploiement d'une charge de travail sans suffisamment de membres de l'équipe pour la prendre en charge si des membres de l'équipe sont en congés ou en arrête maladie. 
+  Déploiement de charges de travail supplémentaires sans vérifier l'impact additionnel sur les membres de l'équipe qui prend en charge la charge de travail et d’autres charges de travail. 

 **Avantages liés au respect de cette bonne pratique :** Le fait de disposer de membres d'équipe compétents vous permet de prendre efficacement en charge votre charge de travail. 

 **Niveau de risque exposé si cette bonne pratique n'est pas respectée :** Débit 

## Directives d'implémentation
<a name="implementation-guidance"></a>
+  Compétences du personnel : assurez-vous qu'il y ait suffisamment de personnel qualifié pour assumer efficacement la charge de travail. 
  +  Taille de l'équipe : veillez à disposer de suffisamment de personnel pour couvrir les activités opérationnelles, y compris des employés d'astreinte. 
  +  Compétence de l'équipe : assurez-vous que les membres de votre équipe soient suffisamment formés sur AWS, votre charge de travail et les outils utilisés pour vos opérations afin de mener à bien leurs tâches. 
    +  [Événements et webinaires AWS](https://aws.amazon.com/about-aws/events/) 
    +  [Bienvenue sur AWS Training and Certification](https://aws.amazon.com/training/) 
  +  Vérifier les capacités : vérifiez la taille de l'équipe et ses compétences au fur et à mesure que les conditions d'utilisation et les charges de travail évoluent, afin de maintenir l'excellence opérationnelle. Effectuez des ajustements pour veiller à ce que la taille de l'équipe et ses compétences satisfassent aux exigences opérationnelles pour les charges de travail gérées par l'équipe. 

## Ressources
<a name="resources"></a>

 **Documents connexes :** 
+  [les blogs AWS](https://aws.amazon.com/blogs/) 
+  [Événements et webinaires AWS](https://aws.amazon.com/about-aws/events/) 
+  [Centre de ressources de démarrage AWS](https://aws.amazon.com/getting-started/) 
+  [les conférences techniques en ligne AWS](https://aws.amazon.com/getting-started/) 
+  [Bienvenue sur AWS Training and Certification](https://aws.amazon.com/training/) 

 **Exemples connexes :** 
+  [Well-Architected Labs](https://wellarchitectedlabs.com/) 

# OPS07-BP02 Assurer un examen cohérent de l'état de préparation opérationnelle
<a name="ops_ready_to_support_const_orr"></a>

Utilisez les examens de disponibilité opérationnelle (ORR) afin de vous assurer que vous pouvez gérer votre charge de travail. L'ORR est un mécanisme élaboré par Amazon afin de s'assurer que les équipes peuvent exécuter leurs charges de travail en toute sécurité. Un ORR est un processus d'examen et d'inspection qui utilise une liste de contrôle des exigences. Un ORR est une expérience en libre-service que les équipes utilisent pour certifier leurs charges de travail. Les ORR comprennent les bonnes pratiques tirées des enseignements liés aux années que nous avons consacrées à la création de logiciels. 

 La liste de contrôle d'un ORR est composée de recommandations architecturales, de processus opérationnels, de gestion d'événements et de qualité de version. Notre processus de correction des erreurs (CoE) est l'un des principaux moteurs de ces éléments. Votre propre analyse post-incident doit orienter l'évolution de votre propre ORR. Un ORR consiste non seulement à suivre les bonnes pratiques, mais permet également d'éviter la répétition d'événements que vous avez déjà vus. Enfin, les exigences en matière de sécurité, de gouvernance et de conformité peuvent également être incluses dans un ORR. 

 Exécutez les ORR avant qu'une charge de travail ne soit généralement disponible, puis tout au long du cycle de développement du logiciel. L'exécution d'un ORR avant le lancement augmente votre capacité de gestion de la charge de travail en toute sécurité. Réexécutez régulièrement votre ORR sur la charge de travail afin de détecter toute dérive par rapport aux bonnes pratiques. Vous pouvez avoir des listes de contrôle des ORR pour les lancements de nouveaux services et des ORR pour les examens périodiques. Cela vous permet de vous tenir au courant des nouvelles bonnes pratiques et d'intégrer les leçons tirées de l'analyse après incident. Au fur et à mesure que votre utilisation du cloud évolue, vous pouvez intégrer les exigences des ORR dans votre architecture par défaut. 

 **Résultat souhaité :**  vous avez une liste de contrôle de l'ORR avec les bonnes pratiques pour votre organisation. Les ORR sont effectuées avant le lancement des charges de travail. Les ORR sont exécutés périodiquement tout au long du cycle de vie de la charge de travail. 

 **Anti-modèles courants :** 
+ Vous lancez une charge de travail sans savoir si vous pouvez l'utiliser. 
+ Les exigences en matière de gouvernance et de sécurité ne sont pas incluses dans la certification d'une charge de travail pour le lancement. 
+ Les charges de travail ne sont pas réévaluées périodiquement. 
+ Les charges de travail sont lancées sans procédures requises en place. 
+ Vous voyez la répétition de la même cause racine de défaillances dans plusieurs charges de travail. 

 **Avantages liés au respect de cette bonne pratique :** 
+  Vos charges de travail comprennent les bonnes pratiques en matière d'architecture, de processus et de gestion. 
+  Les enseignements tirés sont intégrés à votre processus d'ORR. 
+  Les procédures requises sont en place lors du lancement des charges de travail. 
+  Les ORR sont exécutés tout au long du cycle de vie logiciel de vos charges de travail. 

 **Niveau d'exposition au risque si cette bonne pratique n'est pas respectée :** élevé 

## Directives d'implémentation
<a name="implementation-guidance"></a>

 Un ORR est composé de deux éléments : un processus et une liste de contrôle. Votre processus d'ORR doit être adopté par votre organisation et soutenu par un responsable exécutif. Au minimum, les ORR doivent être effectués avant qu'une charge de travail ne soit généralement disponible. Exécutez l'ORR tout au long du cycle de développement du logiciel afin de l'actualiser avec les bonnes pratiques ou les nouvelles exigences. La liste de contrôle d'un ORR doit comprendre les éléments de configuration, les exigences en matière de sécurité et de gouvernance et les bonnes pratiques de votre organisation. Au fil du temps, vous pouvez utiliser des services tels qu' [AWS Config](https://docs.aws.amazon.com/config/latest/developerguide/WhatIsConfig.html), [AWS Security Hub CSPM](https://docs.aws.amazon.com/securityhub/latest/userguide/what-is-securityhub.html)et [les barrières de protection AWS Control Tower](https://docs.aws.amazon.com/controltower/latest/userguide/guardrails.html)afin d'intégrer les bonnes pratiques de l'ORR aux barrières de protection pour la détection automatique des bonnes pratiques. 

 **Exemple client** 

 Après plusieurs incidents de production, AnyCompany Retail a décidé de mettre en place un processus d'ORR. L'entreprise a élaboré une liste de contrôle composée de bonnes pratiques, d'exigences en matière de gouvernance et de conformité et d'enseignements tirés des pannes. De nouvelles charges de travail effectuent des ORR avant leur lancement. Chaque charge de travail effectue un ORR annuel avec un sous-ensemble de bonnes pratiques pour intégrer de nouvelles bonnes pratiques et des exigences qui sont ajoutées à la liste de contrôle de l'ORR. Au fil du temps, AnyCompany Retail a utilisé [AWS Config](https://docs.aws.amazon.com/config/latest/developerguide/WhatIsConfig.html) afin de détecter certaines bonnes pratiques, en accélérant le processus d'ORR. 

 **Étapes d'implémentation** 

 Pour en savoir plus sur les ORR, lisez le livre blanc [Operational Readiness Reviews (ORR)](https://docs.aws.amazon.com/wellarchitected/latest/operational-readiness-reviews/wa-operational-readiness-reviews.html). Il fournit des informations détaillées sur l'historique du processus d'ORR, sur la façon d'établir votre propre pratique d'ORR et sur la façon d'élaborer votre liste de contrôle pour les ORR. Les étapes suivantes sont une version abrégée de ce document. Pour une compréhension approfondie des ORR et de la façon dont vous pouvez créer les vôtres, nous vous recommandons de lire ce livre blanc. 

1. Réunissez les parties prenantes clés, notamment les représentants de la sécurité, des opérations et du développement. 

1. Demandez à chaque partie prenante de fournir au moins une exigence. Pour la première itération, essayez de limiter le nombre d'éléments à trente ou moins. 
   +  [L'Annexe A, Example ORR questions,](https://docs.aws.amazon.com/wellarchitected/latest/operational-readiness-reviews/appendix-b-example-orr-questions.html) du livre blanc Operational Readiness Reviews (ORR) contient des exemples de questions que vous pouvez utiliser pour démarrer. 

1. Regroupez vos exigences dans une feuille de calcul. 
   + Vous pouvez utiliser [des approches personnalisées](https://docs.aws.amazon.com/wellarchitected/latest/userguide/lenses-custom.html) dans l' [AWS Well-Architected Tool](https://console.aws.amazon.com/wellarchiected/) afin de développer votre ORR et de le partager avec vos comptes et votre AWS Organization. 

1. Identifiez une charge de travail pour effectuer l'ORR. Il est recommandé d'utiliser une charge de travail avant le lancement ou une charge de travail interne. 

1. Parcourez la liste de contrôle de l'ORR et notez toutes vos découvertes. Les découvertes peuvent ne pas être acceptables si une mesure d'atténuation est en place. Pour toute découverte qui ne comporte pas de mesures d'atténuation, ajoutez ces dernières à votre liste de tâches en attente et implémentez-les avant le lancement. 

1. Continuez d'ajouter des bonnes pratiques et des exigences à votre liste de contrôle de l'ORR au fil du temps. 

 Les clients Support disposant d'un Enterprise Support peuvent demander [l'atelier Operational Readiness Review Workshop](https://aws.amazon.com/premiumsupport/technology-and-programs/proactive-services/) à leur gestionnaire de compte technique. Cet atelier est une session *de travail à rebours* permettant de développer votre propre liste de contrôle pour un ORR. 

 **Niveau d'effort du plan d'implémentation :** élevé L'adoption d'une pratique d'ORR dans votre organisation nécessite un parrainage de la haute direction et l'adhésion des parties prenantes. Créez et mettez à jour la liste de contrôle à l'aide des commentaires de l'ensemble de votre organisation. 

## Ressources
<a name="resources"></a>

 **Bonnes pratiques associées :** 
+ [OPS01-BP03 Évaluer les exigences de gouvernance](ops_priorities_governance_reqs.md) – Les exigences en matière de gouvernance conviennent naturellement à la liste de contrôle d'un ORR. 
+ [OPS01-BP04 Évaluer les exigences de conformité](ops_priorities_compliance_reqs.md) – Les exigences de conformité sont parfois incluses dans la liste de contrôle d'un ORR. Parfois, il s'agit d'un processus distinct. 
+ [OPS03-BP07 Fournir aux équipes les ressources appropriées](ops_org_culture_team_res_appro.md) – La capacité de l'équipe peut faire partie des exigences d'un ORR. 
+ [OPS06-BP01 Planifier les modifications infructueuses](ops_mit_deploy_risks_plan_for_unsucessful_changes.md) – Un plan de restauration ou de retour en arrière doit être établi avant le lancement de votre charge de travail. 
+ [OPS07-BP01 Garantir les compétences du personnel](ops_ready_to_support_personnel_capability.md) – Pour gérer une charge de travail, vous devez disposer du personnel requis. 
+ [SEC01-BP03 Identifier et valider les objectifs de contrôle](https://docs.aws.amazon.com/wellarchitected/latest/framework/sec_securely_operate_control_objectives.html) – Les objectifs de contrôle de sécurité constituent d'excellentes exigences d'ORR. 
+ [REL13-BP01 Définir les objectifs de reprise pour les temps d'arrêt et les pertes de données](https://docs.aws.amazon.com/wellarchitected/latest/framework/rel_planning_for_recovery_objective_defined_recovery.html) – Les plans de reprise après sinistre constituent une exigence appropriée dans le cadre d'un ORR. 
+ [COST02-BP01 Développer des stratégies en fonction des exigences de votre organisation](https://docs.aws.amazon.com/wellarchitected/latest/framework/cost_govern_usage_policies.html) – Il est recommandé d'inclure les politiques de gestion des coûts dans la liste de contrôle d'un ORR. 

 **Documents connexes :** 
+  [AWS Control Tower - Guardrails in AWS Control Tower](https://docs.aws.amazon.com/controltower/latest/userguide/guardrails.html) 
+  [AWS Well-Architected Tool - Custom Lenses](https://docs.aws.amazon.com/wellarchitected/latest/userguide/lenses-custom.html) 
+  [Operational Readiness Review Template par Adrian Hornsby](https://medium.com/the-cloud-architect/operational-readiness-review-template-e23a4bfd8d79) 
+  [Livre blanc Operational Readiness Reviews (ORR)](https://docs.aws.amazon.com/wellarchitected/latest/operational-readiness-reviews/wa-operational-readiness-reviews.html) 

 **Vidéos connexes :** 
+  [AWS Supports You \$1 Building an Effective Operational Readiness Review (ORR)](https://www.youtube.com/watch?v=Keo6zWMQqS8) 

 **Exemples connexes :** 
+  [Sample Operational Readiness Review (ORR) Lens](https://github.com/aws-samples/custom-lens-wa-sample/tree/main/ORR-Lens) 

 **Services associés :** 
+  [AWS Config](https://docs.aws.amazon.com/config/latest/developerguide/WhatIsConfig.html) 
+  [AWS Control Tower](https://docs.aws.amazon.com/controltower/latest/userguide/what-is-control-tower.html) 
+  [AWS Security Hub CSPM](https://docs.aws.amazon.com/securityhub/latest/userguide/what-is-securityhub.html) 
+  [AWS Well-Architected Tool](https://docs.aws.amazon.com/wellarchitected/latest/userguide/intro.html) 

# OPS07-BP03 Utiliser des runbooks pour effectuer des procédures
<a name="ops_ready_to_support_use_runbooks"></a>

 A *runbook* est un processus documenté pour atteindre un résultat spécifique. Les runbooks consistent en une série d'étapes permettant à la personne qui les suit d'obtenir des résultats concrets. L'utilisation des runbooks dans les opérations remonte aux débuts de l'aviation. Dans les opérations de cloud, nous utilisons des runbooks pour réduire les risques et obtenir les résultats souhaités. Dans sa forme la plus simple, un runbook est une liste de contrôle pour exécuter une tâche. 

 Les runbooks représentent une part essentielle du fonctionnement de votre charge de travail. De l'intégration d'un nouveau membre de l'équipe au déploiement d'une version majeure, les runbooks sont des processus codifiés qui fournissent des résultats cohérents quelle que soit la personne qui les utilise. Les runbooks doivent être publiés dans un emplacement central et mis à jour à mesure que le processus évolue, car la mise à jour des runbooks est un composant essentiel du processus de gestion des changements. Ils doivent également inclure des conseils sur la gestion des erreurs, les outils, les autorisations, les exceptions et les remontées en cas de problème. 

 À mesure que votre entreprise évolue, commencez à automatiser les runbooks. Prenez tout d'abord les runbooks courts et fréquemment utilisés. Utilisez des langages de scripts pour automatiser les étapes ou les rendre plus faciles. À mesure que vous automatiserez les premiers runbooks, vous consacrerez du temps à l'automatisation de runbooks plus complexes. Au fil du temps, la plupart de vos runbooks seront automatisés d'une certaine façon. 

 **Résultat souhaité :** Votre équipe dispose de plusieurs guides détaillés pour exécuter des tâches de charge de travail. Les runbooks contiennent le résultat souhaité, les outils et autorisations nécessaires, ainsi que les instructions pour gérer les erreurs. Ils sont stockés dans un emplacement central et mis à jour fréquemment. 

 **Anti-modèles courants :** 
+  Utilisation de la mémoire pour exécuter chaque étape d'un processus. 
+  Déploiement manuel des changements sans liste de contrôle. 
+  Différents membres de l'équipe exécutant le même processus, mais avec des étapes ou résultats différents. 
+  Désynchronisation des runbooks avec les changements du système et l'automatisation. 

 **Avantages liés au respect de cette bonne pratique :** 
+  Réduction du taux d'erreur pour les tâches manuelles. 
+  Exécution cohérente des opérations. 
+  Exécution des tâches plus tôt par les nouveaux membres de l'équipe. 
+  Automatisation des runbooks pour diminuer la quantité de travail. 

 **Niveau de risque exposé si cette bonne pratique n'est pas respectée :** Moyen 

## Directives d'implémentation
<a name="implementation-guidance"></a>

 Les runbooks peuvent prendre plusieurs formes selon le niveau de maturité de votre entreprise. Au minimum, ils doivent consister en un document texte détaillé. Le résultat souhaité doit être clairement indiqué. Ils documentent explicitement les autorisations spéciales ou outils nécessaires. Ils fournissent des conseils sur la gestion des erreurs et les remontées en cas de problème. Recherchez le propriétaire du runbook et publiez-le dans un emplacement central. Une fois votre runbook documenté, validez-le en demandant à un membre de votre équipe de l'exécuter. À mesure que les procédures évoluent, mettez à jour vos runbooks conformément à votre processus de gestion des changements. 

 Vos runbooks texte doivent être automatisés à mesure que votre entreprise évolue. Grâce à des services tels que [les automatisations AWS Systems Manager](https://docs.aws.amazon.com/systems-manager/latest/userguide/systems-manager-automation.html), vous pouvez transformer un fichier texte en automatisations pouvant être exécutées sur votre charge de travail. Ces automatisations peuvent être exécutées en réponse aux événements, tout en réduisant la charge opérationnelle pour maintenir votre charge de travail. 

 **Exemple client** 

 AnyCompany Retail doit mettre à jour des schémas de bases de données lors de déploiements logiciels. L'équipe en charge des opérations de cloud en collaboration avec l'équipe responsable de l'administration des bases de données ont créé un runbook, pour déployer manuellement ces changements. Le runbook répertoriait chacune des étapes du processus sous forme de liste de contrôle. Il comprenait une section sur la gestion des erreurs en cas de problème. Les équipes ont publié le runbook sur leur wiki interne contenant leurs autres runbooks. L'équipe en charge des opérations de cloud envisage d'automatiser le runbook dans un prochain sprint. 

## Étapes d'implémentation
<a name="implementation-steps"></a>

 Si vous ne disposez pas d'un référentiel de documents, un référentiel de contrôle de version est un emplacement idéal pour commencer à créer votre bibliothèque de runbooks. Vous pouvez créer vos runbooks en utilisant le format Markdown. Voici un exemple de modèle de runbook que vous pouvez utiliser pour commencer à créer vos runbooks. 

```
# Runbook Title ## Runbook Info | Runbook ID | Description | Tools Used | Special Permissions | Runbook Author | Last Updated | Escalation POC | |-------|-------|-------|-------|-------|-------|-------| | RUN001 | What is this runbook for? What is the desired outcome? | Tools | Permissions | Your Name | 2022-09-21 | Escalation Name | ## Steps 1. Step one 2. Step two
```

1.  Si vous ne possédez pas de référentiel de documentation ou de wiki existant, créer un référentiel de contrôle de version dans votre système de contrôle de version. 

1.  Identifier un processus ne possédant pas de runbook. Le processus idéal doit être réalisé de manière semi-régulière, contenir peu d'étapes et avoir des échecs à faible impact. 

1.  Dans votre référentiel de documents, créer un brouillon au format Markdown en utilisant le modèle. Remplissez le champ `Runbook Title` et les champs obligatoires sous `Runbook Info`. 

1.  En commençant par la première, remplir la partie `Étapes` du runbook. 

1.  Donner le runbook à un membre de l'équipe. Demandez-lui d'utiliser le runbook pour valider les étapes. En cas d'élément manquant ou de besoin de clarification, mettez à jour le runbook. 

1.  Publier le runbook sur votre référentiel de documentation interne. Une fois publié, partagez l'information avec votre équipe et les autres parties prenantes. 

1.  Au fil du temps, vous créerez une bibliothèque de runbooks. À mesure que cette bibliothèque s'étoffe, commencez à travailler sur l'automatisation des runbooks. 

 **Niveau d'effort du plan d'implémentation :** faible. La norme minimum pour un runbook est un guide texte détaillé. L'automatisation des runbooks peut augmenter l'effort d'implémentation. 

## Ressources
<a name="resources"></a>

 **Bonnes pratiques associées :** 
+  [OPS02-BP02 Les processus et procédures ont des propriétaires identifiés](ops_ops_model_def_proc_owners.md) : les runbooks doivent avoir un propriétaire chargé d'en assurer la maintenance. 
+  [OPS07-BP04 Utiliser des playbooks pour analyser les problèmes](ops_ready_to_support_use_playbooks.md) : les runbooks et les playbooks sont identiques à une différence près : un runbook a un résultat souhaité. Dans de nombreux cas, les runbooks sont déclenchés suite à l'identification d'une cause profonde par un playbook. 
+  [OPS10-BP01 Utiliser un processus pour la gestion des événements, des incidents et des problèmes](ops_event_response_event_incident_problem_process.md) : les runbooks sont une part essentielle de la pratique de la gestion d'un bon déroulement, d'un incident et d'un problème 
+  [OPS10-BP02 Disposer d'un processus par alerte](ops_event_response_process_per_alert.md) : les runbooks et les playbooks doivent être utilisés pour répondre aux alertes. Avec le temps, ces réactions doivent être automatisées. 
+  [OPS11-BP04 Gérer les connaissances](ops_evolve_ops_knowledge_management.md) : la maintenance des runbooks représente une part essentielle de la gestion des connaissances. 

 **Documents connexes :** 
+ [Atteindre l'excellence opérationnelle grâce à l'automatisation de playbooks et de runbooks](https://aws.amazon.com/blogs/mt/achieving-operational-excellence-using-automated-playbook-and-runbook/) 
+ [AWS Systems Manager : travailler avec des runbooks](https://docs.aws.amazon.com/systems-manager/latest/userguide/automation-documents.html) 
+ [Playbook d'atténuation des risques pour les importantes migrations AWS – Tâche 4 : amélioration de vos runbooks de migration](https://docs.aws.amazon.com/prescriptive-guidance/latest/large-migration-migration-playbook/task-four-migration-runbooks.html) 
+ [Utiliser les runbooks AWS Systems Manager Automation pour résoudre des tâches opérationnelles](https://aws.amazon.com/blogs/mt/use-aws-systems-manager-automation-runbooks-to-resolve-operational-tasks/) 

 **Vidéos connexes :** 
+  [AWS re:Invent 2019: DIY guide to runbooks, incident reports, and incident response (SEC318-R1)](https://www.youtube.com/watch?v=E1NaYN_fJUo) 
+  [Comment automatiser des opérations informatiques sur AWS \$1 Amazon Web Services](https://www.youtube.com/watch?v=GuWj_mlyTug) 
+  [Intégrations de scripts dans AWS Systems Manager](https://www.youtube.com/watch?v=Seh1RbnF-uE) 

 **Exemples connexes :** 
+  [AWS Systems Manager : procédure étape par étape pour l'automatisation](https://docs.aws.amazon.com/systems-manager/latest/userguide/automation-walk.html) 
+  [AWS Systems Manager : restaurer un volume racine à partir du dernier runbook d'instantanés](https://docs.aws.amazon.com/systems-manager/latest/userguide/automation-document-sample-restore.html)
+  [Créer un runbook de réponse d'incident AWS à l'aide des blocs-notes Jupyter et CloudTrail Lake](https://catalog.us-east-1.prod.workshops.aws/workshops/a5801f0c-7bd6-4282-91ae-4dfeb926a035/en-US) 
+  [Gitlab – Runbooks](https://gitlab.com/gitlab-com/runbooks) 
+  [Rubix – Une bibliothèque Python pour créer des runbooks dans les blocs-notes Jupyter](https://github.com/Nurtch/rubix) 
+  [Utilisation d'un créateur de documents pour créer un runbook personnalisé](https://docs.aws.amazon.com/systems-manager/latest/userguide/automation-walk-document-builder.html) 
+  [Ateliers Well-Architected : automatisation des opérations avec les playbooks et les runbooks](https://wellarchitectedlabs.com/operational-excellence/200_labs/200_automating_operations_with_playbooks_and_runbooks/) 

 **Services associés :** 
+  [AWS Systems Manager Automation](https://docs.aws.amazon.com/systems-manager/latest/userguide/systems-manager-automation.html) 

# OPS07-BP04 Utiliser des playbooks pour analyser les problèmes
<a name="ops_ready_to_support_use_playbooks"></a>

 Les playbooks sont des guides étape par étape utilisés pour analyser un incident. Lorsque des incidents se produisent, les playbooks sont utilisés pour analyser, évaluer l'impact et identifier une cause racine. Les playbooks sont utilisés dans le cadre de différents scénarios allant des échecs de déploiement aux incidents de sécurité. Dans la plupart des cas, les playbooks identifient la cause racine qui est atténuée par l'utilisation d'un runbook. Les playbooks sont une composante essentielle des plans de réponse de votre organisation en cas d'incident. 

 Un playbook efficace comporte plusieurs fonctionnalités clés. Il guide l'utilisateur, étape par étape, dans le processus de découverte. Si vous optez pour un point de vue extérieur, quelles étapes devez-vous suivre pour diagnostiquer un incident ? Définissez clairement dans le playbook si des outils spéciaux ou des autorisations élevées sont nécessaires. Il est essentiel d'élaborer un plan de communication pour informer les parties prenantes du statut de l'analyse. Lorsqu'il est impossible de déterminer la cause racine, le playbook doit comporter un plan de remontée des informations vers la hiérarchie. Si la cause racine est identifiée, le playbook doit faire référence à un runbook décrivant une solution pour la résoudre. Les playbooks doivent être stockés dans un emplacement central et mis à jour régulièrement. Si des playbooks sont utilisés pour des alertes précises, donnez aux membres de votre équipe des indications relatives au playbook dans le cadre de l'alerte. 

 Au fur et à mesure que votre organisation évolue, automatisez vos playbooks. Commencez par des playbooks qui couvrent les incidents à faible risque. Utilisez des scripts pour automatiser les étapes de découverte. Veillez à créer des runbooks complémentaires destinés à atténuer les causes racine courantes. 

 **Résultat souhaité :** votre organisation dispose de playbooks pour les incidents courants. Les playbooks sont stockés dans un emplacement central et mis à la disposition des membres de votre équipe. Les playbooks sont souvent mis à jour. Pour toute cause racine connue, des runbooks complémentaires sont créés. 

 **Anti-modèles courants :** 
+  Il n'existe pas de façon standard d'analyser un incident. 
+  Les membres de l'équipe comptent sur la mémoire musculaire ou les connaissances institutionnelles pour résoudre un échec de déploiement. 
+  Les nouveaux membres de l'équipe apprennent à analyser les problèmes par un procédé de tâtonnement. 
+  Les bonnes pratiques d'analyse des problèmes ne sont pas partagées entre les équipes. 

 **Avantages liés au respect de cette bonne pratique :** 
+  Les playbooks dynamisent les efforts nécessaires pour atténuer les incidents. 
+  Différents membres de l'équipe peuvent utiliser le même playbook pour identifier une cause racine de façon cohérente. 
+  Les causes racine connues peuvent être associées à des runbooks développés spécialement pour leur résolution, ce qui permet d'accélérer le délai de récupération. 
+  Les playbooks permettent aux membres de l'équipe de commencer à apporter leur contribution plus tôt. 
+  Les équipes peuvent adapter leurs processus à l'aide de playbooks reproductibles. 

 **Niveau d'exposition au risque si cette bonne pratique n'est pas respectée :** Moyen 

## Directives d'implémentation
<a name="implementation-guidance"></a>

 La façon dont vous créez et utilisez les playbooks dépend de la maturité de votre organisation. Si vous débutez dans le cloud, créez des playbooks sous forme de texte dans un référentiel de documents centralisé. Au fur et à mesure que votre organisation évolue, les playbooks peuvent devenir semi-automatisés avec des langages de script comme Python. Ces scripts peuvent être exécutés dans un bloc-notes Jupyter afin d'accélérer la découverte. Les organisations avancées ont des playbooks entièrement automatisés pour les problèmes courants qui sont corrigés automatiquement avec des runbooks. 

 Pour commencer à créer vos playbooks, répertoriez les incidents qui affectent couramment votre charge de travail. Pour commencer, choisissez des playbooks pour les incidents à faible risque dont la cause racine a été réduite à quelques problèmes. Une fois que vous disposez de playbooks pour des scénarios plus simples, passez aux scénarios à risque élevé ou à ceux dont la cause racine est peu connue. 

 Vos playbooks sous forme de texte doivent être automatisés à mesure que votre entreprise évolue. Grâce à des services tels que [AWS Systems Manager Automation,](https://docs.aws.amazon.com/systems-manager/latest/userguide/systems-manager-automation.html)le texte brut peut être transformé en automatisations. Ces automatisations peuvent être exécutées en fonction de votre charge de travail pour accélérer les analyses. Ces automatisations peuvent être activées en réponse à des événements, ce qui réduit le temps nécessaire pour découvrir et résoudre les incidents. 

 Les clients peuvent utiliser [AWS Systems Manager Incident Manager](https://docs.aws.amazon.com/incident-manager/latest/userguide/what-is-incident-manager.html) afin de répondre aux incidents. Ce service offre une interface unique pour trier les incidents, informer les parties prenantes pendant la découverte et l'atténuation, et collaborer tout au long de l'incident. Il utilise AWS Systems Manager Automation afin d'accélérer la détection et la récupération. 

 **Exemple client** 

 AnyCompany Retail a dû faire face à un incident de production. L'ingénieur d'astreinte a utilisé un playbook pour analyser le problème. À mesure qu'il effectuait les différentes étapes, il a informé les parties prenantes identifiées dans le playbook de l'évolution de la situation. L'ingénieur a identifié que la cause racine était une condition de concurrence dans un service back-end. À l'aide d'un runbook, il a relancé le service et a permis à AnyCompany Retail d'être à nouveau en ligne. 

## Étapes d'implémentation
<a name="implementation-steps"></a>

 Si vous n'avez pas de référentiel de documents existant, nous vous suggérons de créer un référentiel de contrôle de version pour votre bibliothèque de playbooks. Vous pouvez créer vos playbooks en utilisant Markdown, qui est compatible avec la plupart des systèmes d'automatisation de playbook. Si vous démarrez de zéro, utilisez l'exemple de modèle de playbook suivant. 

```
# Titre du playbook ## Informations sur le playbook | ID du playbook | Description | Outils utilisés | Autorisations spéciales | Auteur du playbook | Dernière mise à jour | POC de remontée hiérarchique | Parties prenantes | Plan de communication | |-------|-------|-------|-------|-------|-------|-------|-------|-------| | RUN001 | À quoi sert ce playbook ? Pour quel type d'incident est-il utilisé ? | Outils | Autorisations | Votre nom | 2022-09-21 | Contact pour la remontée des informations vers la hiérarchie | Nom de la partie prenante | Comment les dernières informations seront-elles communiquées au cours de l'analyse ? | ## Étapes 1. Première étape 2. Deuxième étape
```

1.  Si vous ne possédez pas de référentiel de documents ni de wiki existant, créez un référentiel de contrôle de version pour vos playbooks dans votre système de contrôle de version. 

1.  Identifiez un problème courant qui doit être analysé. Il doit s'agir d'un scénario où la cause racine se limite à quelques problèmes et où la résolution présente peu de risques. 

1.  À l'aide du modèle Markdown, remplissez la section `Nom du playbook` et les champs situés sous `Informations sur le playbook`. 

1.  Remplissez les étapes de résolution du problème. Soyez aussi clair que possible sur les actions à effectuer ou les domaines à analyser. 

1.  Remettez le playbook à un membre de l'équipe et demandez-lui de le passer en revue afin de le valider. S'il manque quelque chose ou si un point n'est pas clair, mettez à jour le playbook. 

1.  Publiez le playbook dans votre référentiel de documents et informez votre équipe et les parties prenantes. 

1.  Cette bibliothèque de playbooks s'enrichira à mesure que vous ajouterez d'autres playbooks. Une fois que vous avez plusieurs playbooks, commencez à les automatiser en utilisant des outils comme AWS Systems Manager Automation afin de garantir la synchronisation entre l'automatisation et les playbooks. 

 **Niveau d'effort du plan d'implémentation :** faible. Vos playbooks doivent être des documents texte stockés dans un emplacement central. Les organisations plus avancées évolueront vers l'automatisation des playbooks. 

## Ressources
<a name="resources"></a>

 **Bonnes pratiques associées :** 
+  [OPS02-BP02 Les processus et procédures ont des propriétaires identifiés](ops_ops_model_def_proc_owners.md) : un propriétaire doit être désigné pour les playbooks et être chargé d'en assurer la gestion. 
+  [OPS07-BP03 Utiliser des runbooks pour effectuer des procédures](ops_ready_to_support_use_runbooks.md) : les runbooks et les playbooks sont similaires, mais se distinguent par le fait qu'un résultat souhaité est défini pour un runbook. Dans de nombreux cas, les runbooks sont utilisés après qu'un playbook a identifié une cause racine. 
+  [OPS10-BP01 Utiliser un processus pour la gestion des événements, des incidents et des problèmes](ops_event_response_event_incident_problem_process.md) : les runbooks constituent un élément important d'une bonne pratique de gestion des événements, des incidents et des problèmes. 
+  [OPS10-BP02 Disposer d'un processus par alerte](ops_event_response_process_per_alert.md) : les runbooks et les playbooks doivent être utilisés pour répondre aux alertes. Avec le temps, ces réactions doivent être automatisées. 
+  [OPS11-BP04 Gérer les connaissances](ops_evolve_ops_knowledge_management.md) : la gestion des playbooks est un élément clé de la gestion des connaissances. 

 **Documents connexes :** 
+ [ Achieving Operational Excellence using automated playbook and runbook ](https://aws.amazon.com/blogs/mt/achieving-operational-excellence-using-automated-playbook-and-runbook/)
+  [AWS Systems Manager – Utilisation de runbooks](https://docs.aws.amazon.com/systems-manager/latest/userguide/automation-documents.html) 
+ [ Use AWS Systems Manager Automation runbooks to resolve operational tasks ](https://aws.amazon.com/blogs/mt/use-aws-systems-manager-automation-runbooks-to-resolve-operational-tasks/)

 **Vidéos connexes :** 
+ [AWS re:Invent 2019: DIY guide to runbooks, incident reports, and incident response (SEC318-R1) ](https://www.youtube.com/watch?v=E1NaYN_fJUo)
+ [AWS Systems Manager Incident Manager - AWS Virtual Workshops ](https://www.youtube.com/watch?v=KNOc0DxuBSY)
+ [ Integrate Scripts into AWS Systems Manager](https://www.youtube.com/watch?v=Seh1RbnF-uE)

 **Exemples connexes :** 
+ [AWS Customer Playbook Framework ](https://github.com/aws-samples/aws-customer-playbook-framework)
+ [AWS Systems Manager : Procédures d'automatisation ](https://docs.aws.amazon.com/systems-manager/latest/userguide/automation-walk.html)
+ [ Building an AWS incident response runbook using Jupyter notebooks and CloudTrail Lake ](https://catalog.workshops.aws/workshops/a5801f0c-7bd6-4282-91ae-4dfeb926a035/en-US)
+ [ Rubix – Une bibliothèque Python pour créer des runbooks dans les bloc-notes Jupyter ](https://github.com/Nurtch/rubix)
+ [ Utilisation de Document Builder pour créer un runbook personnalisé ](https://docs.aws.amazon.com/systems-manager/latest/userguide/automation-walk-document-builder.html)
+ [ Ateliers Well-Architected : automatisation des opérations avec les playbooks et les runbooks ](https://wellarchitectedlabs.com/operational-excellence/200_labs/200_automating_operations_with_playbooks_and_runbooks/)
+ [ Ateliers Well-Architected : playbook de réponse aux incidents avec Jupyter ](https://www.wellarchitectedlabs.com/security/300_labs/300_incident_response_playbook_with_jupyter-aws_iam/)

 **Services associés :** 
+ [AWS Systems Manager Automation ](https://docs.aws.amazon.com/systems-manager/latest/userguide/systems-manager-automation.html)
+ [AWS Systems Manager Incident Manager](https://docs.aws.amazon.com/incident-manager/latest/userguide/what-is-incident-manager.html)

# OPS07-BP05 Prendre des décisions avisées pour déployer des systèmes et des modifications
<a name="ops_ready_to_support_informed_deploy_decisions"></a>

 Évaluez les compétences de l'équipe pour prendre en charge la charge de travail et la conformité de cette dernière à la gouvernance. Évaluez-les par rapport aux avantages du déploiement pour déterminer s'il convient de faire passer un système ou une modification en production. Comprenez les avantages et les risques pour prendre des décisions avisées. 

 Un pré-mortem est un exercice où une équipe simule un échec pour développer des stratégies d'atténuation. Utilisez des pré-mortems pour anticiper les échecs et créer des procédures le cas échéant. Lorsque vous apportez des modifications aux listes de contrôle que vous utilisez pour évaluer votre charge de travail, planifiez les opérations que vous allez exécuter pour les systèmes en service qui ne sont plus conformes. 

 **Anti-modèles courants :** 
+  Décider de déployer une charge de travail sans comprendre les risques de sécurité qu'elle comporte. 
+  Décider de déployer une charge de travail sans savoir si elle est conforme à votre gouvernance et à vos normes. 
+  Décider de déployer une charge de travail sans savoir si votre équipe peut la prendre en charge. 
+  Décider de déployer une charge de travail sans comprendre les avantages qu’elles apporte à l'organisation. 

 **Avantages liés au respect de cette bonne pratique :** Le fait de disposer de membres d'équipe compétents vous permet de prendre efficacement en charge votre charge de travail. 

 **Niveau de risque exposé si cette bonne pratique n'est pas respectée :** Faible 

## Directives d'implémentation
<a name="implementation-guidance"></a>
+  Prendre des décisions avisées pour déployer des charges de travail et des modifications : évaluez les capacités de l'équipe à prendre en charge la charge de travail et à assurer sa conformité avec la gouvernance. Évaluez-les par rapport aux avantages du déploiement pour déterminer s'il convient de faire passer un système ou une modification en production. Comprenez les avantages et les risques et prenez des décisions avisées. 

# Exploiter
<a name="a-operate"></a>

**Topics**
+ [OPS 8  Comment comprendre l'état de votre charge de travail ?](w2aac19b5b9b5.md)
+ [OPS 9  Comment comprendre l'état de vos opérations ?](w2aac19b5b9b7.md)
+ [OPS 10  Comment gérer les événements relatifs à la charge de travail et aux opérations ?](w2aac19b5b9b9.md)

# OPS 8  Comment comprendre l'état de votre charge de travail ?
<a name="w2aac19b5b9b5"></a>

 Définissez, capturez et analysez les métriques de votre charge de travail pour obtenir une visibilité sur ses événements et prendre ainsi les mesures adéquates. 

**Topics**
+ [OPS08-BP01 Identifier les indicateurs clés de performance](ops_workload_health_define_workload_kpis.md)
+ [OPS08-BP02 Définir les métriques de la charge de travail](ops_workload_health_design_workload_metrics.md)
+ [OPS08-BP03 Collecter et analyser les métriques de charge de travail](ops_workload_health_collect_analyze_workload_metrics.md)
+ [OPS08-BP04 Définir des références de métriques de charge de travail](ops_workload_health_workload_metric_baselines.md)
+ [OPS08-BP05 Découvrir des modèles d'activité attendus pour la charge de travail](ops_workload_health_learn_workload_usage_patterns.md)
+ [OPS08-BP06 Signaler les menaces pesant sur les résultats de la charge de travail](ops_workload_health_workload_outcome_alerts.md)
+ [OPS08-BP07 Signaler la détection d'anomalies dans la charge de travail](ops_workload_health_workload_anomaly_alerts.md)
+ [OPS08-BP08 Confirmer la réalisation des résultats et l'efficacité des KPI et des métriques](ops_workload_health_biz_level_view_workload.md)

# OPS08-BP01 Identifier les indicateurs clés de performance
<a name="ops_workload_health_define_workload_kpis"></a>

 Identifiez les indicateurs clés de performance (KPI) en fonction des résultats économiques souhaités (par exemple, le taux de commande, le taux de fidélisation des clients et le bénéfice par rapport aux frais d'exploitation) et des résultats pour les clients (par exemple, la satisfaction des clients). Évaluez les KPI pour déterminer le succès de la charge de travail. 

 **Anti-modèles courants :** 
+  La direction de l’entreprise vous demande dans quelle mesure une charge de travail a répondu aux besoins des entreprises, mais vous n'avez pas de cadre de référence pour déterminer le succès. 
+  Vous n'êtes pas en mesure de déterminer si l'application commerciale prête à l'emploi que vous exploitez pour votre organisation est rentable. 

 **Avantages liés au respect de cette bonne pratique :** En identifiant les indicateurs clés de performance, vous permettez d'atteindre des résultats opérationnels comme test de l’état et du succès de votre charge de travail. 

 **Niveau de risque exposé si cette bonne pratique n'est pas respectée :** Débit 

## Directives d'implémentation
<a name="implementation-guidance"></a>
+  Identifier les indicateurs clés de performance : identifiez les indicateurs clés de performance (KPI) en fonction des résultats désirés pour l'entreprise et le client. Évaluez les KPI pour déterminer le succès de la charge de travail. 

# OPS08-BP02 Définir les métriques de la charge de travail
<a name="ops_workload_health_design_workload_metrics"></a>

 Définissez les métriques de la charge de travail pour mesurer la réalisation des KPI (par exemple, paniers abandonnés, commandes passées, e coût, prix et frais de charge de travail allouée). Définissez les métriques de la charge de travail afin de mesurer son état (par exemple, temps de réponse de l'interface, taux d'erreurs, demandes faites, demandes exécutées et utilisation). Évaluez les métriques pour déterminer si la charge de travail atteint les résultats souhaités et pour comprendre sont état. 

 Vous devez envoyer les données de journaux à un service comme CloudWatch Logs et générer des métriques à partir des observations du contenu des journaux nécessaires. 

 CloudWatch propose des fonctionnalités spécialisées comme [Amazon CloudWatch Insights pour .NET et SQL Server](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/appinsights-what-is.html) et [Container Insights](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/ContainerInsights.html) qui peuvent vous aider en identifiant et en configurant des métriques, des journaux et des alarmes clés sur vos ressources applicatives et votre pile technologique spécifiquement prises en charge. 

 **Anti-modèles courants :** 
+  Vous avez défini des métriques standard, qui ne sont pas associées à des indicateurs clés de performance ni personnalisées en fonction d'une charge de travail. 
+  Vos calculs de métriques comportent des erreurs qui donneront des résultats incorrects. 
+  Vous n'avez aucune métrique définie pour votre charge de travail. 
+  Vous mesurez uniquement la disponibilité. 

 **Avantages liés au respect de cette bonne pratique :** En définissant et en évaluant les métriques de la charge de travail, vous pouvez déterminer son état et mesurer la réalisation des résultats opérationnels. 

 **Niveau de risque exposé si cette bonne pratique n'est pas respectée :** Débit 

## Directives d'implémentation
<a name="implementation-guidance"></a>
+  Définir les métriques de la charge de travail : définissez les métriques de la charge de travail pour mesurer la réalisation des KPI. Définissez les métriques de charge de travail pour mesurer l'état de la charge de travail et de ses composants individuels. Évaluez les métriques pour déterminer si la charge de travail atteint les résultats souhaités et pour comprendre sont état. 
  +  [Publier des métriques personnalisées](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/publishingMetrics.html) 
  +  [Recherche et filtrage des données de journaux](https://docs.aws.amazon.com/AmazonCloudWatch/latest/logs/MonitoringLogData.html) 
  +  [Référence aux dimensions et métriques Amazon CloudWatch](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/CW_Support_For_AWS.html) 

## Ressources
<a name="resources"></a>

 **Documents connexes :** 
+  [Référence aux dimensions et métriques Amazon CloudWatch](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/CW_Support_For_AWS.html) 
+  [Publier des métriques personnalisées](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/publishingMetrics.html) 
+  [Recherche et filtrage des données de journaux](https://docs.aws.amazon.com/AmazonCloudWatch/latest/logs/MonitoringLogData.html) 

# OPS08-BP03 Collecter et analyser les métriques de charge de travail
<a name="ops_workload_health_collect_analyze_workload_metrics"></a>

 Effectuez régulièrement des examens proactifs des mesures afin d'identifier les tendances et de déterminer si des réponses appropriées sont nécessaires. 

 Vous devez regrouper les données des journaux depuis votre application, des composants de charge de travail, des services et des appels d'API vers un service tel que CloudWatch Logs. Générez des métriques à partir des observations du contenu nécessaire des journaux pour obtenir des informations sur les performances des activités opérationnelles. 

 Sur AWS, vous pouvez analyser les métriques de charge de travail et identifier les problèmes opérationnels à l'aide des fonctionnalités de machine learning de [Amazon DevOps Guru](https://docs.aws.amazon.com/devops-guru/latest/userguide/welcome.html). AWS DevOps Guru fournit une notification des problèmes opérationnels avec [des recommandations ciblées et proactives](https://docs.aws.amazon.com/devops-guru/latest/userguide/view-insights.html) pour résoudre les problèmes et maintenir l'état des applications. 

 Dans le modèle AWSde responsabilité partagée, la surveillance vous est en partie fournie via [Tableau de bord AWS Health](https://aws.amazon.com/premiumsupport/technology/personal-health-dashboard/). Ce tableau de bord affiche des alertes et des conseils de correction concernant les événements AWS susceptibles de vous affecter. Les clients disposant d'un plan de support Business ou Enterprise ont également accès à [l'API AWS Health](https://docs.aws.amazon.com/health/latest/ug/getting-started-api.html), permettant l'intégration à leurs systèmes de gestion des événements. 

 Sur AWS, vous pouvez [exporter vos données de journaux vers Amazon S3](https://docs.aws.amazon.com/AmazonCloudWatch/latest/logs/S3Export.html) ou [envoyer des journaux directement](https://docs.aws.amazon.com/AmazonCloudWatch/latest/logs/Sending-Logs-Directly-To-S3.html) to [Amazon S3](https://aws.amazon.com/s3/) pour un stockage à long terme. Avec [AWS Glue](https://aws.amazon.com/glue/), vous pouvez découvrir et préparer vos données de journaux dans Amazon S3 à des fins d'analyse, en stockant les métadonnées associées dans le [AWSAWS Glue Data Catalog](https://docs.aws.amazon.com/glue/latest/dg/populate-data-catalog.html). [Amazon Athena](https://aws.amazon.com/athena/)grâce à son intégration native à AWS Glue, peut ensuite être utilisé pour analyser vos données de journaux, en les interrogeant à l'aide de SQL standard. En utilisant un outil d'informatique décisionnelle comme [Quick](https://aws.amazon.com/quicksight/) vous pouvez visualiser, explorer et analyser vos données. 

 Une solution [alternative](https://aws.amazon.com/solutions/centralized-logging/?did=sl_card&trk=sl_card) consisterait à utiliser le [Amazon OpenSearch Service](https://aws.amazon.com/elasticsearch-service/) et [OpenSearch Dashboards](https://aws.amazon.com/elasticsearch-service/the-elk-stack/kibana/) pour collecter, analyser et afficher les journaux sur AWS dans plusieurs comptes et Régions AWS. 

 **Anti-modèles courants :** 
+  L'équipe de conception réseau vous demande le taux d'utilisation actuel de la bande passante du réseau. Vous fournissez les métriques actuelles. L’utilisation du réseau est à 35 %. Ils réduisent la capacité des circuits comme mesure d'économie, ce qui entraîne des problèmes de connectivité généralisés, car votre mesure ponctuelle ne reflète pas la tendance du taux d'utilisation. 
+  Votre routeur est défaillant. Il a enregistré des erreurs de mémoire non critiques à une fréquence de plus en plus élevée jusqu'à sa défaillance complète. Vous n'avez pas détecté cette tendance et, par conséquent, vous n'avez pas remplacé la mémoire défectueuse avant que le routeur ne provoque une interruption de service. 

 **Avantages liés au respect de cette bonne pratique :** En collectant et en analysant les mesures de votre charge de travail, vous comprenez mieux son état et vous pouvez avoir un aperçu des tendances qui peuvent avoir un impact sur la charge de travail ou sur la réalisation des résultats de votre entreprise. 

 **Niveau de risque exposé si cette bonne pratique n'est pas respectée :** Débit 

## Directives d'implémentation
<a name="implementation-guidance"></a>
+  Collecter et analyser les métriques de charge de travail : effectuez régulièrement des examens proactifs des métriques pour identifier les tendances et déterminer où des réponses appropriées sont nécessaires. 
  +  [Utilisation des métriques Amazon CloudWatch](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/working_with_metrics.html) 
  +  [Référence aux dimensions et métriques Amazon CloudWatch](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/CW_Support_For_AWS.html) 
  +  [Collecte des métriques et des journaux des instances Amazon EC2 et serveurs sur site avec l'agent CloudWatch](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/Install-CloudWatch-Agent.html) 

## Ressources
<a name="resources"></a>

 **Documents connexes :** 
+  [Amazon Athena](https://aws.amazon.com/athena/) 
+  [Référence aux dimensions et métriques Amazon CloudWatch](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/CW_Support_For_AWS.html) 
+  [Amazon DevOps Guru](https://docs.aws.amazon.com/devops-guru/latest/userguide/welcome.html) 
+  [AWS Glue](https://aws.amazon.com/glue/) 
+  [AWSAWS Glue Data Catalog](https://docs.aws.amazon.com/glue/latest/dg/populate-data-catalog.html) 
+  [Amazon OpenSearch Service](https://aws.amazon.com/elasticsearch-service/) 
+  [Tableau de bord AWS Health](https://aws.amazon.com/premiumsupport/technology/personal-health-dashboard/) 
+  [Quick](https://aws.amazon.com/quicksight/) 
+  [Collecte des métriques et des journaux des instances Amazon EC2 et serveurs sur site avec l'agent CloudWatch](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/Install-CloudWatch-Agent.html) 
+  [Utilisation des métriques Amazon CloudWatch](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/working_with_metrics.html) 

# OPS08-BP04 Définir des références de métriques de charge de travail
<a name="ops_workload_health_workload_metric_baselines"></a>

 Définissez des références pour les mesures afin de fournir les valeurs attendues comme base de comparaison et d'identification des composants sous-performants et sur-performants. Identifiez les seuils d'amélioration, d'investigation et d'intervention. 

 **Anti-modèles courants :** 
+  Un serveur utilise à 95 % la CPU et on vous demande si cette situation est bonne ou mauvaise. L'utilisation de la CPU du serveur n’a pas de références de base, et vous ne savez donc pas. 

 **Avantages liés au respect de cette bonne pratique :** En définissant des valeurs de métriques de base, vous êtes en mesure d'évaluer les valeurs des métriques actuelles et les tendances des métriques, afin de déterminer si une action est nécessaire. 

 **Niveau de risque exposé si cette bonne pratique n'est pas respectée :** Moyenne entreprise 

## Directives d'implémentation
<a name="implementation-guidance"></a>
+  Établir des références pour les métriques de charge de travail : : établissez des références pour les métriques de charge de travail afin de fournir des valeurs attendues comme base de comparaisons. 
  +  [Création d'alarmes Amazon CloudWatch](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/AlarmThatSendsEmail.html) 

## Ressources
<a name="resources"></a>

 **Documents connexes :** 
+  [Création d'alarmes Amazon CloudWatch](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/AlarmThatSendsEmail.html) 

# OPS08-BP05 Découvrir des modèles d'activité attendus pour la charge de travail
<a name="ops_workload_health_learn_workload_usage_patterns"></a>

 Établissez des modèles d'activité de la charge de travail pour identifier les comportements anormaux afin que vous puissiez réagir de manière appropriée si nécessaire. 

 CloudWatch via la [fonctionnalité de détection des anomalies CloudWatch,](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/CloudWatch_Anomaly_Detection.html) applique des algorithmes statistiques et de machine learning pour générer une plage de valeurs attendues représentative du comportement métrique normal. 

 [Amazon DevOps Guru](https://docs.aws.amazon.com/devops-guru/latest/userguide/welcome.html) peut être utilisé pour identifier un comportement anormal grâce à la corrélation des événements, à l'analyse des journaux et à l'application du machine learning pour analyser la télémétrie de votre charge de travail. Lorsque des comportements inattendus sont détectés, il fournit [les métriques et les événements associés](https://docs.aws.amazon.com/devops-guru/latest/userguide/understanding-insights-console.html) avec des recommandations pour résoudre le comportement. 

 **Anti-modèles courants :** 
+  Vous examinez les journaux d'utilisation du réseau et vous constatez que l'utilisation du réseau a augmenté entre 11h30 et 13h30 et entre 16h30 et 18h00. Vous ne savez pas si cette situation est normale ou non. 
+  Vos serveurs Web redémarrent tous les soirs à 3 h du matin. Vous ne savez pas s'il s'agit d'un comportement normal. 

 **Avantages liés au respect de cette bonne pratique :** En apprenant des modèles de comportement, vous pouvez reconnaître un comportement inattendu et prendre des mesures si nécessaire. 

 **Niveau de risque exposé si cette bonne pratique n'est pas respectée :** Moyenne entreprise 

## Directives d'implémentation
<a name="implementation-guidance"></a>
+  Découvrir des modèles d'activité attendus pour la charge de travail : définissez des modèles d'activité de charge de travail pour déterminer quand un comportement ne correspond pas aux valeurs attendues, afin de pouvoir répondre de manière appropriée si nécessaire. 

## Ressources
<a name="resources"></a>

 **Documents connexes :** 
+  [Amazon DevOps Guru](https://docs.aws.amazon.com/devops-guru/latest/userguide/welcome.html) 
+  [fonctionnalité de détection des anomalies CloudWatch,](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/CloudWatch_Anomaly_Detection.html) 

# OPS08-BP06 Signaler les menaces pesant sur les résultats de la charge de travail
<a name="ops_workload_health_workload_outcome_alerts"></a>

 Déclenchez une alerte quand une menace pèse sur les résultats de la charge de travail, afin de pouvoir répondre de manière appropriée si nécessaire. 

 Idéalement, vous avez déjà identifié un seuil de métriques en fonction duquel configurer une alarme ou un événement qui déclenchera une réponse automatique. 

 Sur AWS, vous pouvez utiliser [Amazon CloudWatch Synthetics](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/CloudWatch_Synthetics_Canaries.html) pour créer des scripts Canary permettant de surveiller vos points de terminaison et vos API en effectuant les mêmes actions que vos clients. La télémétrie générée et les [informations obtenues](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/CloudWatch_Synthetics_Canaries_Details.html) peuvent vous permettre d'identifier les problèmes avant que vos clients ne soient affectés. 

 Vous pouvez également utiliser [CloudWatch Logs Insights](https://docs.aws.amazon.com/AmazonCloudWatch/latest/logs/AnalyzingLogData.html) pour rechercher et analyser de façon interactive vos données de journaux à l'aide d'un langage de requête dédié. CloudWatch Logs Insights [détecte automatiquement les champs dans les journaux](https://docs.aws.amazon.com/AmazonCloudWatch/latest/logs/CWL_AnalyzeLogData-discoverable-fields.html) à partir des services AWS et des événements de journaux personnalisés au format JSON. Il s'adapte à votre volume de journaux et à la complexité des demandes et vous donne des réponses en quelques secondes, ce qui vous aide à rechercher les facteurs contribuant à un incident. 

 **Anti-modèles courants :** 
+  Vous n'avez aucune connectivité réseau. Personne ne le sait. Personne ne tente d'identifier pourquoi ni de prendre des mesures pour restaurer la connectivité. 
+  Suite à un correctif, vos instances persistantes sont devenues indisponibles, ce qui perturbe les utilisateurs. Vos utilisateurs ont ouvert des demandes de support. Personne n'a été informé. Personne ne prend de mesures. 

 **Avantages liés au respect de cette bonne pratique :** En identifiant que les résultats opérationnels sont menacés et en vous avertissant des mesures à prendre, vous avez la possibilité de prévenir ou d'atténuer l'impact d'un incident. 

 **Niveau de risque exposé si cette bonne pratique n'est pas respectée :** Moyenne entreprise 

## Directives d'implémentation
<a name="implementation-guidance"></a>
+  Signaler les menaces pesant sur les résultats de la charge de travail : déclenchez une alerte lorsque la réalisation des résultats de la charge de travail est en péril afin de pouvoir réagir de manière appropriée si nécessaire. 
  +  [Qu'est-ce que Amazon CloudWatch Events ?](https://docs.aws.amazon.com/AmazonCloudWatch/latest/events/WhatIsCloudWatchEvents.html) 
  +  [Création d'alarmes Amazon CloudWatch](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/AlarmThatSendsEmail.html) 
  +  [Appel des fonctions Lambda avec les notifications Amazon SNS](https://docs.aws.amazon.com/sns/latest/dg/sns-lambda.html) 

## Ressources
<a name="resources"></a>

 **Documents connexes :** 
+  [Amazon CloudWatch Synthetics](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/CloudWatch_Synthetics_Canaries.html) 
+  [CloudWatch Logs Insights](https://docs.aws.amazon.com/AmazonCloudWatch/latest/logs/AnalyzingLogData.html) 
+  [Création d'alarmes Amazon CloudWatch](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/AlarmThatSendsEmail.html) 
+  [Appel des fonctions Lambda avec les notifications Amazon SNS](https://docs.aws.amazon.com/sns/latest/dg/sns-lambda.html) 
+  [Qu'est-ce que Amazon CloudWatch Events ?](https://docs.aws.amazon.com/AmazonCloudWatch/latest/events/WhatIsCloudWatchEvents.html) 

# OPS08-BP07 Signaler la détection d'anomalies dans la charge de travail
<a name="ops_workload_health_workload_anomaly_alerts"></a>

 Déclenchez une alerte lorsque des anomalies dans la charge de travail sont détectées afin de pouvoir réagir de manière appropriée si nécessaire. 

 L'analyse de vos métriques de charge de travail au fil du temps peut permettre d'établir des schémas de comportement que vous pouvez quantifier assez précisément pour définir un événement ou déclencher une alarme en réponse. 

 Une fois entraînée, la fonctionnalité [fonctionnalité de détection des anomalies CloudWatch,](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/CloudWatch_Anomaly_Detection.html) peut être utilisée pour [donner l'alerte](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/Create_Anomaly_Detection_Alarm.html) sur les anomalies détectées ou peut fournir des valeurs attendues superposées sur un [graphique](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/graph_a_metric.html#create-metric-graph) de données de métriques pour une comparaison continue. 

 **Anti-modèles courants :** 
+  Vos ventes sur le site Web de commerce grand public ont augmenté de façon soudaine et spectaculaire. Personne ne le sait. Personne ne tente d'identifier l'origine de cette poussée. Personne ne prend de mesures pour garantir des expériences client de qualité sous la charge supplémentaire. 
+  Suite à l'application d'un correctif, vos serveurs persistants redémarrent fréquemment et perturbent les utilisateurs. Vos serveurs redémarrent généralement jusqu'à trois fois, mais pas plus. Personne ne le sait. Personne ne tente d'identifier la raison pour laquelle cela se produit. 

 **Avantages liés au respect de cette bonne pratique :** En comprenant les modèles de comportement de la charge de travail, vous pouvez identifier les comportements inattendus et prendre des mesures si nécessaire. 

 **Niveau de risque exposé si cette bonne pratique n'est pas respectée :** Faible 

## Directives d'implémentation
<a name="implementation-guidance"></a>
+  Signaler la détection d'anomalies dans la charge de travail : déclenchez une alerte lorsque des anomalies de charge de travail sont détectées afin de pouvoir réagir de manière appropriée si nécessaire. 
  +  [Qu'est-ce que Amazon CloudWatch Events ?](https://docs.aws.amazon.com/AmazonCloudWatch/latest/events/WhatIsCloudWatchEvents.html) 
  +  [Création d'alarmes Amazon CloudWatch](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/AlarmThatSendsEmail.html) 
  +  [Appel des fonctions Lambda avec les notifications Amazon SNS](https://docs.aws.amazon.com/sns/latest/dg/sns-lambda.html) 

## Ressources
<a name="resources"></a>

 **Documents connexes :** 
+  [Création d'alarmes Amazon CloudWatch](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/AlarmThatSendsEmail.html) 
+  [fonctionnalité de détection des anomalies CloudWatch,](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/CloudWatch_Anomaly_Detection.html) 
+  [Appel des fonctions Lambda avec les notifications Amazon SNS](https://docs.aws.amazon.com/sns/latest/dg/sns-lambda.html) 
+  [Qu'est-ce que Amazon CloudWatch Events ?](https://docs.aws.amazon.com/AmazonCloudWatch/latest/events/WhatIsCloudWatchEvents.html) 

# OPS08-BP08 Confirmer la réalisation des résultats et l'efficacité des KPI et des métriques
<a name="ops_workload_health_biz_level_view_workload"></a>

 Créez une vue des opérations de la charge de travail au niveau de l'entreprise, afin de déterminer si vous répondez aux besoins et d'identifier les domaines ayant besoin d'être améliorés pour atteindre les objectifs commerciaux. Validez l'efficacité des KPI et des métriques et vérifiez-les si nécessaire. 

 AWS prend également en charge des systèmes d'analyse de journaux et des outils d'informatique décisionnelle tiers via les API de service AWS et les kits SDK (par exemple, Grafana, Kibana et Logstash). 

 **Anti-modèles courants :** 
+  Le temps de réponse de la page n'a jamais été considéré comme un contributeur à la satisfaction des clients. Vous n'avez jamais défini de métrique ou de seuil pour le temps de réponse de la page. Vos clients se plaignent de la « lenteur ». 
+  Vous n'avez pas atteint vos objectifs de temps de réponse minimum. Afin d'améliorer le temps de réponse, vous avez mis à l'échelle vos serveurs d'applications. Vous dépassez désormais d'une marge significative les objectifs de temps de réponse et vous disposez également d'une capacité inutilisée importante pour laquelle vous payez. 

 **Avantages liés au respect de cette bonne pratique :** En examinant et en vérifiant les KPI et les métriques, vous comprenez comment votre charge de travail soutient la réalisation de des résultats commerciaux, et vous pouvez identifier les points à améliorer pour atteindre les objectifs commerciaux. 

 **Niveau de risque exposé si cette bonne pratique n'est pas respectée :** Faible 

## Directives d'implémentation
<a name="implementation-guidance"></a>
+  Confirmer la réalisation des résultats et l'efficacité des KPI et des métriques : créez une vue à l'échelle de l'entreprise des opérations de votre charge de travail pour vous aider à déterminer si vous répondez à vos besoins et identifier les domaines qui doivent être améliorés pour atteindre vos objectifs métier. Validez l'efficacité des KPI et des métriques et vérifiez-les si nécessaire. 
  +  [Fonctionnement des tableaux de bord Amazon CloudWatch](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/CloudWatch_Dashboards.html) 
  +  [Qu'est-ce que l'analytique des journaux ?](https://aws.amazon.com/log-analytics/) 

## Ressources
<a name="resources"></a>

 **Documents connexes :** 
+  [Fonctionnement des tableaux de bord Amazon CloudWatch](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/CloudWatch_Dashboards.html) 
+  [Qu'est-ce que l'analytique des journaux ?](https://aws.amazon.com/log-analytics/) 

# OPS 9  Comment comprendre l'état de vos opérations ?
<a name="w2aac19b5b9b7"></a>

 Définissez, capturez et analysez les métriques des opérations pour obtenir une visibilité sur les événements des opérations afin de pouvoir prendre des mesures appropriées. 

**Topics**
+ [OPS09-BP01 Identifier les indicateurs clés de performance](ops_operations_health_define_ops_kpis.md)
+ [OPS09-BP02 Définir des métriques pour les opérations](ops_operations_health_design_ops_metrics.md)
+ [OPS09-BP03 Collecter et analyser les métriques des opérations](ops_operations_health_collect_analyze_ops_metrics.md)
+ [OPS09-BP04 Établir des références pour les métriques des opérations](ops_operations_health_ops_metric_baselines.md)
+ [OPS09-BP05 Découvrir les modèles d'activité attendus pour les opérations](ops_operations_health_learn_ops_usage_patterns.md)
+ [OPS09-BP06 Signaler les menaces pesant sur les résultats des opérations](ops_operations_health_ops_outcome_alerts.md)
+ [OPS09-BP07 Signaler la détection d'anomalies dans les opérations](ops_operations_health_ops_anomaly_alerts.md)
+ [OPS09-BP08 Confirmer la réalisation des résultats et l'efficacité des KPI et des métriques](ops_operations_health_biz_level_view_ops.md)

# OPS09-BP01 Identifier les indicateurs clés de performance
<a name="ops_operations_health_define_ops_kpis"></a>

 Identifier les indicateurs clés de performance : identifiez les indicateurs clés de performances (KPI) en fonction de l'activité souhaitée (par exemple, les nouvelles fonctionnalités fournies) et des résultats clients (par exemple, les demandes de support client). Évaluez les KPI pour déterminer la réussite des opérations. 

 **Anti-modèles courants :** 
+  La direction de l’entreprise vous demande comment les opérations permettent d’atteindre les objectifs de l'entreprise, mais vous n'avez pas de cadre de référence pour déterminer le succès. 
+  Vous ne pouvez pas déterminer si vos fenêtres de maintenance ont un impact sur les résultats de l’entreprise. 

 **Avantages liés au respect de cette bonne pratique :** En identifiant des indicateurs clés de performance, vous permettez d'atteindre les résultats opérationnels comme test d’état et de succès de vos opérations. 

 **Niveau de risque exposé si cette bonne pratique n'est pas respectée :** Débit 

## Directives d'implémentation
<a name="implementation-guidance"></a>
+  Identifiez les indicateurs clés de performance (KPI) en fonction des résultats désirés pour l'entreprise et le client. Évaluez les KPI pour déterminer la réussite des opérations. 

# OPS09-BP02 Définir des métriques pour les opérations
<a name="ops_operations_health_design_ops_metrics"></a>

 Définissez des métriques pour les opérations pour mesurer la réalisation des KPI (par exemple, déploiements réussis et déploiements ayant échoué). Définissez des métriques pour les opérations pour mesurer l’état des activités opérationnelles (par exemple, temps moyen de détection d'un incident (MTTD), et temps moyen de reprise après incident (MTTR)). Évaluez les paramètres pour déterminer si les opérations atteignent les résultats souhaités, et pour comprendre l’état des activités de vos opérations. 

 **Anti-modèles courants :** 
+  Vos métriques d'opérations sont basées sur ce que l'équipe estime raisonnable. 
+  Vos calculs de métriques comportent des erreurs qui donneront des résultats incorrects. 
+  Vous n'avez aucune métrique définie pour vos activités d'opérations. 

 **Avantages liés au respect de cette bonne pratique :** En définissant et en évaluant les métriques des opérations, vous pouvez déterminer l’état de vos activités opérationnelles et mesurer les résultats obtenus. 

 **Niveau de risque exposé si cette bonne pratique n'est pas respectée :** Débit 

## Directives d'implémentation
<a name="implementation-guidance"></a>
+  Définir des métriques pour les opérations : définissez les métriques des opérations pour mesurer la réalisation des KPI. Définissez les métriques des opérations pour mesurer l'état des opérations et leurs activités. Évaluez les métriques pour déterminer si les opérations atteignent les résultats souhaités et pour comprendre l'état des opérations. 
  +  [Publier des métriques personnalisées](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/publishingMetrics.html) 
  +  [Recherche et filtrage des données de journaux](https://docs.aws.amazon.com/AmazonCloudWatch/latest/logs/MonitoringLogData.html) 
  +  [Référence aux dimensions et métriques Amazon CloudWatch](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/CW_Support_For_AWS.html) 

## Ressources
<a name="resources"></a>

 **Documents connexes :** 
+  [AWS Answers : journalisation centralisée](https://aws.amazon.com/answers/logging/centralized-logging/) 
+  [Référence aux dimensions et métriques Amazon CloudWatch](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/CW_Support_For_AWS.html) 
+  [Détecter les changements d'état du pipeline et réagir en conséquence avec Amazon CloudWatch Events](https://docs.aws.amazon.com/codepipeline/latest/userguide/detect-state-changes-cloudwatch-events.html) 
+  [Publier des métriques personnalisées](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/publishingMetrics.html) 
+  [Recherche et filtrage des données de journaux](https://docs.aws.amazon.com/AmazonCloudWatch/latest/logs/MonitoringLogData.html) 

 **Vidéos connexes :** 
+  Élaborer un plan de surveillance 

# OPS09-BP03 Collecter et analyser les métriques des opérations
<a name="ops_operations_health_collect_analyze_ops_metrics"></a>

 Effectuez des examens réguliers et proactifs des mesures afin d'identifier les tendances et de déterminer les cas où des réponses appropriées sont nécessaires. 

 Vous devez regrouper les données de journaux issues de l'exécution de vos activités et appels d'API opérationnels dans un service tel que CloudWatch Logs. Générez des métriques à partir des observations du contenu nécessaire des journaux pour obtenir des informations sur les performances des activités opérationnelles. 

 Sur AWS, vous pouvez [exporter vos données de journaux vers Amazon S3](https://docs.aws.amazon.com/AmazonCloudWatch/latest/logs/S3Export.html) ou [envoyer des journaux directement](https://docs.aws.amazon.com/AmazonCloudWatch/latest/logs/Sending-Logs-Directly-To-S3.html) to [Amazon S3](https://aws.amazon.com/s3/) pour un stockage à long terme. Avec [AWS Glue](https://aws.amazon.com/glue/), vous pouvez découvrir et préparer vos données de journaux dans Amazon S3 à des fins d'analyse, en stockant les métadonnées associées dans le [AWSAWS Glue Data Catalog](https://docs.aws.amazon.com/glue/latest/dg/populate-data-catalog.html). [Amazon Athena](https://aws.amazon.com/athena/)grâce à son intégration native à AWS Glue, peut ensuite être utilisé pour analyser vos données de journaux, en les interrogeant à l'aide de SQL standard. En utilisant un outil d'informatique décisionnelle comme [Quick](https://aws.amazon.com/quicksight/) vous pouvez visualiser, explorer et analyser vos données. 

 **Anti-modèles courants :** 
+  La fourniture constante de nouvelles fonctions est considérée comme un indicateur clé de performance. Vous n'avez aucune méthode pour mesurer la fréquence des déploiements. 
+  Vous enregistrez les déploiements, les déploiements annulés, les correctifs et les correctifs annulés pour suivre les activités de vos opérations, mais personne ne vérifie les métriques. 
+  Vous avez un objectif de temps de récupération de 15 minutes pour restaurer les bases de données perdues, qui a été défini lorsque le système a été déployé et n'avait pas d'utilisateurs. Vous avez maintenant dix mille utilisateurs et votre activité existe depuis deux ans. Une restauration récente a pris plus de deux heures. Cela n'a pas été enregistré et personne n'en est informé. 

 **Avantages liés au respect de cette bonne pratique :** En collectant et en analysant les métriques de vos opérations, vous comprenez mieux l'état de vos opérations et pouvez disposer d'un aperçu des tendances qui peuvent avoir un impact sur vos opérations ou la réalisation des résultats de votre entreprise. 

 **Niveau de risque exposé si cette bonne pratique n'est pas respectée :** Débit 

## Directives d'implémentation
<a name="implementation-guidance"></a>
+  Collecter et analyser les métriques des opérations : effectuez régulièrement des évaluations proactives des métriques pour identifier les tendances et déterminer où des réponses appropriées sont nécessaires. 
  +  [Utilisation des métriques Amazon CloudWatch](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/working_with_metrics.html) 
  +  [Référence aux dimensions et métriques Amazon CloudWatch](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/CW_Support_For_AWS.html) 
  +  [Collecte des métriques et des journaux des instances Amazon EC2 et serveurs sur site avec l'agent CloudWatch](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/Install-CloudWatch-Agent.html) 

## Ressources
<a name="resources"></a>

 **Documents connexes :** 
+  [Amazon Athena](https://aws.amazon.com/athena/) 
+  [Référence aux dimensions et métriques Amazon CloudWatch](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/CW_Support_For_AWS.html) 
+  [Quick](https://aws.amazon.com/quicksight/) 
+  [AWS Glue](https://aws.amazon.com/glue/) 
+  [AWSAWS Glue Data Catalog](https://docs.aws.amazon.com/glue/latest/dg/populate-data-catalog.html) 
+  [Collecte des métriques et des journaux des instances Amazon EC2 et serveurs sur site avec l'agent CloudWatch](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/Install-CloudWatch-Agent.html) 
+  [Utilisation des métriques Amazon CloudWatch](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/working_with_metrics.html) 

# OPS09-BP04 Établir des références pour les métriques des opérations
<a name="ops_operations_health_ops_metric_baselines"></a>

 Établissez des bases de référence afin de fournir les valeurs attendues comme base de comparaison et d'identification des activités opérationnelles sous et sur-performantes. 

 **Anti-modèles courants :** 
+  On vous a demandé quel est le délai prévu pour le déploiement. Vous n'avez pas mesuré le temps nécessaire au déploiement et vous ne pouvez pas déterminer le délai prévu. 
+  On vous a demandé combien de temps il faut pour reprendre les opérations à la suite d'un problème avec les serveurs d'applications. Vous n'avez aucune information sur le délai de reprise du premier contact du client. Vous n'avez aucune information sur le temps de reprise à partir de la première identification d'un problème via la surveillance. 
+  On vous a demandé quel est l’effectif du personnel de support pendant le week-end. Vous n'avez aucune idée du nombre type de dossiers de support au cours d’un week-end et vous ne pouvez pas fournir d'estimation. 
+  Vous avez un objectif de temps de récupération de 15 minutes pour restaurer les bases de données perdues, qui a été défini lorsque le système a été déployé et n'avait pas d'utilisateurs. Vous avez maintenant dix mille utilisateurs et votre activité existe depuis deux ans. Vous n'avez aucune information sur la façon dont le délai de restauration a changé pour votre base de données. 

 **Avantages liés au respect de cette bonne pratique :** En définissant des valeurs de métriques de base, vous êtes en mesure d'évaluer les valeurs des métriques actuelles et les tendances des métriques, afin de déterminer si une action est nécessaire. 

 **Niveau de risque exposé si cette bonne pratique n'est pas respectée :** Moyenne entreprise 

## Directives d'implémentation
<a name="implementation-guidance"></a>
+  Découvrir des modèles d'activité attendus pour les opérations : définissez des modèles d'activité pour les opérations pour déterminer quand un comportement ne correspond pas aux valeurs attendues, afin de pouvoir répondre de manière appropriée si nécessaire. 

# OPS09-BP05 Découvrir les modèles d'activité attendus pour les opérations
<a name="ops_operations_health_learn_ops_usage_patterns"></a>

 Définissez des modèles d'activités opérationnelles pour identifier les activités anormales afin de pouvoir réagir de manière appropriée si nécessaire. 

 **Anti-modèles courants :** 
+  Votre taux d'échec de déploiement a considérablement augmenté récemment. Vous traitez chacune des défaillances de manière indépendante. Vous ne vous rendez pas compte que les défaillances correspondent aux déploiements effectués par un nouvel employé qui ne maîtrise pas le système de gestion des déploiements. 

 **Avantages liés au respect de cette bonne pratique :** En vous familiarisant avec les modèles de comportement, vous pouvez reconnaître un comportement inattendu et prendre des mesures si nécessaire. 

 **Niveau de risque exposé si cette bonne pratique n'est pas respectée :** Moyenne entreprise 

## Directives d'implémentation
<a name="implementation-guidance"></a>
+  Découvrir des modèles d'activité attendus pour les opérations : définissez des modèles d'activité pour les opérations pour déterminer quand un comportement ne correspond pas aux valeurs attendues, afin de pouvoir répondre de manière appropriée si nécessaire. 

# OPS09-BP06 Signaler les menaces pesant sur les résultats des opérations
<a name="ops_operations_health_ops_outcome_alerts"></a>

 Chaque fois que les résultats des opérations sont menacés, une alerte doit être émise et impliquer des mesures concrètes. Les résultats des opérations sont toute activité qui accompagne une charge de travail en production. Cela comprend toutes les activités, du déploiement de nouvelles versions d'applications à la récupération après une panne. Les résultats des opérations doivent être traités avec la même importance que les résultats métier. 

Les équipes chargées des logiciels doivent identifier les principales métriques et activités des opérations, et créer des alertes les concernant. Les alertes doivent être rapides et exploitables. Si une alerte est émise, une référence à un runbook ou un playbook correspondant doit être incluse. Les alertes sans action correspondante peuvent entraîner une lassitude.

 **Résultat souhaité :** lorsque des activités d'opérations sont à risque, des alertes sont envoyées pour entraîner une action. Les alertes contiennent le contexte expliquant pourquoi une alerte est déclenchée et pointent vers un playbook pour une analyse ou un runbook pour une atténuation. Lorsque c'est possible, les runbooks sont automatisés et des notifications sont envoyées. 

 **Anti-modèles courants :** 
+ Vous analysez un incident et des demandes de support sont déposées. Les demandent de support enfreignent le contrat de niveau de service (SLA), mais aucune alerte n'est remontée. 
+ Un déploiement en production prévu à minuit est retardé en raison de changements de code de dernière minute. Aucune alerte n'est déclenchée et le déploiement est suspendu.
+ Une panne de production se produit, mais aucune alerte n'est envoyée.
+  Votre temps de déploiement dépasse toujours les estimations. Aucune mesure n'est prise pour analyser la situation. 

 **Avantages liés au respect de cette bonne pratique :** 
+  Le fait d'émettre une alerte lorsque les résultats des opérations sont à risque augmente votre capacité de gestion de votre charge de travail en gardant une longueur d'avance sur les problèmes. 
+  Les résultats métier s'améliorent grâce à des résultats d'opérations sains. 
+  La détection et la correction des problèmes d'opérations sont améliorées. 
+  L'intégrité globale des opérations est améliorée. 

 **Niveau d'exposition au risque si cette bonne pratique n'est pas respectée :** Moyen 

## Directives d'implémentation
<a name="implementation-guidance"></a>

 Les résultats des opérations doivent être définis avant que vous puissiez émettre une alerte les concernant. Commencez par définir les activités d'opérations les plus importantes pour votre organisation. Est-ce un déploiement en production en moins de deux heures ou répondre à une demande de support dans un délai donné ? Votre organisation doit définir les principales activités d'opérations et la façon dont elles sont mesurées afin de permettre leur surveillance, leur amélioration et l'émission d'alertes les concernant. Vous avez besoin d'un emplacement central où la charge de travail et les opérations de télémétrie sont stockées et analysées. Le même mécanisme doit pouvoir émettre une alerte lorsqu'un résultat d'opération est menacé. 

 **Exemple client** 

 Une alarme CloudWatch a été déclenchée lors d'un déploiement courant chez AnyCompany Retail. Le délai de déploiement a été dépassé. Amazon EventBridge a créé un OpsItem dans AWS Systems Manager OpsCenter. L'équipe chargée des opérations dans le cloud a utilisé un playbook pour analyser le problème et a constaté qu'un changement de schéma prenait plus de temps que prévu. Elle a alerté le développeur d'astreinte et a continué à surveiller le déploiement. Une fois le déploiement terminé, elle a résolu l'OpsItem. L'équipe analysera l'incident lors d'une étude post-mortem. 

## Étapes d'implémentation
<a name="implementation-steps"></a>

1. Si vous n'avez pas identifié les KPI, les métriques et les activités des opérations, implémentez les bonnes pratiques précédentes pour cette question (OPS09-BP01 à OPS09-BP05). 
   +  Les clients Support [bénéficiant d'un Entreprise Support](https://aws.amazon.com/premiumsupport/plans/enterprise/) peuvent demander [l'Operations KPI Workshop](https://aws.amazon.com/premiumsupport/technology-and-programs/proactive-services/#Operational_Workshops_and_Deep_Dives) à leur gestionnaire de compte technique. Cet atelier collaboratif, proposé sans encourir de frais supplémentaires, vous aide à définir les KPI et les métriques des opérations alignés sur les objectifs métier. Contactez votre gestionnaire de compte technique pour en savoir plus. 

1.  Une fois les activités, les KPI et les métriques des opérations établis, configurez les alertes dans votre plateforme d'observabilité. Les alertes doivent être accompagnées d'une action, comme un playbook ou un runbook. Évitez les alertes sans action. 

1.  Au fil du temps, vous devez évaluer vos métriques, vos KPI et vos activités d'opérations afin d'identifier les points à améliorer. Capturez les rétroactions des opérateurs dans les runbooks et les playbooks afin d'identifier les points à améliorer dans le cadre des réponses aux alertes. 

1.  Les alertes doivent comprendre un mécanisme permettant de signaler les faux positifs. Cela doit entraîner un examen des seuils de la métrique. 

 **Niveau d'effort du plan d'implémentation :** moyen. Plusieurs bonnes pratiques doivent être mises en place avant l'implémentation de cette bonne pratique. Une fois que les activités des opérations ont été déterminées et que les KPI des opérations ont été établis, les alertes doivent être établies. 

## Ressources
<a name="resources"></a>

 **Bonnes pratiques associées :** 
+  [OPS02-BP03 Les activités opérationnelles ont des propriétaires identifiés responsables de leurs performances](ops_ops_model_def_activity_owners.md) : chaque activité et chaque résultat d'opération doivent avoir un propriétaire identifié qui est responsable. C'est la personne qui doit être alertée lorsque des risques pèsent sur les résultats. 
+  [OPS03-BP02 Les membres de l'équipe sont habilités à agir lorsque les résultats sont remis en cause](ops_org_culture_team_emp_take_action.md) : lorsque des alertes sont émises, votre équipe doit disposer d'une agence qui agira pour remédier au problème. 
+  [OPS09-BP01 Identifier les indicateurs clés de performance](ops_operations_health_define_ops_kpis.md) : l'émission d'une alerte pour des résultats d'opérations commence par l'identification des KPI d'opérations. 
+  [OPS09-BP02 Définir des métriques pour les opérations](ops_operations_health_design_ops_metrics.md) : établissez cette bonne pratique avant de commencer à générer des alertes. 
+  [OPS09-BP03 Collecter et analyser les métriques des opérations](ops_operations_health_collect_analyze_ops_metrics.md) : la collecte centralisée des métriques d'opérations est nécessaire pour créer des alertes. 
+  [OPS09-BP04 Établir des références pour les métriques des opérations](ops_operations_health_ops_metric_baselines.md) : les métriques d'opérations permettent d'ajuster les alertes et d'éviter la lassitude liée à ces dernières. 
+  [OPS09-BP05 Découvrir les modèles d'activité attendus pour les opérations](ops_operations_health_learn_ops_usage_patterns.md) : vous pouvez améliorer la précision de vos alertes en comprenant les modèles d'activité pour les événements liés aux opérations. 
+  [OPS09-BP08 Confirmer la réalisation des résultats et l'efficacité des KPI et des métriques](ops_operations_health_biz_level_view_ops.md) : évaluez la réalisation des résultats d'opérations afin de vous assurer que vos KPI et vos métriques sont valides. 
+  [OPS10-BP02 Disposer d'un processus par alerte](ops_event_response_process_per_alert.md) : chaque alerte doit être associée à un runbook ou un playbook et indiquer le contexte pour la personne alertée. 
+  [OPS11-BP02 Effectuer une analyse post-incident](ops_evolve_ops_perform_rca_process.md) : effectuez une analyse après l'incident afin d'identifier les points à améliorer. 

 **Documents connexes :** 
+  [AWS Deployment Pipelines Reference Architecture: Application Pipeline Architecture](https://pipelines.devops.aws.dev/application-pipeline/) 
+  [GitLab: Getting Started with Agile / DevOps Metrics](https://about.gitlab.com/handbook/marketing/strategic-marketing/devops-metrics/) 

 **Vidéos connexes :** 
+  [Aggregate and Resolve Operational Issues Using AWS Systems Manager OpsCenter](https://www.youtube.com/watch?v=r6ilQdxLcqY) 
+  [Integrate AWS Systems Manager OpsCenter with Amazon CloudWatch Alarms](https://www.youtube.com/watch?v=Gpc7a5kVakI) 
+  [Integrate Your Data Sources into AWS Systems Manager OpsCenter Using Amazon EventBridge](https://www.youtube.com/watch?v=Xmmu5mMsq3c) 

 **Exemples connexes :** 
+  [Automate remediation actions for Amazon EC2 notifications and beyond using Amazon EC2 Systems Manager Automation and AWS Health](https://aws.amazon.com/blogs/mt/automate-remediation-actions-for-amazon-ec2-notifications-and-beyond-using-ec2-systems-manager-automation-and-aws-health/) 
+  [AWS Management and Governance Tools Workshop - Operations 2022](https://mng.workshop.aws/operations-2022.html) 
+  [Ingesting, analyzing, and visualizing metrics with DevOps Monitoring Dashboard on AWS](https://docs.aws.amazon.com/solutions/latest/devops-monitoring-dashboard-on-aws/welcome.html) 

 **Services associés :** 
+  [Amazon EventBridge](https://docs.aws.amazon.com/eventbridge/latest/userguide/eb-what-is.html) 
+  [Support Proactive Services - Operations KPI Workshop](https://aws.amazon.com/premiumsupport/technology-and-programs/proactive-services/#Operational_Workshops_and_Deep_Dives) 
+  [AWS Systems Manager OpsCenter](https://docs.aws.amazon.com/systems-manager/latest/userguide/OpsCenter.html) 
+  [CloudWatch Events](https://docs.aws.amazon.com/AmazonCloudWatch/latest/events/WhatIsCloudWatchEvents.html) 

# OPS09-BP07 Signaler la détection d'anomalies dans les opérations
<a name="ops_operations_health_ops_anomaly_alerts"></a>

 Déclenchez une alerte quand des anomalies sont détectées dans les opérations, afin de pouvoir répondre de manière appropriée si nécessaire. 

 L'analyse de vos métriques opérationnelles au fil du temps peut permettre d'établir des schémas de comportement que vous pouvez quantifier assez précisément pour définir un événement ou déclencher une alarme en réponse. 

 Une fois entraînée, la fonctionnalité [fonctionnalité de détection des anomalies CloudWatch,](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/CloudWatch_Anomaly_Detection.html) peut être utilisée pour [donner l'alerte](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/Create_Anomaly_Detection_Alarm.html) sur les anomalies détectées ou peut fournir des valeurs attendues superposées sur un [graphique](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/graph_a_metric.html#create-metric-graph) de données de métriques pour une comparaison continue. 

 [Amazon DevOps Guru](https://docs.aws.amazon.com/devops-guru/latest/userguide/welcome.html) peut être utilisé pour identifier un comportement anormal grâce à la corrélation des événements, à l'analyse des journaux et à l'application du machine learning pour analyser la télémétrie de votre charge de travail. La [insights](https://docs.aws.amazon.com/devops-guru/latest/userguide/understanding-insights-console.html) générés sont présentés avec les données et les recommandations pertinentes. 

 **Anti-modèles courants :** 
+  Vous appliquez un correctif à votre flotte d'instances. Vous avez testé le correctif avec succès dans l'environnement de test. Le correctif échoue pour un pourcentage élevé d'instances de votre flotte. Vous ne faites rien. 
+  Vous notez que des déploiements sont prévus à partir de vendredi en fin journée. Votre organisation a des fenêtres de maintenance prédéfinies les mardis et jeudis. Vous ne faites rien. 

 **Avantages liés au respect de cette bonne pratique :** En comprenant les modèles de comportement des opérations, vous pouvez identifier les comportements inattendus et prendre des mesures si nécessaire. 

 **Niveau de risque exposé si cette bonne pratique n'est pas respectée :** Faible 

## Directives d'implémentation
<a name="implementation-guidance"></a>
+  Signaler la détection d'anomalies dans les opérations : déclenchez une alerte lorsque des anomalies d'opération sont détectées afin de pouvoir réagir de manière appropriée si nécessaire. 
  +  [Qu'est-ce que Amazon CloudWatch Events ?](https://docs.aws.amazon.com/AmazonCloudWatch/latest/events/WhatIsCloudWatchEvents.html) 
  +  [Création d'alarmes Amazon CloudWatch](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/AlarmThatSendsEmail.html) 
  +  [Appel des fonctions Lambda avec les notifications Amazon SNS](https://docs.aws.amazon.com/sns/latest/dg/sns-lambda.html) 

## Ressources
<a name="resources"></a>

 **Documents connexes :** 
+  [Amazon DevOps Guru](https://docs.aws.amazon.com/devops-guru/latest/userguide/welcome.html) 
+  [fonctionnalité de détection des anomalies CloudWatch,](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/CloudWatch_Anomaly_Detection.html) 
+  [Création d'alarmes Amazon CloudWatch](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/AlarmThatSendsEmail.html) 
+  [Détecter les changements d'état du pipeline et réagir en conséquence avec Amazon CloudWatch Events](https://docs.aws.amazon.com/codepipeline/latest/userguide/detect-state-changes-cloudwatch-events.html) 
+  [Appel des fonctions Lambda avec les notifications Amazon SNS](https://docs.aws.amazon.com/sns/latest/dg/sns-lambda.html) 
+  [Qu'est-ce que Amazon CloudWatch Events ?](https://docs.aws.amazon.com/AmazonCloudWatch/latest/events/WhatIsCloudWatchEvents.html) 

# OPS09-BP08 Confirmer la réalisation des résultats et l'efficacité des KPI et des métriques
<a name="ops_operations_health_biz_level_view_ops"></a>

 Créez une vue des activités des opérations au niveau de l'entreprise pour vous aider à déterminer si vous répondez aux besoins et permettre d'identifier les domaines ayant besoin d'être améliorés pour atteindre les objectifs commerciaux. Validez l'efficacité des KPI et des métriques et vérifiez-les si nécessaire. 

 AWS prend également en charge des systèmes d'analyse de journaux et des outils d'informatique décisionnelle tiers via les API de service AWS et les kits SDK (par exemple, Grafana, Kibana et Logstash). 

 **Anti-modèles courants :** 
+  La fréquence de vos déploiements a augmenté avec l'augmentation du nombre d'équipes de développement. Le nombre de déploiements attendu est défini une fois par semaine. Vous déployez régulièrement tous les jours. Lorsqu'il existe un problème lié au système de déploiement et que les déploiements sont impossibles, la situation n’est pas détectée pendant plusieurs jours. 
+  Lorsque votre entreprise ne fournissait auparavant un support que pendant les heures de bureau du lundi au vendredi. Votre objectif de temps de réponse pour les incidents est le jour ouvré suivant. Récemment, vous avez commencé à proposer un support 24h/24, 7j/7 avec un objectif de temps de réponse de deux heures. Votre personnel de nuit est débordé et les clients sont mécontents. Rien n'indique qu'il existe un problème au niveau des délais d'intervention en cas d'incident puisque vous fonctionnez sur la base du jour ouvré suivant. 

 **Avantages liés au respect de cette bonne pratique :** En examinant et en vérifiant les KPI et les métriques, vous comprenez comment votre charge de travail soutient la réalisation de des résultats commerciaux, et vous pouvez identifier les points à améliorer pour atteindre les objectifs commerciaux. 

 **Niveau de risque exposé si cette bonne pratique n'est pas respectée :** Faible 

## Directives d'implémentation
<a name="implementation-guidance"></a>
+  Confirmer la réalisation des résultats et l'efficacité des KPI et des métriques : créez une vue à l'échelle de l'entreprise des activités opérationnelles pour vous aider à déterminer si vous répondez à vos besoins et identifier les domaines qui doivent être améliorés pour atteindre vos objectifs métier. Validez l'efficacité des KPI et des métriques et vérifiez-les si nécessaire. 
  +  [Fonctionnement des tableaux de bord Amazon CloudWatch](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/CloudWatch_Dashboards.html) 
  +  [Qu'est-ce que l'analytique des journaux ?](https://aws.amazon.com/log-analytics/) 

## Ressources
<a name="resources"></a>

 **Documents connexes :** 
+  [Fonctionnement des tableaux de bord Amazon CloudWatch](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/CloudWatch_Dashboards.html) 
+  [Qu'est-ce que l'analytique des journaux ?](https://aws.amazon.com/log-analytics/) 

# OPS 10  Comment gérer les événements relatifs à la charge de travail et aux opérations ?
<a name="w2aac19b5b9b9"></a>

 Préparez et validez des procédures de réponse aux événements afin de réduire leur effet disruptif sur votre charge de travail. 

**Topics**
+ [OPS10-BP01 Utiliser un processus pour la gestion des événements, des incidents et des problèmes](ops_event_response_event_incident_problem_process.md)
+ [OPS10-BP02 Disposer d'un processus par alerte](ops_event_response_process_per_alert.md)
+ [OPS10-BP03 Hiérarchiser les événements opérationnels en fonction de leur impact sur l'activité](ops_event_response_prioritize_events.md)
+ [OPS10-BP04 Définir l'acheminement hiérarchique](ops_event_response_define_escalation_paths.md)
+ [OPS10-BP05 Activer les notifications push](ops_event_response_push_notify.md)
+ [OPS10-BP06 Communiquer l'état grâce aux tableaux de bord](ops_event_response_dashboards.md)
+ [OPS10-BP07 Automatiser les réponses aux événements](ops_event_response_auto_event_response.md)

# OPS10-BP01 Utiliser un processus pour la gestion des événements, des incidents et des problèmes
<a name="ops_event_response_event_incident_problem_process"></a>

Votre entreprise dispose de processus pour gérer les événements, les incidents et les problèmes. *Événements* se produisent dans votre charge de travail, mais ne nécessitent pas d'intervention. *Les incidents* sont des événements qui nécessitent une intervention. *Les problèmes* sont des événements récurrents qui nécessitent une intervention ou ne peuvent pas être résolus. Vous avez besoin de processus pour réduire l'impact de ces événements sur votre entreprise et répondre de manière adaptée.

Lorsque des incidents et des problèmes se produisent dans votre charge de travail, vous avez besoin de processus pour les gérer. Comment communiquer le statut de l'événement aux parties prenantes ? Qui supervise l'intervention ? Quels sont les outils à utiliser pour réduire l'impact de ces événements ? Voici des exemples de questions auxquelles vous devez répondre pour renforcer votre processus de réponse. 

Les processus doivent être documentés dans un emplacement central et accessible à toute personne impliquée dans votre charge de travail. Si vous ne disposez pas d'un wiki central ou d'un magasin de documents, un référentiel de contrôle de version peut être utilisé. Vous devez garder ces plans à jour à mesure que vos processus évoluent. 

Les problèmes sont de parfaits candidats à l'automatisation. Ces événements empiètent sur votre temps passé à innover. Commencez par créer un processus reproductible pour réduire l'impact du problème. Avec le temps, concentrez-vous sur l'automatisation de la réduction ou de la résolution du problème sous-jacent. Cela permet de libérer du temps pour vous consacrer à l'amélioration de votre charge de travail. 

**Résultat souhaité :** Votre entreprise dispose d'un processus pour gérer les événements, les incidents et les problèmes. Ces processus sont documentés et stockés dans un emplacement central. Ils sont mis à jour à mesure que les processus évoluent. 

**Anti-modèles courants :** 
+  Un incident se produit pendant le week-end et l'ingénieur de garde ne sait pas quoi faire. 
+  Un client vous envoie un e-mail pour vous informer que l'application ne fonctionne plus. Vous redémarrez le serveur pour résoudre le problème. Cela arrive fréquemment. 
+  Un incident se produit et plusieurs équipes travaillent indépendamment pour essayer de le résoudre. 
+  Des déploiements se produisent dans votre charge de travail sans être enregistrés. 

 **Avantages liés au respect de cette bonne pratique :** 
+  Vous disposez d'une piste d'audit des événements dans votre charge de travail. 
+  Votre temps de récupération après un incident diminue. 
+  Les membres de l'équipe peuvent résoudre des incidents et des problèmes de manière cohérente. 
+  L'effort est plus consolidé lorsqu'on enquête sur un incident. 

 **Niveau de risque exposé si cette bonne pratique n'est pas respectée :** Élevé 

## Directives d'implémentation
<a name="implementation-guidance"></a>

L'implémentation de cette bonne pratique signifie que vous suivez les événements de charge de travail. Vous disposez de processus pour gérer les incidents et les problèmes. Les processus sont documentés, partagés et mis à jour fréquemment. Les problèmes sont identifiés, hiérarchisés et résolus. 

 **Exemple client** 

Une partie du wiki interne d'AnyCompany Retail est consacrée au processus pour la gestion de l'événement, de l'incident et du problème. Tous les événements sont envoyés à [Amazon EventBridge](https://docs.aws.amazon.com/eventbridge/latest/userguide/eb-what-is.html). Les problèmes sont identifiés en tant qu'OpsItems dans [AWS Systems Manager OpsCenter](https://docs.aws.amazon.com/systems-manager/latest/userguide/OpsCenter.html) et hiérarchisés pour être résolus, ce qui réduit la main d'œuvre indifférenciée. À mesure que les processus évoluent, ils sont mis à jour dans son wiki interne. L'entreprise utilise [AWS Systems Manager Incident Manager](https://docs.aws.amazon.com/incident-manager/latest/userguide/what-is-incident-manager.html) pour gérer les incidents et coordonner les efforts de réduction de l'impact des événements. 

## Étapes d'implémentation
<a name="implementation-steps"></a>

1.  Événements 
   +  Suivez les événements qui se produisent dans votre charge de travail, même si aucune intervention humaine n'est requise. 
   +  Collaborez avec les parties prenantes de la charge de travail pour développer une liste des événements devant être suivis. Certains exemples sont des déploiements terminés ou des correctifs réussis. 
   +  Vous pouvez utiliser des services comme [Amazon EventBridge](https://docs.aws.amazon.com/eventbridge/latest/userguide/eb-what-is.html) ou [Amazon Simple Notification Service](https://docs.aws.amazon.com/sns/latest/dg/welcome.html) pour générer des événements personnalisés pour le suivi. 

1.  Les incidents 
   +  Commencez par définir le plan de communication pour les incidents. Quelles parties prenantes doivent être informées ? Comment les tiendrez-vous informées ? Qui supervise les efforts de coordination ? Nous recommandons de mettre en place un canal de chat interne pour la communication et la coordination. 
   +  Définissez les chemins de remontée pour les équipes prenant en charge votre charge de travail, notamment si l'équipe n'a pas de système de rotation de garde. Selon votre niveau de prise en charge, vous pouvez également créer un ticket avec Support. 
   +  Créez un playbook pour enquêter sur l'incident. Il doit inclure le plan de communication et les étapes détaillées de l'enquête. Incluez la vérification du [Tableau de bord AWS Health](https://docs.aws.amazon.com/health/latest/ug/what-is-aws-health.html) dans votre enquête. 
   +  Documentez votre plan de réponse aux incidents. Communiquez le plan de gestion des incidents afin que les clients internes et externes comprennent les règles d'engagement et ce qu'on attend d'eux. Entraînez les membres de votre équipe à l'utiliser. 
   +  Les clients peuvent utiliser [Incident Manager](https://docs.aws.amazon.com/incident-manager/latest/userguide/what-is-incident-manager.html) pour configurer et gérer leur plan de réponse aux incidents. 
   +  Les clients ayant un plan de support Business peuvent demander l' [atelier Gestion des incidents](https://aws.amazon.com/premiumsupport/technology-and-programs/proactive-services/#Operational_Workshops_and_Deep_Dives) auprès de leur gestionnaire de compte technique. Cet atelier guidé teste votre plan de réponse aux incidents existant et vous aide à identifier les domaines à améliorer. 

1.  Problèmes 
   +  Les problèmes doivent être identifiés et suivis dans votre système ITSM. 
   +  Identifiez tous les problèmes connus et hiérarchisez-les par effort de résolution et impact sur la charge de travail.   
![\[Matrice de priorité d'action pour hiérarchiser les problèmes.\]](http://docs.aws.amazon.com/fr_fr/wellarchitected/2022-03-31/framework/images/impact-effort-chart.png)
   +  Résolvez d'abord les problèmes ayant un impact élevé et un effort faible. Une fois ces problèmes résolus, passez à ceux ayant un impact faible et un effort faible. 
   +  Vous pouvez utiliser [Systems Manager OpsCenter](systems-manager/latest/userguide/OpsCenter.html) pour identifier ces problèmes, leur attacher des runbooks et les suivre. 

**Niveau d'effort du plan d'implémentation :** moyen. Vous avez besoin d'un processus et d'outils pour implémenter cette bonne pratique. Documentez vos processus et rendez-les accessibles à toute personne associée à la charge de travail. Mettez-les à jour fréquemment. Vous disposez d'un processus pour gérer les problèmes et les réduire ou les résoudre. 

## Ressources
<a name="resources"></a>

 **Bonnes pratiques associées :** 
+  [OPS07-BP03 Utiliser des runbooks pour effectuer des procédures](ops_ready_to_support_use_runbooks.md) : les problèmes connus ont besoin d'un runbook associé pour que les efforts de réduction de l'impact soient cohérents.
+  [OPS07-BP04 Utiliser des playbooks pour analyser les problèmes](ops_ready_to_support_use_playbooks.md) : les incidents doivent faire l'objet d'une enquête en utilisant des playbooks. 
+  [OPS11-BP02 Effectuer une analyse post-incident](ops_evolve_ops_perform_rca_process.md) : procédez toujours à une analyse à froid suite à une reprise après un incident. 

 **Documents connexes :** 
+  [Atlassian : gestion des incidents à l'âge du DevOps](https://www.atlassian.com/incident-management/devops) 
+  [Guide des réponses aux incidents de sécurité AWS](https://docs.aws.amazon.com/whitepapers/latest/aws-security-incident-response-guide/welcome.html) 
+  [Gestion des incidents à l'âge du DevOps et de SRE](https://www.infoq.com/presentations/incident-management-devops-sre/) 
+  [PagerDuty : qu'est-ce que la gestion des incidents ?](https://www.pagerduty.com/resources/learn/what-is-incident-management/) 

 **Vidéos connexes :** 
+  [AWS re:Invent 2020: Incident management in a distributed organization](https://www.youtube.com/watch?v=tyS1YDhMVos) 
+  [AWS re:Invent 2021 - Building next-gen applications with event-driven architectures](https://www.youtube.com/watch?v=U5GZNt0iMZY) 
+  [AWS Supports You \$1 Exploring the Incident Management Tabletop Exercise](https://www.youtube.com/watch?v=0m8sGDx-pRM) 
+  [AWS Systems Manager Incident Manager : ateliers virtuels AWS](https://www.youtube.com/watch?v=KNOc0DxuBSY) 
+  [AWS What's Next ft. Incident Manager \$1 Événements AWS](https://www.youtube.com/watch?v=uZL-z7cII3k) 

 **Exemples connexes :** 
+  [Atelier Outils de gestion et de gouvernance AWS : OpsCenter](https://mng.workshop.aws/ssm/capability_hands-on_labs/opscenter.html) 
+  [Services proactifs AWS : atelier de gestion des incidents](https://aws.amazon.com/premiumsupport/technology-and-programs/proactive-services/#Operational_Workshops_and_Deep_Dives) 
+  [Création d'une application gérée par les événements avec Amazon EventBridge](https://aws.amazon.com/blogs/compute/building-an-event-driven-application-with-amazon-eventbridge/) 
+  [Création d'architectures gérées par les événements sur AWS](https://catalog.us-east-1.prod.workshops.aws/workshops/63320e83-6abc-493d-83d8-f822584fb3cb/en-US/) 

 **Services associés :** 
+  [Amazon EventBridge](https://docs.aws.amazon.com/eventbridge/latest/userguide/eb-what-is.html) 
+  [Amazon SNS](https://docs.aws.amazon.com/sns/latest/dg/welcome.html) 
+  [Tableau de bord AWS Health](https://docs.aws.amazon.com/health/latest/ug/what-is-aws-health.html) 
+  [AWS Systems Manager Incident Manager](https://docs.aws.amazon.com/incident-manager/latest/userguide/what-is-incident-manager.html) 
+  [AWS Systems Manager OpsCenter](https://docs.aws.amazon.com/systems-manager/latest/userguide/OpsCenter.html) 

# OPS10-BP02 Disposer d'un processus par alerte
<a name="ops_event_response_process_per_alert"></a>

 Répondez de manière bien définie (un runbook ou un playbook), avec un responsable spécifiquement identifié, à tout événement pour lequel vous déclenchez une alerte. Cela permet de répondre efficacement et rapidement aux événements liés aux opérations et d'éviter que les événements donnant lieu à une action ne soient occultés par des notifications de moindre valeur. 

 **Anti-modèles courants :** 
+  Votre système de surveillance vous présente un flux de connexions approuvées et d'autres messages. Le volume des messages est si important que vous manquez des messages d'erreur réguliers qui nécessitent votre intervention. 
+  Vous recevez une alerte indiquant que le site Web est en panne. Il n'existe aucun processus défini lorsque cela se produit. Vous êtes contraint d'adopter une approche ponctuelle pour diagnostiquer et résoudre le problème. Le développement de ce processus au fur et à mesure allonge le délai de reprise. 

 **Avantages liés au respect de cette bonne pratique :** En n'envoyant une alerte que lorsqu'une action est nécessaire, vous évitez que des alertes de faible importance ne dissimulent des alertes plus importantes. En ayant un processus en place pour toutes les alertes nécessitant une action, vous permettez une réponse cohérente et rapide aux événements dans votre environnement. 

 **Niveau de risque exposé si cette bonne pratique n'est pas respectée :** Débit 

## Directives d'implémentation
<a name="implementation-guidance"></a>
+  Processus par alerte : tout événement pour lequel vous déclenchez une alerte doit avoir une réponse bien définie (un runbook ou un playbook) avec un responsable spécifiquement identifié (par exemple, une personne, une équipe ou un rôle), garant du bon déroulement du processus. L’intervention peut être automatisée ou effectuée par une autre équipe, mais le responsable doit veiller à ce que le processus transmette les résultats attendus. En disposant de ces processus, vous garantissez des réponses efficaces et rapides aux événements opérationnels et vous pouvez empêcher que les événements concrets soient masqués par des notifications moins importantes. Par exemple, la mise à l'échelle automatique pourrait être appliquée pour mettre à l'échelle un front-end Web, mais l'équipe des opérations pourrait être responsable de s'assurer que les règles et les limites de mise à l'échelle automatique sont appropriées aux besoins de la charge de travail. 

## Ressources
<a name="resources"></a>

 **Documents connexes :** 
+  [Fonctionnalités d'Amazon CloudWatch](https://aws.amazon.com/cloudwatch/features/) 
+  [Qu'est-ce que Amazon CloudWatch Events ?](https://docs.aws.amazon.com/AmazonCloudWatch/latest/events/WhatIsCloudWatchEvents.html) 

 **Vidéos connexes :** 
+  [Élaborer un plan de surveillance](https://www.youtube.com/watch?v=OMmiGETJpfU) 

# OPS10-BP03 Hiérarchiser les événements opérationnels en fonction de leur impact sur l'activité
<a name="ops_event_response_prioritize_events"></a>

 Assurez-vous que, lorsque plusieurs événements nécessitent une intervention, les plus importants pour l’activité sont traités en premier. Les impacts peuvent inclure la mort ou une blessure, une perte financière ou l'atteinte à la réputation ou à la confiance. 

 **Anti-modèles courants :** 
+  Vous recevez une demande de support pour ajouter une configuration d'imprimante pour un utilisateur. Alors que vous travaillez sur le problème, vous recevez une demande de support indiquant que votre site de vente au détail est en panne. Après avoir terminé la configuration de l'imprimante pour votre utilisateur, vous commencez à travailler sur le problème du site Web. 
+  Vous êtes averti que votre site Web de vente au détail et votre système de paie sont en panne. Vous ne savez pas auquel des deux vous devez accorder la priorité. 

 **Avantages liés au respect de cette bonne pratique :** La priorisation des réponses aux incidents ayant le plus grand impact sur l'entreprise vous permet de gérer cet impact. 

 **Niveau de risque exposé si cette bonne pratique n'est pas respectée :** Moyenne entreprise 

## Directives d'implémentation
<a name="implementation-guidance"></a>
+  Hiérarchiser les événements opérationnels en fonction de leur impact sur l'activité : établissez la priorité des événements en fonction de l'impact métier pour vous assurer que, lorsque plusieurs événements nécessitent une intervention, les plus importants pour l'activité sont traités en premier. Les impacts peuvent inclure un décès ou une blessure, des pertes financières, des violations réglementaires ou une atteinte à la réputation ou à la confiance. 

# OPS10-BP04 Définir l'acheminement hiérarchique
<a name="ops_event_response_define_escalation_paths"></a>

 Définissez l'acheminement hiérarchique dans vos runbooks et playbooks, y compris ce qui le déclenche et les procédures qui le régissent. Identifiez spécifiquement les propriétaires de chaque action afin de garantir des réponses efficaces et rapides aux événements liés aux opérations. 

 Déterminez quand une décision humaine est nécessaire avant d'effectuer une action. Collaborez avec les décideurs pour que cette décision soit prise à l'avance et que l'action soit préapprouvée, afin que le temps moyen de résolution ne soit pas étendu. 

 **Anti-modèles courants :** 
+  Votre site de vente au détail est en panne. Vous ne comprenez pas le runbook pour restaurer le site. Vous commencez à appeler vos collègues en espérant que quelqu'un sera en mesure de vous aider. 
+  Vous recevez une demande de support pour une application inaccessible. Vous n'êtes pas autorisé à administrer le système. Vous ne savez pas qui le fait. Vous essayez de contacter le propriétaire du système qui a ouvert le dossier et il ne répond pas. Vous n'avez aucun contact pour le système et vos collègues ne le connaissent pas. 

 **Avantages liés au respect de cette bonne pratique :** En définissant des remontées, des déclencheurs de remontée et des procédures de remontée, vous permettez l'ajout systématique de ressources à un incident à un rythme adapté à l'impact. 

 **Niveau de risque exposé si cette bonne pratique n'est pas respectée :** Moyenne entreprise 

## Directives d'implémentation
<a name="implementation-guidance"></a>
+  Définir l'acheminement hiérarchique : définissez des chemins hiérarchiques dans vos runbooks et playbooks, y compris ce qui les déclenche et les procédures qui régissent cet acheminement. Par exemple, l'acheminement hiérarchique d'un problème des ingénieurs support aux ingénieurs support seniors lorsque les runbooks ne peuvent pas résoudre le problème, ou lorsqu'un laps de temps prédéfini s'est écoulé. Un autre exemple d'acheminement hiérarchique approprié est l'acheminement des ingénieurs support seniors à l'équipe de développement pour une charge de travail lorsque les playbooks ne sont pas en mesure d'identifier une méthode de correction, ou lorsqu'un laps de temps prédéfini s'est écoulé. Identifiez spécifiquement les propriétaires de chaque action afin de garantir des réponses efficaces et rapides aux événements liés aux opérations. Les acheminements hiérarchiques peuvent inclure des tiers. Par exemple, un fournisseur de connectivité réseau ou un fournisseur de logiciels. Les acheminements hiérarchiques peuvent inclure des décideurs autorisés identifiés pour les systèmes impactés. 

# OPS10-BP05 Activer les notifications push
<a name="ops_event_response_push_notify"></a>

 Communiquez directement avec vos utilisateurs (par exemple, par courrier électronique ou par SMS) lorsque les services qu'ils utilisent sont impactés, et de nouveau lorsque les services refonctionnent normalement, pour permettre aux utilisateurs de prendre les mesures appropriées. 

 **Anti-modèles courants :** 
+  Votre application est attaquée par un déni de service distribué et ne répond plus depuis plusieurs jours. Il n'existe aucun message d'erreur. Vous n'avez pas envoyé d'e-mail de notification. Vous n'avez pas envoyé de notifications par SMS. Vous n'avez pas partagé d'informations sur les réseaux sociaux. Vos clients sont frustrés et recherchent d'autres fournisseurs capables de les aider. 
+  Lundi, votre application a connu des problèmes suite à un correctif et a été interrompue pendant quelques heures. Mardi, votre application a connu des problèmes suite à un déploiement de code et n'a pas été fiable pendant quelques heures. Mercredi, votre application a connu des problèmes suite à un déploiement de code visant à atténuer une faille de sécurité associée au correctif défaillant et a été indisponible pendant quelques heures. Jeudi, vos clients frustrés ont commencé à chercher un autre fournisseur qui pourrait les aider. 
+  Votre application va être arrêtée pour une raison de maintenance ce week-end. Vous n'en informez pas vos clients. Certains de vos clients avaient planifié des activités impliquant l'utilisation de votre application. Ils sont très frustrés lorsqu'ils découvrent que votre application n'est pas disponible. 

 **Avantages liés au respect de cette bonne pratique :** En définissant des notifications, des déclencheurs de notification et des procédures de notification, vous permettez à votre client d'être informé et de réagir lorsque des problèmes liés à votre charge de travail l’impactent. 

 **Niveau de risque exposé si cette bonne pratique n'est pas respectée :** Moyenne entreprise 

## Directives d'implémentation
<a name="implementation-guidance"></a>
+  Activer les notifications push : communiquez directement avec vos utilisateurs (par exemple, par e-mail ou SMS) lorsque les services qu'ils utilisent sont impactés, et lorsque les services reviennent à la normale, pour permettre aux utilisateurs de prendre des mesures appropriées. 
  +  [Fonctionnalités d'Amazon SES](https://aws.amazon.com/ses/details/) 
  +  [Qu'est-ce que Amazon SES ?](https://docs.aws.amazon.com/ses/latest/DeveloperGuide/Welcome.html) 
  +  [Configurer des notifications Amazon SNS](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/US_SetupSNS.html) 

## Ressources
<a name="resources"></a>

 **Documents connexes :** 
+  [Fonctionnalités d'Amazon SES](https://aws.amazon.com/ses/details/) 
+  [Configurer des notifications Amazon SNS](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/US_SetupSNS.html) 
+  [Qu'est-ce que Amazon SES ?](https://docs.aws.amazon.com/ses/latest/DeveloperGuide/Welcome.html) 

# OPS10-BP06 Communiquer l'état grâce aux tableaux de bord
<a name="ops_event_response_dashboards"></a>

 Fournissez des tableaux de bord adaptés à leurs publics cibles (par exemple, équipes techniques internes, dirigeants et clients) pour communiquer l'état de fonctionnement actuel de l'entreprise et fournir des métriques d'intérêt. 

 Vous pouvez créer des [tableaux de bord Amazon CloudWatch](https://aws.amazon.com/blogs/aws/cloudwatch-dashboards-create-use-customized-metrics-views/) sur les pages d'accueil personnalisables de la console CloudWatch. Grâce aux services d'informatique décisionnelle tels que [Quick](https://aws.amazon.com/quicksight/) vous pouvez créer et publier des tableaux de bord interactifs de votre charge de travail et de votre état opérationnel (par exemple, les taux de commande, les utilisateurs connectés et les heures de transaction). Créez des tableaux de bord qui présentent des affichages de vos métriques au niveau du système et de l'entreprise. 

 **Anti-modèles courants :** 
+  Sur demande, vous exécutez un rapport sur l'utilisation actuelle de votre application pour la gestion. 
+  Lors d'un incident, vous êtes contacté toutes les 20 minutes par un propriétaire de système concerné qui souhaite savoir si le problème est résolu. 

 **Avantages liés au respect de cette bonne pratique :** En créant des tableaux de bord, vous autorisez un accès en libre-service aux informations permettant à vos clients de s'informer et de déterminer s'ils doivent prendre des mesures. 

 **Niveau de risque exposé si cette bonne pratique n'est pas respectée :** Moyenne entreprise 

## Directives d'implémentation
<a name="implementation-guidance"></a>
+  Communiquer l'état grâce aux tableaux de bord : créez des tableaux de bord adaptés à leurs groupes cibles (par exemple, les équipes techniques internes, la direction et les clients) pour communiquer l'état d'exploitation actuel de l'entreprise et pour fournir des indicateurs d'intérêt. Fournir une option en libre-service pour les informations d'état réduit l'impact disruptif lié aux demandes d'état de la part de l'équipe opérationnelle. Citons, par exemple, les tableaux de bord Amazon CloudWatch et Tableau de bord AWS Health. 
  +  [Les tableaux de bord CloudWatch créent et utilisent des vues de métriques personnalisées](https://aws.amazon.com/blogs/aws/cloudwatch-dashboards-create-use-customized-metrics-views/) 

## Ressources
<a name="resources"></a>

 **Documents connexes :** 
+  [Quick](https://aws.amazon.com/quicksight/) 
+  [Les tableaux de bord CloudWatch créent et utilisent des vues de métriques personnalisées](https://aws.amazon.com/blogs/aws/cloudwatch-dashboards-create-use-customized-metrics-views/) 

# OPS10-BP07 Automatiser les réponses aux événements
<a name="ops_event_response_auto_event_response"></a>

 Automatisez les réponses aux événements pour réduire les erreurs causées par les processus manuels, et pour garantir des réponses rapides et cohérentes. 

 Il existe plusieurs façons d'automatiser les actions de runbooks et de playbooks sur AWS. Pour répondre à un événement à partir d'un changement d'état dans vos ressources AWS, ou à partir de vos propres événements personnalisés, vous devez créer [des règles CloudWatch Events](https://docs.aws.amazon.com/AmazonCloudWatch/latest/events/WhatIsCloudWatchEvents.html) afin de déclencher des réponses via les cibles CloudWatch (par exemple, les fonctionsLambda, les rubriques Amazon Simple Notification Service (Amazon SNS), les tâches Amazon ECS et AWS Systems Manager Automation). 

 Pour répondre à une métrique qui dépasse un seuil pour une ressource (par exemple, le temps d'attente), vous devez créer [des alarmes CloudWatch](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/AlarmThatSendsEmail.html) pour effectuer une ou plusieurs actions à l'aide des actions Amazon EC2, des actions Auto Scaling, ou pour envoyer une notification à une rubrique Amazon SNS. Si vous avez besoin d'effectuer des actions personnalisées en réponse à une alarme, appelez Lambda par le biais d'une notification Amazon SNS. Utilisez Amazon SNS pour publier des notifications d'événements et des messages de remontée pour que les personnes restent informées. 

 AWS prend également en charge les systèmes tiers via les API et les kits SDK de service AWS. Il existe divers outils fournis par les partenaires AWS et des tiers qui permettent la surveillance, les notifications et les réponses. Ces outils incluent notamment New Relic, Splunk, Loggly, SumoLogic et Datadog. 

 Vous devriez maintenir à disposition des procédures manuelles critiques pouvant être utilisées lorsque les procédures automatisées échouent. 

 **Anti-modèles courants :** 
+  Un développeur vérifie son code. Cet événement aurait pu être utilisé pour démarrer une génération, puis effectuer des tests, mais rien ne se passe. 
+  Votre application consigne une erreur spécifique avant de cesser de fonctionner. La procédure de redémarrage de l'application est bien comprise et peut être scriptée. Vous pouvez utiliser l'événement de journal pour appeler un script et redémarrer l'application. Au lieu de cela, lorsque l'erreur se produit à 3 h le dimanche matin, vous êtes réveillé en tant que ressource de garde chargée de résoudre le système. 

 **Avantages liés au respect de cette bonne pratique :** En utilisant des réponses automatisées aux événements, vous réduisez le temps de réponse et limitez l'introduction d'erreurs provenant d'activités manuelles. 

 **Niveau de risque exposé si cette bonne pratique n'est pas respectée :** Faible 

## Directives d'implémentation
<a name="implementation-guidance"></a>
+  Automatiser les réponses aux événements : automatisez les réponses aux événements pour réduire les erreurs causées par les processus manuels, et pour garantir des réponses rapides et cohérentes. 
  +  [Qu'est-ce que Amazon CloudWatch Events ?](https://docs.aws.amazon.com/AmazonCloudWatch/latest/events/WhatIsCloudWatchEvents.html) 
  +  [Création d'une règle CloudWatch Events qui se déclenche sur un événement](https://docs.aws.amazon.com/AmazonCloudWatch/latest/events/Create-CloudWatch-Events-Rule.html) 
  +  [Création d'une règle CloudWatch Events qui se déclenche sur un appel d'API AWS avec AWS CloudTrail](https://docs.aws.amazon.com/AmazonCloudWatch/latest/events/Create-CloudWatch-Events-CloudTrail-Rule.html) 
  +  [Exemples d'événements CloudWatch Events tirés des services pris en charge](https://docs.aws.amazon.com/AmazonCloudWatch/latest/events/EventTypes.html) 

## Ressources
<a name="resources"></a>

 **Documents connexes :** 
+  [Fonctionnalités d'Amazon CloudWatch](https://aws.amazon.com/cloudwatch/features/) 
+  [Exemples d'événements CloudWatch Events tirés des services pris en charge](https://docs.aws.amazon.com/AmazonCloudWatch/latest/events/EventTypes.html) 
+  [Création d'une règle CloudWatch Events qui se déclenche sur un appel d'API AWS avec AWS CloudTrail](https://docs.aws.amazon.com/AmazonCloudWatch/latest/events/Create-CloudWatch-Events-CloudTrail-Rule.html) 
+  [Création d'une règle CloudWatch Events qui se déclenche sur un événement](https://docs.aws.amazon.com/AmazonCloudWatch/latest/events/Create-CloudWatch-Events-Rule.html) 
+  [Qu'est-ce que Amazon CloudWatch Events ?](https://docs.aws.amazon.com/AmazonCloudWatch/latest/events/WhatIsCloudWatchEvents.html) 

 **Vidéos connexes :** 
+  [Élaborer un plan de surveillance](https://www.youtube.com/watch?v=OMmiGETJpfU) 

 **Exemples connexes :** 

# Évolution
<a name="a-evolve"></a>

**Topics**
+ [OPS 11  Comment faire évoluer vos opérations ?](w2aac19b5c11b5.md)

# OPS 11  Comment faire évoluer vos opérations ?
<a name="w2aac19b5c11b5"></a>

 Consacrez du temps et des ressources à l'amélioration incrémentielle continue pour contribuer à l'évolution de l'efficacité et de l'efficience de vos opérations. 

**Topics**
+ [OPS11-BP01 Définir un processus d'amélioration continue](ops_evolve_ops_process_cont_imp.md)
+ [OPS11-BP02 Effectuer une analyse post-incident](ops_evolve_ops_perform_rca_process.md)
+ [OPS11-BP03 Mettre en œuvre des boucles de rétroaction](ops_evolve_ops_feedback_loops.md)
+ [OPS11-BP04 Gérer les connaissances](ops_evolve_ops_knowledge_management.md)
+ [OPS11-BP05 Définir les facteurs d'amélioration](ops_evolve_ops_drivers_for_imp.md)
+ [OPS11-BP06 Valider les informations](ops_evolve_ops_validate_insights.md)
+ [OPS11-BP07 Examiner les métriques des opérations](ops_evolve_ops_metrics_review.md)
+ [OPS11-BP08 Documenter et partager des enseignements](ops_evolve_ops_share_lessons_learned.md)
+ [OPS11-BP09 Allouer du temps aux améliorations](ops_evolve_ops_allocate_time_for_imp.md)

# OPS11-BP01 Définir un processus d'amélioration continue
<a name="ops_evolve_ops_process_cont_imp"></a>

 Évaluez régulièrement les possibilités d'amélioration et classez-le par ordre de priorité afin de concentrer les efforts là où ils peuvent être le plus bénéfiques. 

 **Anti-modèles courants :** 
+  Vous avez documenté les procédures nécessaires pour créer un environnement de développement ou de test. Vous pouvez utiliser CloudFormation pour automatiser le processus, mais vous le faites manuellement à partir de la console. 
+  Vos tests montrent que la CPU à l'intérieur de votre application est majoritairement utilisée par un petit ensemble de fonctions inefficaces. Vous pouvez vous concentrer sur leur amélioration et réduire vos coûts, mais vous avez été chargé de créer une fonction conviviale. 

 **Avantages liés au respect de cette bonne pratique :** L'amélioration continue fournit un mécanisme permettant d'évaluer régulièrement les possibilités d'amélioration, de prioriser les opportunités et de concentrer les efforts là où ils peuvent être le plus bénéfiques. 

 **Niveau de risque exposé si cette bonne pratique n'est pas respectée :** Débit 

## Directives d'implémentation
<a name="implementation-guidance"></a>
+  Définir un processus d'amélioration continue : évaluez et hiérarchisez régulièrement vos possibilités d'amélioration afin de concentrer les efforts là où ils permettent d'obtenir les plus grands avantages. Mettez en œuvre des modifications afin d'améliorer et d'évaluer les résultats, mais également de déterminer le taux de réussite qu'ils représentent. Si les résultats sont en deçà des objectifs et que les améliorations constituent toujours une priorité, itérez avec d'autres plans d'action. Vos processus opérationnels doivent dédier du temps et des ressources pour permettre d’effectuer des améliorations progressives continues. 

# OPS11-BP02 Effectuer une analyse post-incident
<a name="ops_evolve_ops_perform_rca_process"></a>

 Examinez les événements ayant un impact sur les clients, et identifiez les facteurs contributifs et les actions préventives. Utilisez ces informations pour développer des mesures d'atténuation afin de limiter ou d’empêcher la récurrence. Développez des procédures pour fournir des réponses rapides et efficaces. Publiez, le cas échéant, les facteurs adjuvants et les mesures correctives adaptées au public ciblé. 

 **Anti-modèles courants :** 
+  Vous administrez un serveur d'applications. Toutes vos séances actives sont interrompues toutes les 23 heures et 55 minutes environ. Vous avez essayé d'identifier le problème sur votre serveur d'applications. Vous pensez qu'il pourrait s'agir d'un problème de réseau, mais vous ne pouvez pas obtenir la coopération de l'équipe réseau, car elle est trop occupée pour vous aider. Vous n'avez pas de processus prédéfini à suivre pour obtenir de l'aide et collecter les informations nécessaires pour déterminer ce qui se passe. 
+  Vous avez subi une perte de données au sein de votre charge de travail. C'est la première fois que cela se produit et la cause n'est pas évidente. Vous décidez que ce n'est pas important, car vous pouvez recréer les données. La perte de données se reproduit plus fréquemment en affectant vos clients. Cela vous impose également une charge opérationnelle supplémentaire lorsque vous restaurez les données manquantes. 

 **Avantages liés au respect de cette bonne pratique :** Le fait de disposer d'un processus prédéfini pour déterminer les composants, les conditions, les actions et les événements qui ont contribué à un incident vous permet d'identifier les possibilités d'amélioration. 

 **Niveau de risque exposé si cette bonne pratique n'est pas respectée :** Débit 

## Directives d'implémentation
<a name="implementation-guidance"></a>
+  Passez en revue tous les incidents ayant un impact sur le client. Dotez-vous d'un processus pour identifier et documenter les facteurs contributifs d'un incident afin de pouvoir mettre au point des mesures d'atténuation pour limiter ou empêcher la récurrence, et élaborez des procédures pour fournir des réponses rapides et efficaces. Indiquez la cause racine, si nécessaire, de manière appropriée et adaptée aux publics cibles. 

# OPS11-BP03 Mettre en œuvre des boucles de rétroaction
<a name="ops_evolve_ops_feedback_loops"></a>

Les boucles de rétroaction fournissent des informations exploitables qui orientent la prise de décision. Créez des boucles de rétroaction dans vos procédures et vos charges de travail. Elles vous permettent d'identifier les problèmes et les points à améliorer. Elles valident également les investissements dans les améliorations. Ces boucles de rétroaction sont à la base de l'amélioration continue de votre charge de travail.

 Il existe deux catégories de boucles de rétroaction : *les rétroactions immédiates* et *les analyses rétrospectives*. Les rétroactions immédiates sont collectées via l'examen des performances et des résultats des activités opérationnelles. Ces rétroactions proviennent des membres de l'équipe, des clients ou de la sortie automatisée de l'activité. Les rétroactions immédiates proviennent notamment de tests A/B et de la mise à disposition de nouvelles fonctionnalités, et il est essentiel d'échouer rapidement. 

 Les analyses rétrospectives doivent être effectuées régulièrement pour recueillir des rétroactions concernant l'évaluation des métriques et des résultats opérationnels au fil du temps. Ces analyses rétrospectives se déroulent à la fin d'un sprint, sur une cadence, ou après des versions ou des événements majeurs. Ce type de boucle de rétroaction valide les investissements dans les opérations ou votre charge de travail. Il vous permet de mesurer la réussite et valide votre stratégie. 

 **Résultat souhaité :** Les rétroactions immédiates et les analyses rétrospectives permettent d'apporter des améliorations. Il existe un mécanisme pour recueillir les rétroactions des utilisateurs et des membres de l'équipe. Les analyses rétrospectives sont utilisées pour déterminer les tendances qui entraînent des améliorations. 

 **Anti-modèles courants :** 
+ Vous lancez une nouvelle fonctionnalité, mais vous n'avez aucun moyen de recevoir les rétroactions des clients à ce sujet.
+ Après avoir investi dans des améliorations opérationnelles, vous n'effectuez pas d'analyse rétrospective pour les valider.
+ Vous recueillez les rétroactions des clients, mais ne les examinez pas régulièrement.
+ Les boucles de rétroaction mènent à des mesures de suivi proposées, mais elles ne sont pas incluses dans le processus de développement de logiciels.
+  Les clients ne reçoivent pas de rétroactions sur les améliorations qu'ils ont proposées. 

 **Avantages liés au respect de cette bonne pratique :** 
+  Vous pouvez travailler à rebours en partant du client pour générer de nouvelles fonctionnalités. 
+  Votre culture organisationnelle peut réagir plus rapidement face aux changements. 
+  Les tendances sont utilisées afin d'identifier des possibilités d'amélioration. 
+  Les analyses rétrospectives valident les investissements effectués dans votre charge de travail et vos opérations. 

 **Niveau d'exposition au risque si cette bonne pratique n'est pas respectée :** Élevé 

## Directives d'implémentation
<a name="implementation-guidance"></a>

 L'implémentation de cette bonne pratique signifie que vous utilisez à la fois les rétroactions immédiates et les analyses rétrospectives. Ces boucles de rétroaction stimulent les améliorations. Il existe de nombreux mécanismes de rétroaction immédiate, notamment des enquêtes, des sondages auprès des clients ou des formulaires de rétroaction. Votre organisation utilise également des analyses rétrospectives afin d'identifier les possibilités d'amélioration et de valider les initiatives. 

 **Exemple client** 

 AnyCompany Retail a créé un formulaire web via lequel les clients peuvent transmettre une rétroaction ou signaler les problèmes. Au cours du scrum hebdomadaire, les rétroactions des utilisateurs sont évaluées par l'équipe de développement logiciel. Les rétroactions sont régulièrement utilisées pour orienter l'évolution de la plateforme de l'entreprise. Elle effectue une analyse rétrospective à la fin de chaque sprint afin d'identifier les éléments qu'elle souhaite améliorer. 

## Étapes d'implémentation
<a name="implementation-steps"></a>

1. Rétroaction immédiate
   +  Vous avez besoin d'un mécanisme pour recevoir les rétroactions des clients et des membres de l'équipe. Vos activités opérationnelles peuvent également être configurées de façon à fournir une rétroaction automatisée. 
   +  Votre organisation a besoin d'un processus pour examiner cette rétroaction, déterminer ce qui doit être amélioré et planifier l'amélioration. 
   +  La rétroaction doit être ajoutée à votre processus de développement logiciel. 
   +  Lorsque vous apportez des améliorations, effectuez un suivi auprès de l'auteur de la rétroaction. 
     +  Vous pouvez utiliser [AWS Systems Manager OpsCenter](https://docs.aws.amazon.com/systems-manager/latest/userguide/OpsCenter.html) pour créer et suivre ces améliorations en tant qu' [OpsItems](https://docs.aws.amazon.com/systems-manager/latest/userguide/OpsCenter-working-with-OpsItems.html).

1.  Analyse rétrospective 
   +  Effectuez des analyses rétrospectives à la fin d'un cycle de développement, sur une cadence définie ou après une version majeure. 
   +  Réunissez les parties prenantes impliquées dans la charge de travail pour une réunion rétrospective. 
   +  Créez trois colonnes sur un tableau blanc ou une feuille de calcul : Arrêter, Commencer et Conserver. 
     +  *La colonne Arrêter* comportera tout ce que votre équipe doit arrêter de faire. 
     +  *La colonne Commencer* comportera tout ce que votre équipe doit commencer à faire. 
     +  *La colonne Conserver* comportera tout ce que vous souhaitez continuer à faire. 
   +  Faites le tour de la salle et recueillez les rétroactions des parties prenantes. 
   +  Privilégiez les rétroactions. Attribuez les actions et les parties prenantes aux points que vous souhaitez commencer ou conserver. 
   +  Ajoutez les actions à votre processus de développement logiciel et communiquez les mises à jour de statut aux parties prenantes à mesure que vous apportez les améliorations. 

 **Niveau d'effort du plan d'implémentation :** moyen. Pour implémenter cette bonne pratique, vous avez besoin d'une solution pour recevoir une rétroaction immédiate et l'analyser. En outre, vous devez établir un processus d'analyse rétrospective. 

## Ressources
<a name="resources"></a>

 **Bonnes pratiques associées :** 
+  [OPS01-BP01 Évaluer les besoins des clients externes](ops_priorities_ext_cust_needs.md) : les boucles de rétroaction sont un mécanisme qui permet de recueillir les besoins des clients externes. 
+  [OPS01-BP02 Évaluer les besoins des clients internes](ops_priorities_int_cust_needs.md) : les parties prenantes internes peuvent utiliser les boucles de rétroaction afin de communiquer les besoins et les exigences. 
+  [OPS11-BP02 Effectuer une analyse post-incident](ops_evolve_ops_perform_rca_process.md) : les analyses post-incident sont une forme importante d'analyse rétrospective menée après les incidents. 
+  [OPS11-BP07 Examiner les métriques des opérations](ops_evolve_ops_metrics_review.md) : les examens des métriques opérationnelles permettent d'identifier les tendances et les points à améliorer. 

 **Documents connexes :** 
+  [7 Pitfalls to Avoid When Building a CCOE](https://aws.amazon.com/blogs/enterprise-strategy/7-pitfalls-to-avoid-when-building-a-ccoe/) 
+  [Playbook de l'équipe Atlassian – Rétrospectives](https://www.atlassian.com/team-playbook/plays/retrospective) 
+  [Email Definitions: Feedback Loops](https://aws.amazon.com/blogs/messaging-and-targeting/email-definitions-feedback-loops/) 
+  [Establishing Feedback Loops Based on the AWS Well-Architected Framework Review](https://aws.amazon.com/blogs/architecture/establishing-feedback-loops-based-on-the-aws-well-architected-framework-review/) 
+  [IBM Garage Methodology - Hold a retrospective](https://www.ibm.com/garage/method/practices/learn/practice_retrospective_analysis/) 
+  [Investopedia – The PDCS Cycle](https://www.investopedia.com/terms/p/pdca-cycle.asp) 
+  [Maximizing Developer Effectiveness de Tim Cochran](https://martinfowler.com/articles/developer-effectiveness.html) 
+  [Operations Readiness Reviews (ORR) Whitepaper - Iteration](https://docs.aws.amazon.com/wellarchitected/latest/operational-readiness-reviews/iteration.html) 
+  [TIL CSI - Continual Service Improvement](https://wiki.en.it-processmaps.com/index.php/ITIL_CSI_-_Continual_Service_Improvement)
+  [When Toyota met e-commerce: Lean at Amazon](https://www.mckinsey.com/capabilities/operations/our-insights/when-toyota-met-e-commerce-lean-at-amazon) 

 **Vidéos connexes :** 
+  [Building Effective Customer Feedback Loops](https://www.youtube.com/watch?v=zz_VImJRZ3U) 

 **Exemples connexes : ** 
+  [Astuto - Open source customer feedback tool](https://github.com/riggraz/astuto) 
+  [AWS Solutions - QnABot on AWS](https://aws.amazon.com/solutions/implementations/qnabot-on-aws/) 
+  [Fider - A platform to organize customer feedback](https://github.com/getfider/fider) 

 **Services associés :** 
+  [AWS Systems Manager OpsCenter](https://docs.aws.amazon.com/systems-manager/latest/userguide/OpsCenter.html) 

# OPS11-BP04 Gérer les connaissances
<a name="ops_evolve_ops_knowledge_management"></a>

 Des mécanismes existent pour que les membres de votre équipe puissent découvrir les informations qu'ils recherchent en temps utile, y accéder et déterminer si elles sont actuelles et complètes. Des mécanismes sont en place pour différencier le contenu nécessaire, le contenu devant être actualisé et le contenu devant être archivé afin qu'il ne soit plus référencé. 

 **Anti-modèles courants :** 
+  Un client frustré ouvre un dossier d'assistance pour demander une nouvelle fonctionnalité pour le produit afin de résoudre un problème perçu. Elle est ajoutée à la liste des améliorations prioritaires. 

 **Niveau de risque exposé si cette bonne pratique n'est pas respectée :** Débit 

## Directives d'implémentation
<a name="implementation-guidance"></a>
+  Gérer les connaissances  : les membres de votre équipe doivent disposer de mécanismes permettant de trouver en temps opportun les informations qu'ils recherchent, d'y accéder et de déterminer si elles sont à jour et complètes. Des mécanismes sont en place pour différencier le contenu nécessaire, le contenu devant être actualisé et le contenu devant être archivé afin qu'il ne soit plus référencé. 

# OPS11-BP05 Définir les facteurs d'amélioration
<a name="ops_evolve_ops_drivers_for_imp"></a>

 Identifiez les facteurs d'amélioration pour évaluer et prioriser les possibilités. 

 Sur AWS, vous pouvez regrouper les journaux de toutes vos activités opérationnelles, de vos charges de travail et de votre infrastructure pour créer un historique d'activité détaillé. Vous pouvez ensuite utiliser les outils AWS pour analyser l'état de vos opérations et de votre charge de travail au fil du temps (par exemple, identifier des tendances, mettre en corrélation des événements et des activités avec des résultats et comparer les environnements et les systèmes) pour identifier les possibilités d'amélioration en fonction de vos facteurs. 

 Vous devez utiliser CloudTrail pour suivre l'activité des API (via AWS Management Console, l'interface de ligne de commande (CLI), les kits SDK et les API) afin de savoir ce qu'il se passe sur l'ensemble de vos comptes. Suivez les activités de déploiement de vos outils pour développeurs AWS avec CloudTrail et CloudWatch. Ceci permet d'ajouter un historique d'activité détaillé de vos déploiements et de leurs résultats à vos données de journaux CloudWatch Logs. 

 [Exportez vos données de journaux vers Amazon S3](https://docs.aws.amazon.com/AmazonCloudWatch/latest/logs/S3Export.html) pour un stockage à long terme. Avec [AWS Glue](https://aws.amazon.com/glue/?whats-new-cards.sort-by=item.additionalFields.postDateTime&whats-new-cards.sort-order=desc), vous détectez et préparez vos données de journaux dans Amazon S3 à des fins d'analyse. Utilisez [Amazon Athena](https://aws.amazon.com/athena/?whats-new-cards.sort-by=item.additionalFields.postDateTime&whats-new-cards.sort-order=desc), par le biais de son intégration native à AWS Glue, pour analyser vos données de journaux. Utilisez un outil d'informatique décisionnelle comme [Quick](https://aws.amazon.com/quicksight/) pour visualiser, explorer et analyser vos données. 

 **Anti-modèles courants :** 
+  Vous disposez d'un script qui fonctionne, mais qui n'est pas élégant. Vous consacrez du temps à sa réécriture. Il s'agit désormais d'une œuvre d'art. 
+  Votre start-up essaie d'obtenir d’autres financements auprès d'un investisseur en capital-risque. Ils veulent que vous prouviez votre conformité à la norme PCI DSS. Vous voulez les contenter, et vous documentez votre conformité, mais manquez une date de livraison pour un client et perdez le client. Ce n'était pas une mauvaise chose à faire, mais maintenant vous vous demandez si c'était opportun. 

 **Avantages liés au respect de cette bonne pratique :** En déterminant les critères que vous voulez utiliser pour l'amélioration, vous pouvez minimiser l'impact des motivations liées aux événements ou de l'investissement émotionnel. 

 **Niveau de risque exposé si cette bonne pratique n'est pas respectée :** Moyenne entreprise 

## Directives d'implémentation
<a name="implementation-guidance"></a>
+  Comprendre les moteurs de l'amélioration : avant d'apporter des modifications à un système, il faut s'assurer que le résultat souhaité est bien pris en charge par celui-ci. 
  +  Fonctionnalités souhaitées : évaluez les fonctionnalités souhaitées lorsque vous étudiez les possibilités d'amélioration. 
    +  [Nouveautés AWS](https://aws.amazon.com/new/) 
  +  Problèmes inadmissibles : évaluez les problèmes inadmissibles, les bogues et les vulnérabilités lorsque vous étudiez les possibilités d'amélioration. 
    +  [Derniers bulletins de sécurité AWS](https://aws.amazon.com/security/security-bulletins/) 
    +  [AWS Trusted Advisor](https://aws.amazon.com/premiumsupport/trustedadvisor/) 
  +  Exigences de conformité : évaluez les mises à jour et les changements nécessaires pour assurer la conformité avec la réglementation ou une politique, ou pour continuer à bénéficier du soutien d'un tiers, lors de l'examen des possibilités d'amélioration. 
    +  [Conformité AWS](https://aws.amazon.com/compliance/) 
    +  [Programmes de conformité AWS](https://aws.amazon.com/compliance/programs/) 
    +  [Dernières actualités sur la conformité AWS](https://aws.amazon.com/compliance/compliance-latest-news/) 

## Ressources
<a name="resources"></a>

 **Documents connexes :** 
+  [Amazon Athena](https://aws.amazon.com/athena/?whats-new-cards.sort-by=item.additionalFields.postDateTime&whats-new-cards.sort-order=desc) 
+  [Quick](https://aws.amazon.com/quicksight/) 
+  [Conformité AWS](https://aws.amazon.com/compliance/) 
+  [Dernières actualités sur la conformité AWS](https://aws.amazon.com/compliance/compliance-latest-news/) 
+  [Programmes de conformité AWS](https://aws.amazon.com/compliance/programs/) 
+  [AWS Glue](https://aws.amazon.com/glue/?whats-new-cards.sort-by=item.additionalFields.postDateTime&whats-new-cards.sort-order=desc) 
+  [Derniers bulletins de sécurité AWS](https://aws.amazon.com/security/security-bulletins/) 
+  [AWS Trusted Advisor](https://aws.amazon.com/premiumsupport/trustedadvisor/) 
+  [Exportez vos données de journaux vers Amazon S3](https://docs.aws.amazon.com/AmazonCloudWatch/latest/logs/S3Export.html) 
+  [Nouveautés AWS](https://aws.amazon.com/new/) 

# OPS11-BP06 Valider les informations
<a name="ops_evolve_ops_validate_insights"></a>

 Vérifiez vos résultats d'analyse et les réponses avec les équipes interfonctionnelles et les responsables métier. Utilisez ces analyses pour établir la compréhension, identifier des impacts supplémentaires et déterminer des lignes de conduite. Ajustez les réponses si nécessaire. 

 **Anti-modèles courants :** 
+  Vous constatez que l'utilisation de la CPU est de 95 % sur un système et vous en faites une priorité pour trouver un moyen de réduire la charge sur le système. Vous déterminez que la meilleure action consiste à monter en charge. Le système est un transcodeur et dimensionné pour utiliser à 95 % en permanence la CPU. Le propriétaire du système aurait pu vous expliquer la situation si vous l'aviez contacté. Vous avez perdu du temps. 
+  Le propriétaire d'un système indique que son système est stratégique. Le système n'a pas été placé dans un environnement hautement sécurisé. Pour améliorer la sécurité, vous mettez en œuvre les contrôles de détection et de prévention supplémentaires requis pour les systèmes stratégiques. Vous informez le propriétaire du système que le travail est terminé et que les ressources supplémentaires lui seront facturées. Dans la discussion qui suit cette notification, le propriétaire du système apprend qu'il existe une définition formelle des systèmes stratégiques qui ne s'applique pas à son système. 

 **Avantages liés au respect de cette bonne pratique :** En validant les informations avec les propriétaires d'entreprises et les experts du domaine, vous pouvez établir une compréhension commune et orienter plus efficacement les améliorations. 

 **Niveau de risque exposé si cette bonne pratique n'est pas respectée :** Moyenne entreprise 

## Directives d'implémentation
<a name="implementation-guidance"></a>
+  Valider les informations : collaborez avec les propriétaires d'entreprise et les experts du domaine pour vous assurer qu'il existe une compréhension et un accord communs sur la signification des données que vous avez recueillies. Identifiez les autres préoccupations, les impacts potentiels et déterminez les mesures à prendre. 

# OPS11-BP07 Examiner les métriques des opérations
<a name="ops_evolve_ops_metrics_review"></a>

 Régulièrement, faites des analyses rétrospectives des métriques opérationnelles avec des intervenants provenant de différents services de l'entreprise. Utilisez ces examens pour identifier les possibilités d'amélioration, les pistes d'action potentielles et pour partager les enseignements tirés. 

 Recherchez des opportunités d'amélioration dans l'ensemble de vos environnements (par exemple, le développement, le test et la production). 

 **Anti-modèles courants :** 
+  Une promotion de vente au détail importante a été interrompue par votre fenêtre de maintenance. L'entreprise continue d’ignorer qu'il existe une fenêtre de maintenance standard qui peut être retardée si d'autres événements ont un impact sur l'activité. 
+  Vous avez subi une panne prolongée en raison de votre utilisation d'une bibliothèque défaillante couramment utilisée dans votre organisation. Depuis, vous avez migré vers une bibliothèque fiable. Les autres équipes de votre organisation ne savent pas qu'elles sont exposées à des risques. Si vous vous réunissiez régulièrement et examiniez cet incident, elles seraient averties des risques. 
+  Les performances de votre transcodeur n'ont cessé de diminuer, ce qui a eu un impact sur l'équipe multimédia. Ce n'est pas encore catastrophique. Vous ne pourrez le savoir que quand la situation se sera suffisamment dégradée au point de provoquer un incident. Si vous examiniez vos métriques opérationnelles avec l'équipe multimédia, il serait possible d'identifier le changement dans les métriques et sa situation, et vous pourriez traiter le problème. 
+  Vous ne passez pas en revue votre respect des SLA des clients. Vous avez tendance à ne pas respecter les SLA de vos clients. Des pénalités financières sont liées au non-respect des SLA de vos clients. Si vous vous réunissiez régulièrement pour examiner les métriques de ces SLA, vous pourriez identifier et résoudre le problème. 

 **Avantages liés au respect de cette bonne pratique :** En vous réunissant régulièrement pour examiner les métriques des opérations, les événements et les incidents, vous maintenez une compréhension commune entre les équipes, partagez les leçons apprises et pouvez prioriser et cibler les améliorations. 

 **Niveau de risque exposé si cette bonne pratique n'est pas respectée :** Moyenne entreprise 

## Directives d'implémentation
<a name="implementation-guidance"></a>
+  Examiner les métriques des opérations : effectuez régulièrement des analyses rétrospectives des métriques opérationnelles avec des intervenants provenant de différentes équipes et de différents services de l'entreprise. Faites appel à différents intervenants, y compris des membres de l'équipe commerciale, de l'équipe de développement et de l'équipe opérationnelle, pour qu'ils valident vos résultats par l'intermédiaire de rétroactions immédiates et d'analyses rétrospectives et pour partager les leçons apprises. Utilisez leurs informations pour identifier les possibilités d'amélioration et les plans d'action possibles. 
  +  [Amazon CloudWatch](https://aws.amazon.com/cloudwatch/) 
  +  [Utilisation des métriques Amazon CloudWatch](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/working_with_metrics.html) 
  +  [Publier des métriques personnalisées](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/publishingMetrics.html) 
  +  [Référence aux dimensions et métriques Amazon CloudWatch](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/CW_Support_For_AWS.html) 

## Ressources
<a name="resources"></a>

 **Documents connexes :** 
+  [Amazon CloudWatch](https://aws.amazon.com/cloudwatch/) 
+  [Référence aux dimensions et métriques Amazon CloudWatch](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/CW_Support_For_AWS.html) 
+  [Publier des métriques personnalisées](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/publishingMetrics.html) 
+  [Utilisation des métriques Amazon CloudWatch](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/working_with_metrics.html) 

# OPS11-BP08 Documenter et partager des enseignements
<a name="ops_evolve_ops_share_lessons_learned"></a>

 Documenter et partager des enseignements : documentez et partagez les enseignements que vous tirez des activités opérationnelles afin de pouvoir les utiliser en interne et entre les équipes. 

 Vous devriez partager les enseignements tirés par vos équipes afin d'en retirer un bénéfice accru pour toute votre organisation. Vous devriez partager des informations et des ressources pour prévenir les erreurs évitables et faciliter les efforts de développement. Cela vous permettra de vous concentrer sur la publication des fonctionnalités souhaitées. 

 Utilisez Gestion des identités et des accès AWS (IAM) pour définir les autorisations permettant de contrôler l'accès aux ressources que vous souhaitez partager au sein des comptes et entre les comptes. Vous devez ensuite utiliser des référentiels AWS CodeCommit avec contrôle de version pour partager des bibliothèques d'application, des procédures scriptées, de la documentation de procédure et d'autres documentations systèmes. Partagez vos normes de calcul en partageant l'accès à vos AMI et en autorisant l'utilisation de vos fonctions Lambda entre les comptes. Vous devez également partager vos normes d'infrastructure comme modèles AWS CloudFormation. 

 Grâce aux API et aux kits SDK AWS, vous pouvez intégrer des outils et référentiels tiers et externes (par exemple, GitHub, BitBucket et SourceForge). Lorsque vous partagez ce que vous avez appris et développé, veillez à structurer les autorisations de manière à garantir l'intégrité des référentiels partagés. 

 **Anti-modèles courants :** 
+  Vous avez subi une panne prolongée en raison de votre utilisation d'une bibliothèque défaillante couramment utilisée dans votre organisation. Depuis, vous avez migré vers une bibliothèque fiable. Les autres équipes de votre organisation ne savent pas qu'elles sont exposées à des risques. Si vous documentiez et partagiez votre expérience concernant cette bibliothèque, elles seraient avertis des risques. 
+  Vous avez identifié un cas limite dans un microservice partagé en interne qui entraîne l'abandon des séances. Vous avez mis à jour vos appels au service pour éviter ce cas limite. Les autres équipes de votre organisation ne savent pas qu'elles sont exposées à des risques. Si vous documentiez et partagiez votre expérience concernant cette bibliothèque, elles seraient avertis des risques. 
+  Vous avez trouvé un moyen de réduire considérablement les besoins d'utilisation du processeur pour l'un de vos microservices. Vous ne savez pas si d'autres équipes peuvent tirer parti de cette technique. Si vous documentiez et partagiez votre expérience concernant cette bibliothèque, elles pourraient le faire. 

 **Avantages liés au respect de cette bonne pratique :** Partagez les enseignements que vous avez tirés pour soutenir l'amélioration et pour optimiser les bénéfices de l'expérience. 

 **Niveau de risque exposé si cette bonne pratique n'est pas respectée :** Faible 

## Directives d'implémentation
<a name="implementation-guidance"></a>
+  Documenter et partager des enseignements : mettez en place des procédures pour documenter les enseignements que vous tirez de l'exécution des activités opérationnelles et des analyses rétrospectives, afin que ceux-ci puissent être utilisés par d'autres équipes. 
  +  Partager les enseignements : imaginez des procédures permettant de partager ces enseignements, ainsi que les artefacts qui y sont associés, avec les autres équipes. Partagez par exemple les mises à jour concernant les procédures, les conseils, la gouvernance et les bonnes pratiques par l'intermédiaire d'un wiki accessible. Partagez des scripts, du code et des bibliothèques grâce à un référentiel commun. 
    +  [Déléguer l'accès à votre environnement AWS](https://www.youtube.com/watch?v=0zJuULHFS6A&t=849s) 
    +  [Partager un référentiel AWS CodeCommit](https://docs.aws.amazon.com/codecommit/latest/userguide/how-to-share-repository.html) 
    +  [Facilité d'autorisation des fonctions AWS Lambda](https://aws.amazon.com/blogs/compute/easy-authorization-of-aws-lambda-functions/) 
    +  [Partager une AMI avec des comptes AWS spécifiques](https://docs.aws.amazon.com/AWSEC2/latest/UserGuide/sharingamis-explicit.html) 
    +  [Accélérez le partage de modèles avec une URL de concepteur AWS CloudFormation](https://aws.amazon.com/blogs/devops/speed-template-sharing-with-an-aws-cloudformation-designer-url/) 
    +  [Utilisation d'AWS Lambda avec Amazon SNS](https://docs.aws.amazon.com/lambda/latest/dg/with-sns-example.html) 

## Ressources
<a name="resources"></a>

 **Documents connexes :** 
+  [Facilité d'autorisation des fonctions AWS Lambda](https://aws.amazon.com/blogs/compute/easy-authorization-of-aws-lambda-functions/) 
+  [Partager un référentiel AWS CodeCommit](https://docs.aws.amazon.com/codecommit/latest/userguide/how-to-share-repository.html) 
+  [Partager une AMI avec des comptes AWS spécifiques](https://docs.aws.amazon.com/AWSEC2/latest/UserGuide/sharingamis-explicit.html) 
+  [Accélérez le partage de modèles avec une URL de concepteur AWS CloudFormation](https://aws.amazon.com/blogs/devops/speed-template-sharing-with-an-aws-cloudformation-designer-url/) 
+  [Utilisation d'AWS Lambda avec Amazon SNS](https://docs.aws.amazon.com/lambda/latest/dg/with-sns-example.html) 

 **Vidéos connexes :** 
+  [Déléguer l'accès à votre environnement AWS](https://www.youtube.com/watch?v=0zJuULHFS6A&t=849s) 

# OPS11-BP09 Allouer du temps aux améliorations
<a name="ops_evolve_ops_allocate_time_for_imp"></a>

 Consacrez du temps et des ressources à vos processus pour permettre des améliorations progressives continues. 

 Sur AWS, vous pouvez créer des copies temporaires d'environnements, ce qui permet de réduire le risque, les efforts, et les coûts d'expérimentation et de test. Ces copies d'environnements peuvent être utilisées pour tester les conclusions de votre analyse, expérimenter, et développer et tester des améliorations planifiées. 

 **Anti-modèles courants :** 
+  Il existe un problème de performances connu sur votre serveur d'applications. Il s'ajoute au retard accumulé dans la mise en œuvre de chaque fonctionnalité planifiée. Si le rythme d'ajout des fonctionnalités prévues reste constant, la question des performances ne sera jamais abordée. 
+  Pour permettre l'amélioration continue, vous autorisez les administrateurs et les développeurs à utiliser tout leur temps supplémentaire pour sélectionner et mettre en œuvre les améliorations. Aucune amélioration n'est effectuée. 

 **Avantages liés au respect de cette bonne pratique :** Ainsi, vous permettez d'apporter des améliorations progressives continues. 

 **Niveau de risque exposé si cette bonne pratique n'est pas respectée :** Faible 

## Directives d'implémentation
<a name="implementation-guidance"></a>
+  Allouer du temps aux améliorations : ce sont les ressources et le temps consacrés à vos processus qui vous permettent d'apporter des améliorations incrémentielles continues. Mettez en œuvre des modifications afin d'améliorer et d'évaluer les résultats, mais également de déterminer le taux de réussite qu'ils représentent. Si les résultats sont en deçà des objectifs et que l’amélioration constitue toujours une priorité, exécutez d'autres plans d'action.