# Gestion des données
<a name="data"></a>

 Mettez en œuvre des pratiques de gestion des données afin de réduire le stockage alloué nécessaire pour assurer votre charge de travail et les ressources nécessaires à son utilisation. Veillez à bien connaître vos données et utilisez des technologies et des configurations de stockage qui soutiennent plus efficacement la valeur métier des données et leur utilisation. Adoptez un cycle de vie des données offrant un stockage plus efficace et moins performant quand les exigences baissent et supprimez les données qui ne sont plus nécessaires. 

**Topics**
+ [SUS04-BP01 Mettre en œuvre une politique de classification des données](sus_sus_data_a2.md)
+ [SUS04-BP02 Utiliser les technologies qui prennent en charge les modèles d’accès aux données et les modèles de stockage](sus_sus_data_a3.md)
+ [SUS04-BP03 Utiliser des politiques pour gérer le cycle de vie de vos ensembles de données](sus_sus_data_a4.md)
+ [SUS04-BP04 Utiliser l'élasticité et l'automatisation pour étendre le stockage par blocs ou le système de fichiers](sus_sus_data_a5.md)
+ [SUS04-BP05 Supprimer les données inutiles ou redondantes](sus_sus_data_a6.md)
+ [SUS04-BP06 Utiliser des systèmes de fichiers partagés ou le stockage pour accéder aux données courantes](sus_sus_data_a7.md)
+ [SUS04-BP07 Réduire le mouvement des données entre les réseaux](sus_sus_data_a8.md)
+ [SUS04-BP08 Sauvegarder des données uniquement lorsqu’elles sont difficiles à recréer](sus_sus_data_a9.md)

# SUS04-BP01 Mettre en œuvre une politique de classification des données
<a name="sus_sus_data_a2"></a>

Classifiez les données pour identifier leur criticité vis-à-vis des résultats économiques, et choisissez le niveau de stockage économe en énergie approprié pour stocker les données.

 **Anti-modèles courants :** 
+  Vous n’identifiez pas les ressources de données actuellement traitées ou stockées ayant des caractéristiques similaires (comme la sensibilité, la criticité métier ou les exigences réglementaires). 
+  Vous n’avez pas implémenté de catalogue de données pour inventorier vos ressources de données. 

 **Avantages liés au respect de cette bonne pratique :** la mise en œuvre d’une politique de classification des données vous permet de déterminer le niveau de stockage le plus économe en énergie pour les données. 

 **Niveau de risque encouru si cette bonne pratique n’est pas respectée :** moyen 

## Directives d’implémentation
<a name="implementation-guidance"></a>

 La classification des données implique d’identifier les types de données actuellement traitées ou stockées dans un système d’information détenu ou exploité par une organisation. Elle implique également de déterminer la criticité des données et l’impact possible d’une compromission, d’une perte ou d’une mauvaise utilisation de ces données. 

 Mettez en œuvre la politique de classification des données en partant de l’utilisation contextuelle des données et en créant un schéma de catégorisation qui prend en compte le niveau de criticité d’un jeu de données déterminé vis-à-vis des opérations d’une organisation. 

### Étapes d’implémentation
<a name="implementation-steps"></a>
+ **Réaliser un inventaire des données :**procédez à l’inventaire des différents types de données qui existent pour votre charge de travail. 
+ **Données du groupe :**déterminez la criticité, la confidentialité, l’intégrité et la disponibilité des données en fonction du risque vis-à-vis de l’organisation. Prenez en compte ces exigences pour regrouper les données dans l’un des niveaux de classification des données que vous adoptez. À titre d’exemple, consultez [Quatre étapes simples pour classer vos données et sécuriser votre start-up](https://aws.amazon.com/blogs/startups/four-simple-steps-to-classify-your-data-and-secure-your-startup/). 
+ **Définissez les niveaux et les politiques de classification des données :** pour chaque groupe de données, définissez le niveau de classification des données (par exemple, public ou confidentiel) et les politiques de gestion. Balisez les données en conséquence. Pour en savoir plus sur les catégories de classification des données, consultez le livre blanc Classification des données. 
+ **Révision périodique : passez** régulièrement en revue et auditez votre environnement pour détecter les données non étiquetées et non classifiées. Utilisez l’automatisation pour identifier ces données, puis classez et balisez les données de manière appropriée. À titre d’exemple, consultez [ le catalogue de données et les robots dans AWS Glue](https://docs.aws.amazon.com/glue/latest/dg/catalog-and-crawler.html). 
+ **Établissez un catalogue de données :** établissez un catalogue de données qui fournit des fonctionnalités d’audit et de gouvernance. 
+ **Documentation :** Documentez les politiques de classification des données et les procédures de traitement pour chaque classe de données. 

## Ressources
<a name="resources"></a>

 **Documents connexes :** 
+  [Utilisation de l’effet de levier AWS Cloud tpour soutenir la classification des données](https://docs.aws.amazon.com/whitepapers/latest/data-classification/leveraging-aws-cloud-to-support-data-classification.html) 
+  [Marquer les politiques de AWS Organizations](https://docs.aws.amazon.com/organizations/latest/userguide/orgs_manage_policies_tag-policies.html) 

 **Vidéos connexes :** 
+ [AWS re:Invent 2022 - Favoriser l'agilité grâce à la gouvernance des données activée AWS](https://www.youtube.com/watch?v=vznDgJkoH7k)
+ [AWS re:Invent 2023 - Protection des données et résilience grâce au stockage AWS](https://www.youtube.com/watch?v=rdG8JV3Fhk4)

# SUS04-BP02 Utiliser les technologies qui prennent en charge les modèles d’accès aux données et les modèles de stockage
<a name="sus_sus_data_a3"></a>

 Utilisez les technologies de stockage qui prennent le mieux en charge l’accès à vos données et leur stockage pour limiter le provisionnement de ressources tout en soutenant votre charge de travail. 

 **Anti-modèles courants :** 
+  Vous partez du principe que toutes les charges de travail ont des modèles de stockage de données et d’accès similaires. 
+  Vous n’utilisez qu’un seul niveau de stockage, partant du principe que toutes les charges de travail s’intègrent dans ce niveau. 
+  Vous partez du principe que les modèles d’accès aux données n’évolueront pas dans le temps. 

 **Avantages liés au respect de cette bonne pratique :** en choisissant et en optimisant vos technologies de stockage en fonction des modèles d’accès aux données et de stockage, vos besoins métier demanderont moins de ressources cloud et vous améliorerez l’efficace globale de votre charge de travail cloud. 

 **Niveau d’exposition au risque si cette bonne pratique n’est pas respectée :** bas 

## Directives d’implémentation
<a name="implementation-guidance"></a>

 Choisissez la solution de stockage la mieux adaptée à vos modèles d’accès ou envisagez de changer vos modèles d’accès en fonction de la solution de stockage pour optimiser les performances. 

### Étapes d’implémentation
<a name="implementation-steps"></a>
+ **Évaluer les caractéristiques des données et de l’accès :** évaluez les caractéristiques de vos données et le modèle d’accès afin de recueillir les caractéristiques clés de vos besoins en matière de stockage. Les caractéristiques clés à prendre en considération sont les suivantes : 
  +  **Type de données :** structurées, semi-structurées, non structurées 
  +  **Croissance des données :** limitée, illimitée 
  +  **Durabilité des données :** persistantes, éphémères, temporaires 
  +  **Modèles d’accès :** lectures ou écritures, fréquence de mise à jour, irrégulière ou cohérente. 
+ **Choisir la bonne technologie de stockage :** migrer les données vers la technologie de stockage appropriée qui prend en charge les caractéristiques des données et le modèle d’accès. Voici quelques exemples de technologies de stockage AWS et leurs caractéristiques clés :     
[\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/fr_fr/wellarchitected/latest/sustainability-pillar/sus_sus_data_a3.html)
+ **Automatiser l’allocation de l’espace de stockage :** pour les systèmes de stockage de taille fixe, tels qu’Amazon EBS ou Amazon FSx, surveillez l’espace de stockage disponible et automatisez l’allocation de l’espace de stockage lorsqu’un seuil est atteint. Vous pouvez utiliser Amazon CloudWatch pour collecter et analyser différentes métriques pour [Amazon EBS](https://docs.aws.amazon.com/AWSEC2/latest/UserGuide/using_cloudwatch_ebs.html) et [Amazon FSx](https://docs.aws.amazon.com/fsx/latest/WindowsGuide/monitoring-cloudwatch.html). 
+ **Choisissez la bonne classe de stockage :** choisissez la classe de stockage adaptée à vos données. 
  +  Les classes de stockage Amazon S3 peuvent être configurées au niveau de l’objet. Un compartiment unique peut contenir les objets stockés dans toutes les classes de stockage. 
  +  Vous pouvez utiliser les [stratégies de cycle de vie Amazon S3](https://docs.aws.amazon.com/AmazonS3/latest/userguide/object-lifecycle-mgmt.html) pour faire passer automatiquement des objets d’une classe de stockage à une autre ou supprimer des données sans aucune modification au niveau de l’application. Ces mécanismes de stockage vous imposent généralement de faire un compromis entre l’efficacité des ressources, la latence d’accès et la fiabilité. 

## Ressources
<a name="resources"></a>

 **Documents connexes :** 
+  [Types de volumes Amazon EBS](https://docs.aws.amazon.com/AWSEC2/latest/UserGuide/ebs-volume-types.html) 
+  [Stockage d’instances Amazon EC2](https://docs.aws.amazon.com/AWSEC2/latest/UserGuide/InstanceStorage.html) 
+  [Amazon S3 Intelligent Tiering](https://docs.aws.amazon.com/AmazonS3/latest/userguide/intelligent-tiering.html) 
+ [Caractéristiques d’E/S Amazon EBS](https://docs.aws.amazon.com/AWSEC2/latest/WindowsGuide/ebs-io-characteristics.html)
+ [Utilisation des classes de stockage Amazon S3](https://docs.aws.amazon.com/AmazonS3/latest/userguide/storage-class-intro.html)
+  [Qu’est-ce qu’Amazon Glacier ?](https://docs.aws.amazon.com/amazonglacier/latest/dev/introduction.html) 

 **Vidéos connexes :** 
+ [AWS re:Invent 2023 - Improve Amazon EBS efficiency and be more cost-efficient ](https://www.youtube.com/watch?v=7-CB02rqiuw)
+ [AWS re:Invent 2023 - Optimizing storage price and performance with Amazon S3 ](https://www.youtube.com/watch?v=RxgYNrXPOLw)
+ [AWS re:Invent 2023 - Building and optimizing a data lake on Amazon S3 ](https://www.youtube.com/watch?v=mpQa_Zm1xW8)
+ [AWS re:Invent 2022 - Building modern data architectures on AWS](https://www.youtube.com/watch?v=Uk2CqEt5f0o)
+ [AWS re:Invent 2022 - Modernize apps with purpose-built databases](https://www.youtube.com/watch?v=V-DiplATdi0)
+ [AWS re:Invent 2022 - Building data mesh architectures on AWS](https://www.youtube.com/watch?v=nGRvlobeM_U)
+ [AWS re:Invent 2023 - Deep dive into Amazon Aurora and its innovations ](https://www.youtube.com/watch?v=je6GCOZ22lI)
+ [AWS re:Invent 2023 - Advanced data modeling with Amazon DynamoDB ](https://www.youtube.com/watch?v=PVUofrFiS_A)

 **Exemples connexes :** 
+ [Exemples Amazon S3](https://docs.aws.amazon.com/sdk-for-javascript/v2/developer-guide/s3-examples.html)
+ [Atelier sur les bases de données sur mesure AWS](https://catalog.us-east-1.prod.workshops.aws/workshops/93f64257-52be-4c12-a95b-c0a1ff3b7e2b/en-US)
+ [Bases de données pour développeurs](https://catalog.workshops.aws/db4devs/en-US)
+ [Journée d’immersion dans l’architecture moderne des données AWS](https://catalog.us-east-1.prod.workshops.aws/workshops/32f3e732-d67d-4c63-b967-c8c5eabd9ebf/en-US)
+ [Créez un maillage de données sur AWS](https://catalog.us-east-1.prod.workshops.aws/workshops/23e6326b-58ee-4ab0-9bc7-3c8d730eb851/en-US)

# SUS04-BP03 Utiliser des politiques pour gérer le cycle de vie de vos ensembles de données
<a name="sus_sus_data_a4"></a>

Gérez le cycle de vie de toutes vos données et appliquez automatiquement la suppression pour réduire au minimum le stockage total requis pour votre charge de travail.

 **Anti-modèles courants :** 
+  Vous supprimez manuellement les données. 
+  Vous ne supprimez aucune donnée de vos charges de travail. 
+  Vous ne déplacez pas les données vers des niveaux de stockage plus écoénergétiques en fonction de leurs exigences de conservation et d’accès. 

 **Avantages liés au respect de cette bonne pratique :** l’utilisation de politiques de cycle de vie des données garantit un accès et une rétention efficaces des données dans une charge de travail. 

 **Niveau de risque encouru si cette bonne pratique n’est pas respectée :** moyen 

## Directives d’implémentation
<a name="implementation-guidance"></a>

 Les exigences en matière de conservation et d’accès des jeux de données varient généralement au cours de leur cycle de vie. Par exemple, votre application peut nécessiter un accès fréquent à certains jeux de données pendant une période limitée. Après cela, ces jeux de données sont rarement consultés. Pour améliorer l’efficacité du stockage de données et du calcul au fil du temps, mettez en œuvre des politiques de cycle de vie, qui sont des règles qui définissent la manière dont les données sont traitées au fil du temps. 

 Avec les règles de configuration du cycle de vie, vous pouvez demander au service de stockage spécifique de transférer un jeu de données vers des niveaux de stockage plus écoénergétiques, de l’archiver ou de le supprimer. Cette pratique minimise le stockage et l’extraction actifs des données, ce qui entraîne une réduction de la consommation d’énergie. En outre, des pratiques telles que l’archivage ou la suppression de données obsolètes soutiennent la conformité réglementaire et la gouvernance des données. 

### Étapes d’implémentation
<a name="implementation-steps"></a>
+  **Utiliser la classification des données :** [classez les jeux de données dans votre charge de travail.](https://docs.aws.amazon.com/wellarchitected/latest/sustainability-pillar/sus_sus_data_a2.html) 
+  **Définir des règles de traitement :** définissez des procédures de traitement pour chaque classe de données. 
+  **Activer l’automatisation :** définissez des politiques de cycle de vie automatisées pour appliquer des règles de cycle de vie. Voici quelques exemples de la configuration des politiques de cycle de vie automatisé pour différents services de stockage AWS :     
[\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/fr_fr/wellarchitected/latest/sustainability-pillar/sus_sus_data_a4.html)
+  **Supprimer les ressources inutilisées :** supprimez les volumes, les instantanés et les données inutilisés dont la période de conservation est dépassée. Utilisez des fonctionnalités de service natives telles qu’[Amazon DynamoDB Time To Live](https://docs.aws.amazon.com/amazondynamodb/latest/developerguide/TTL.html) ou la [conservation des journaux Amazon CloudWatch](https://docs.aws.amazon.com/AmazonCloudWatch/latest/logs/Working-with-log-groups-and-streams.html#SettingLogRetention) pour la suppression. 
+  **Regrouper et compresser :** regroupez et compressez les données le cas échéant en fonction des règles de cycle de vie. 

## Ressources
<a name="resources"></a>

 **Documents connexes :** 
+  [Optimisez vos règles de cycle de vie Amazon S3 grâce à l’analyse des classes de stockage Amazon S3](https://docs.aws.amazon.com/AmazonS3/latest/userguide/analytics-storage-class.html) 
+  [Évaluation des ressources avec AWS Config Rules](https://docs.aws.amazon.com/config/latest/developerguide/evaluate-config.html) 

 **Vidéos connexes :** 
+ [AWS re:Invent 2021 - Amazon S3 Lifecycle best practices to optimize your storage spend ](https://www.youtube.com/watch?v=yGNXn7jOytA)
+ [AWS re:Invent 2023 - Optimizing storage price and performance with Amazon S3 ](https://www.youtube.com/watch?v=RxgYNrXPOLw)
+  [Simplifiez le cycle de vie de vos données et optimisez les coûts de stockage avec Amazon S3 Lifecycle](https://www.youtube.com/watch?v=53eHNSpaMJI) 
+ [Réduisez vos coûts de stockage en utilisant Amazon S3 Storage Lens](https://www.youtube.com/watch?v=A8qOBLM6ITY)

# SUS04-BP04 Utiliser l'élasticité et l'automatisation pour étendre le stockage par blocs ou le système de fichiers
<a name="sus_sus_data_a5"></a>

Utilisez l’élasticité et l’automatisation pour étendre le stockage par blocs ou le système de fichiers au fur et à mesure que le volume de données augmente afin de minimiser le stockage total provisionné.

 **Anti-modèles courants :** 
+  Vous provisionnez un grand bloc de stockage ou un grand système de fichiers pour vos besoins futurs. 
+  Vous surprovisionnez les opérations d'entrée et de sortie par seconde (IOPS) de votre système de fichiers. 
+  Vous ne contrôlez pas l’utilisation de vos volumes de données. 

 **AAvantages liés au respect de cette bonne pratique :** la réduction du surprovisionnement du système de stockage réduit les ressources inactives et améliore l’efficacité globale de votre charge de travail. 

 **Niveau de risque encouru si cette bonne pratique n’est pas respectée :** moyen 

## Directives d’implémentation
<a name="implementation-guidance"></a>

 Créez des systèmes de stockage par blocs et des systèmes de fichiers avec une allocation de taille, un débit et une latence adaptés à votre charge de travail. Utilisez l’élasticité et l’automatisation pour étendre le stockage par blocs ou le système de fichiers en fonction de la croissance des données sans avoir à provisionner ces services de stockage de manière excessive. 

### Étapes d’implémentation
<a name="implementation-steps"></a>
+  Pour le stockage de taille fixe tel qu'[Amazon EBS](https://aws.amazon.com/ebs/), vérifiez que vous surveillez la quantité de stockage utilisée par rapport à la taille de stockage globale et créez une automatisation, si possible, pour augmenter la taille de stockage lorsque vous atteignez un seuil. 
+  Utilisez des volumes Elastic et des services de données par bloc gérés pour automatiser l’allocation de stockage supplémentaire à mesure que vos données persistantes augmentent. Par exemple, vous pouvez utiliser [Amazon EBS Elastic Volumes](https://docs.aws.amazon.com/AWSEC2/latest/UserGuide/ebs-modify-volume.html) pour modifier la taille ou le type de volume ou ajuster les performances de vos EBS volumes Amazon. 
+  Choisissez la bonne classe de stockage, le bon mode de performance et le mode de débit adapté à votre système de fichiers afin de répondre aux besoins de votre entreprise, sans les dépasser. 
  + [EFSPerformances d'Amazon](https://docs.aws.amazon.com/efs/latest/ug/performance.html)
  + [Performances des EBS volumes Amazon sur les instances Linux](https://docs.aws.amazon.com/AWSEC2/latest/UserGuide/EBSPerformance.html)
+  Définissez des niveaux cibles d’utilisation des volumes de données et redimensionnez les volumes en dehors des plages attendues. 
+  Dimensionnez correctement les volumes en lecture seule en fonction des données. 
+  Migrez les données vers des magasins d’objets pour éviter d’allouer la capacité excédentaire des tailles de volume fixes vers le stockage par bloc. 
+  Examinez régulièrement les volumes Elastic et les systèmes de fichiers pour mettre fin aux volumes inutilisés et réduire les ressources surprovisionnées pour les adapter à la taille actuelle des données. 

## Ressources
<a name="resources"></a>

 **Documents connexes :** 
+ [Étendre le système de fichiers après le redimensionnement d'un volume EBS](https://docs.aws.amazon.com/ebs/latest/userguide/recognize-expanded-volume-linux.html)
+ [Modifier un volume à l'aide d'Amazon EBS Elastic Volumes](https://docs.aws.amazon.com/ebs/latest/userguide/ebs-modify-volume.html)
+  [Documentation Amazon FSx](https://docs.aws.amazon.com/fsx/index.html) 
+  [Qu’est ce qu’Amazon Elastic File System ?](https://docs.aws.amazon.com/efs/latest/ug/whatisefs.html) 

 **Vidéos connexes :** 
+ [Présentation approfondie d'Amazon EBS Elastic Volumes](https://www.youtube.com/watch?v=Vi_1Or7QuOg)
+ [Stratégies d'optimisation d'Amazon EBS et de Snapshot pour de meilleures performances et des économies](https://www.youtube.com/watch?v=h1hzRCsJefs)
+ [Optimisation d'Amazon EFS en termes de coûts et de performances, en utilisant les meilleures pratiques](https://www.youtube.com/watch?v=9kfeh6_uZY8)

# SUS04-BP05 Supprimer les données inutiles ou redondantes
<a name="sus_sus_data_a6"></a>

Supprimez les données inutiles ou redondantes pour minimiser les ressources de stockage requises pour stocker vos jeux de données. 

 **Anti-modèles courants :** 
+  Vous dupliquez des données qui peuvent être facilement obtenues ou recréées. 
+  Vous sauvegardez toutes les données sans tenir compte de leur criticité. 
+  Vous ne supprimez les données que de façon irrégulière, sur les événements opérationnels ou pas du tout. 
+  Vous stockez les données de manière redondante, quelle que soit la durabilité du service de stockage. 
+  Vous activez la gestion des versions sans aucune justification commerciale. 

 **Avantages liés au respect de cette bonne pratique :** la suppression des données inutiles réduit la taille de stockage requise pour votre charge de travail et son impact environnemental. 

 **Niveau de risque encouru si cette bonne pratique n’est pas respectée :** moyen 

## Directives d’implémentation
<a name="implementation-guidance"></a>

 La suppression des jeux de données inutiles et redondants permet de réduire les coûts de stockage et l’empreinte environnementale. Cette pratique peut également rendre l’informatique plus efficace, car les ressources de calcul traitent uniquement des données importantes au lieu de données inutiles. Automatisez la suppression des données inutiles. Utilisez des technologies qui dédupliquent les données au niveau du fichier et du bloc. Utilisez les fonctionnalités des services pour la réplication et la redondance des données natives. 

### Étapes d’implémentation
<a name="implementation-steps"></a>
+  **Évaluer les jeux de données publics :** déterminez si vous pouvez éviter de stocker des données en utilisant des jeux de données existants publiquement accessibles dans [AWS Data Exchange](https://aws.amazon.com/data-exchange/) et les [données ouvertes sur AWS](https://registry.opendata.aws/). 
+  **Dédupliquer les données :** utilisez des mécanismes qui peuvent dédupliquer les données au niveau du bloc et de l’objet. Voici quelques exemples de déduplication des données sur AWS :     
[\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/fr_fr/wellarchitected/latest/sustainability-pillar/sus_sus_data_a6.html)
+  **Utiliser des politiques de cycle de vie :** utilisez des politiques de cycle de vie pour automatiser la suppression des données inutiles. Tirez parti de fonctionnalités de service natives telles qu’[Amazon DynamoDB Time To Live](https://docs.aws.amazon.com/amazondynamodb/latest/developerguide/TTL.html), [Amazon S3 Lifecycle](https://docs.aws.amazon.com/AmazonS3/latest/userguide/object-lifecycle-mgmt.html) ou la [rétention des journaux Amazon CloudWatch](https://docs.aws.amazon.com/managedservices/latest/userguide/log-customize-retention.html) pour la suppression. 
+  **Utiliser la virtualisation des données :** utilisez les capacités de virtualisation des données sur AWS afin de maintenir les données à leur source et d’éviter leur duplication. 
  +  [Virtualisation des données natives dand le cloud sur AWS](https://www.youtube.com/watch?v=BM6sMreBzoA) 
  +  [Optimiser le modèle de données à l’aide du partage de données Amazon Redshift](https://catalog.workshops.aws/well-architected-sustainability/en-US/3-data/optimize-data-pattern-using-redshift-data-sharing) 
+  **Utiliser la sauvegarde incrémentielle :** utilisez une technologie de sauvegarde capable d’effectuer des sauvegardes incrémentielles. 
+  **Utiliser la durabilité native :** tirez parti de la durabilité d’[Amazon S3](https://docs.aws.amazon.com/AmazonS3/latest/userguide/DataDurability.html) et de la [réplication d’Amazon EBS](https://docs.aws.amazon.com/AWSEC2/latest/UserGuide/ebs-volumes.html) pour atteindre vos objectifs de durabilité au lieu de recourir à des technologies autogérées (telles qu’un réseau redondant de disques indépendants (RAID)). 
+  **Utiliser une journalisation efficace :** centralisez les données de journaux et de suivi, dédupliquez les entrées de journaux identiques et établissez des mécanismes pour ajuster le niveau de détail, si nécessaire. 
+  **Utiliser une mise en cache efficace :** préremplissez les caches uniquement lorsque cela est justifié. 
+  Établissez la surveillance et l’automatisation des caches pour redimensionner correctement les caches. 
+  **Supprimer les ressources de version antérieure :** supprimez les déploiements et les ressources obsolètes des magasins d’objets et des caches périphériques lors de la transmission des nouvelles versions de votre charge de travail. 

## Ressources
<a name="resources"></a>

 **Documents connexes :** 
+  [Modification de la conservation des données de journaux dans CloudWatch Logs](https://docs.aws.amazon.com/AmazonCloudWatch/latest/logs/Working-with-log-groups-and-streams.html#SettingLogRetention) 
+  [Déduplication des données sur Amazon FSx for Windows File Server](https://docs.aws.amazon.com/fsx/latest/WindowsGuide/using-data-dedup.html) 
+  [Les fonctions d’Amazon FSx for ONTAP incluent la déduplication des données](https://docs.aws.amazon.com/fsx/latest/ONTAPGuide/what-is-fsx-ontap.html#features-overview) 
+  [Invalider des fichiers sur Amazon CloudFront](https://docs.aws.amazon.com/AmazonCloudFront/latest/DeveloperGuide/Invalidation.html) 
+  [Utilisation d’AWS Backup pour la sauvegarde et la restauration des systèmes de fichiers Amazon EFS](https://docs.aws.amazon.com/efs/latest/ug/awsbackup.html) 
+  [Qu’est-ce qu’Amazon CloudWatch Logs ?](https://docs.aws.amazon.com/AmazonCloudWatch/latest/logs/WhatIsCloudWatchLogs.html) 
+  [Utilisation de sauvegardes sur Amazon RDS](https://docs.aws.amazon.com/AmazonRDS/latest/UserGuide/USER_WorkingWithAutomatedBackups.html) 
+  [Intégrez et dédupliquez des ensembles de données à l’aide de AWS Lake Formation](https://aws.amazon.com/blogs/big-data/integrate-and-deduplicate-datasets-using-aws-lake-formation-findmatches/) 

 **Vidéos connexes :** 
+  [Cas d’utilisation du partage de données pour Amazon Redshift](https://www.youtube.com/watch?v=sIoTB8B5nn4) 

 **Exemples connexes :** 
+  [Comment analyser les journaux d’accès au serveur Amazon S3 à l’aide d’Amazon Athena ?](https://aws.amazon.com/premiumsupport/knowledge-center/analyze-logs-athena/) 

# SUS04-BP06 Utiliser des systèmes de fichiers partagés ou le stockage pour accéder aux données courantes
<a name="sus_sus_data_a7"></a>

Adoptez des systèmes de fichiers ou de stockage partagés pour éviter la duplication des données et permettre une infrastructure plus efficace pour votre charge de travail. 

 **Anti-modèles courants :** 
+  Vous mettez en service le stockage pour chaque client individuel. 
+  Vous ne détachez pas le volume de données des clients inactifs. 
+  Vous ne fournissez pas d’accès au stockage pour les plateformes et les systèmes. 

 **Avantages liés au respect de cette bonne pratique :** ’utilisation de systèmes de fichiers ou de stockage partagés permet de partager des données avec un ou plusieurs consommateurs sans avoir à les copier. Cela permet de réduire les ressources de stockage nécessaires à la charge de travail. 

 **Niveau d’exposition au risque si cette bonne pratique n’est pas respectée :** moyen 

## Directives d’implémentation
<a name="implementation-guidance"></a>

 Si plusieurs utilisateurs ou applications accèdent aux mêmes jeux de données, l’utilisation de la technologie de stockage partagé est cruciale pour avoir une infrastructure efficace pour votre charge de travail. La technologie de stockage partagé fournit un emplacement central pour stocker et gérer les jeux de données et éviter la duplication des données. Elle assure également la cohérence des données entre les différents systèmes. En outre, la technologie de stockage partagé permet d’utiliser plus efficacement la puissance de calcul, car plusieurs ressources informatiques peuvent accéder aux données et les traiter simultanément en parallèle. 

 Ne récupérez les données de ces services de stockage partagé qu’en fonction des besoins et détachez les volumes inutilisés pour libérer des ressources. 

### Étapes d’implémentation
<a name="implementation-steps"></a>
+  **Utiliser un stockage partagé :** migrez les données vers le stockage partagé lorsque les données ont plusieurs consommateurs. Voici quelques exemples de technologie de stockage partagé sur   AWS:     
[\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/fr_fr/wellarchitected/latest/sustainability-pillar/sus_sus_data_a7.html)
+  **Récupérer les données requises :** copiez des données vers ou récupérez des données depuis des systèmes de fichiers partagés uniquement si nécessaire. Par exemple, vous pouvez créer un [système de fichiers Amazon FSx pour Lustre soutenu par Amazon S3](https://aws.amazon.com/blogs/storage/new-enhancements-for-moving-data-between-amazon-fsx-for-lustre-and-amazon-s3/) et charger uniquement le sous-ensemble de données requis pour le traitement des tâches sur Amazon FSx.
+  **Supprimer les données inutiles :** supprimez les données selon vos modèles d’utilisation comme indiqué dans [SUS04-BP03 Utiliser des politiques pour gérer le cycle de vie de vos ensembles de données](sus_sus_data_a4.md).
+  **Détacher les clients inactifs :** détachez les volumes des clients qui ne les utilisent pas activement. 

## Ressources
<a name="resources"></a>

 **Documents connexes:** 
+ [ Liaison de votre système de fichiers à un compartiment Amazon S ](https://docs.aws.amazon.com/fsx/latest/LustreGuide/create-dra-linked-data-repo.html)
+ [Utilisation d’Amazon EFS pour AWS Lambda dans vos applications sans serveur](https://aws.amazon.com/blogs/compute/using-amazon-efs-for-aws-lambda-in-your-serverless-applications/)
+ [ Amazon EFS Intelligent-Tiering optimise les coûts liés aux charges de travail en fonction de l’évolution des modèles d’accès ](https://aws.amazon.com/blogs/aws/new-amazon-efs-intelligent-tiering-optimizes-costs-for-workloads-with-changing-access-patterns/)
+ [ Utilisation d’Amazon FSx avec votre référentiel de données sur site ](https://docs.aws.amazon.com/fsx/latest/LustreGuide/fsx-on-premises.html)

 **Vidéos connexes:** 
+ [ Optimisation des coûts de stockage avec Amazon EFS ](https://www.youtube.com/watch?v=0nYAwPsYvBo)
+ [AWS re:Invent 2023 - What’s new with AWS file storage](https://www.youtube.com/watch?v=yXIeIKlTFV0)
+ [AWS re:Invent 2023 - File storage for builders and data scientists on Amazon Elastic File System](https://www.youtube.com/watch?v=g0f6lrmEyRM)

# SUS04-BP07 Réduire le mouvement des données entre les réseaux
<a name="sus_sus_data_a8"></a>

Utilisez des systèmes de fichiers partagés ou un stockage objet pour accéder aux données communes et minimiser les ressources réseau totales requises pour prendre en charge le déplacement des données de votre charge de travail.

 **Anti-modèles courants :** 
+  Vous stockez toutes les données dans la même Région AWS, indépendamment de l’endroit où se trouvent les utilisateurs des données. 
+  Vous n’optimisez ni la taille ni le format des données avant de les déplacer sur le réseau. 

 **Avantages liés au respect de cette bonne pratique :** l’optimisation du déplacement des données sur le réseau réduit les ressources réseau totales nécessaires à la charge de travail et diminue son impact environnemental. 

 **Niveau d’exposition au risque si cette bonne pratique n’est pas respectée :** moyen 

## Directives d’implémentation
<a name="implementation-guidance"></a>

 Le déplacement des données dans votre entreprise nécessite des ressources de calcul, de réseau et de stockage. Utilisez des techniques pour minimiser les déplacements de données et améliorer l’efficacité globale de votre charge de travail. 

## Étapes d’implémentation
<a name="implementation-steps"></a>
+  **Utiliser la proximité :** tenez compte de la proximité des données ou des utilisateurs comme facteur de décision lors de la [sélection d’une région pour votre charge de travail](https://aws.amazon.com/blogs/architecture/how-to-select-a-region-for-your-workload-based-on-sustainability-goals/). 
+  **Partitionner les services :** partitionnez les services consommés par région afin que les données spécifiques à une région soient stockées dans la région où elles sont consommées. 
+  **Utiliser des formats de fichiers efficaces :** utilisez des formats de fichiers efficaces (tels que Parquet ou ORC) et compressez les données avant de les déplacer sur le réseau. 
+  **Minimiser le mouvement des données :** ne déplacez pas les données inutilisées. Voici quelques exemples qui peuvent vous aider à éviter de déplacer des données inutilisées : 
  +  Réduisez les réponses de l’API aux seules données pertinentes. 
  +  Agrégez les données lorsqu’elles sont détaillées (les informations au niveau de l’enregistrement ne sont pas requises). 
  +  Reportez-vous à [Atelier Well-Architected : optimiser le modèle de données à l’aide du partage de données Amazon Redshift](https://catalog.workshops.aws/well-architected-sustainability/en-US/3-data/optimize-data-pattern-using-redshift-data-sharing). 
  +  Envisagez le [partage de données entre comptes dans AWS Lake Formation](https://docs.aws.amazon.com/lake-formation/latest/dg/cross-account-permissions.html). 
+  **Utilisez des services de périphérie :** utilisez des services qui peuvent vous aider à exécuter du code au plus près des utilisateurs de votre charge de travail.     
[\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/fr_fr/wellarchitected/latest/sustainability-pillar/sus_sus_data_a8.html)

## Ressources
<a name="resources"></a>

 **Documents connexes :** 
+  [Optimisation de votre infrastructure AWS pour la durabilité, partie 3 : mise en réseau](https://aws.amazon.com/blogs/architecture/optimizing-your-aws-infrastructure-for-sustainability-part-iii-networking/) 
+  [Infrastructure mondiale AWS](https://aws.amazon.com/about-aws/global-infrastructure/) 
+  [Fonctions clés d’Amazon CloudFront, y compris le réseau périphérique mondial CloudFront](https://aws.amazon.com/cloudfront/features/) 
+  [Compression des requêtes HTTP dans Amazon OpenSearch Service](https://docs.aws.amazon.com/opensearch-service/latest/developerguide/gzip.html) 
+  [Compression intermédiaire de données avec Amazon EMR](https://docs.aws.amazon.com/emr/latest/ManagementGuide/emr-plan-output-compression.html#HadoopIntermediateDataCompression) 
+  [Chargement de fichiers de données comprimés d’Amazon S3 vers Amazon Redshift](https://docs.aws.amazon.com/redshift/latest/dg/t_loading-gzip-compressed-data-files-from-S3.html) 
+  [Diffusion de fichiers compressés avec Amazon CloudFront](https://docs.aws.amazon.com/AmazonCloudFront/latest/DeveloperGuide/ServingCompressedFiles.html) 

 **Vidéos connexes :** 
+ [Demystifying data transfer on AWS](https://www.youtube.com/watch?v=-MqXgzw1IGA)

# SUS04-BP08 Sauvegarder des données uniquement lorsqu’elles sont difficiles à recréer
<a name="sus_sus_data_a9"></a>

Évitez de sauvegarder les données qui n’ont aucune valeur commerciale afin de minimiser les besoins en ressources de stockage pour votre charge de travail. 

 **Anti-modèles courants :** 
+  Vous n’avez aucune stratégie de sauvegarde en place pour vos données. 
+  Vous sauvegardez des données qui peuvent être facilement recréées. 

 **Avantages liés au respect de cette bonne pratique :** éviter de sauvegarder des données non critiques réduit les ressources de stockage requises pour la charge de travail et réduit son impact environnemental. 

 **Niveau d’exposition au risque si cette bonne pratique n’est pas respectée :** moyen 

## Directives d’implémentation
<a name="implementation-guidance"></a>

 Le fait d’éviter la sauvegarde de données inutiles peut contribuer à réduire les coûts et les ressources de stockage utilisées par la charge de travail. Sauvegardez uniquement les données ayant une valeur opérationnelle ou nécessaires pour répondre aux exigences en matière de conformité. Examinez les politiques de sauvegarde et excluez tout magasin éphémère n’apportant aucune valeur dans un scénario de récupération. 

### Étapes d’implémentation
<a name="implementation-steps"></a>
+  **Classer les données :** mettre en œuvre la politique de classification des données telle que décrite dans [SUS04-BP01 Mettre en œuvre une politique de classification des données](sus_sus_data_a2.md). 
+  **Concevoir une stratégie de sauvegarde :** tirez parti de l’importance de votre classification des données et concevez une stratégie de sauvegarde en fonction de vos [objectif de délai de reprise (RTO) et objectif de point de reprise (RPO)](https://docs.aws.amazon.com/wellarchitected/latest/reliability-pillar/rel_planning_for_recovery_objective_defined_recovery.html). Évitez de sauvegarder les données non critiques. 
  +  Excluez les données qui peuvent être facilement recréées. 
  +  Excluez les données éphémères de vos sauvegardes. 
  +  Excluez les copies locales des données, sauf si le temps nécessaire pour restaurer ces données à partir d’un emplacement commun dépasse vos contrats de niveau de service (SLA). 
+  **Utiliser une sauvegarde automatisée :** utilisez une solution automatisée ou un service géré pour sauvegarder les données essentielles à l’entreprise. 
  +  [AWS Backup](https://docs.aws.amazon.com/aws-backup/latest/devguide/whatisbackup.html) est un service entièrement géré qui vous permet de facilement centraliser et automatiser la protection des données sur les services AWS dans le cloud et sur site. Pour obtenir des conseils pratiques sur la façon de créer des sauvegardes automatisées à l’aide de AWS Backup, consultez la section [Test de la sauvegarde et de la restauration de données](https://catalog.workshops.aws/well-architected-reliability/en-US/4-failure-management/1-backup/30-testing-backup-and-restore-of-data). 
  +  [Automating backups and optimizing backup costs for Amazon EFS à l’aide de AWS Backup](https://aws.amazon.com/blogs/storage/automating-backups-and-optimizing-backup-costs-for-amazon-efs-using-aws-backup/). 

## Ressources
<a name="resources"></a>

 **Bonnes pratiques associées:** 
+ [REL09-BP01 Identifier et sauvegarder toutes les données qui doivent être sauvegardées, ou reproduire les données à partir de sources](https://docs.aws.amazon.com/wellarchitected/latest/reliability-pillar/rel_backing_up_data_identified_backups_data.html)
+ [REL09-BP03 Effectuer automatiquement la sauvegarde des données](https://docs.aws.amazon.com/wellarchitected/latest/reliability-pillar/rel_backing_up_data_automated_backups_data.html)
+ [REL13-BP02 Utiliser des stratégies de reprise définies pour répondre aux objectifs de reprise](https://docs.aws.amazon.com/wellarchitected/latest/reliability-pillar/rel_planning_for_recovery_disaster_recovery.html)

 **Documents connexes:** 
+  [Utilisation d’AWS Backup pour la sauvegarde et la restauration des systèmes de fichiers Amazon EFS](https://docs.aws.amazon.com/efs/latest/ug/awsbackup.html) 
+  [Instantanés Amazon EBS](https://docs.aws.amazon.com/AWSEC2/latest/UserGuide/EBSSnapshots.html) 
+  [Utilisation de sauvegardes sur Amazon Relational Database Service](https://docs.aws.amazon.com/AmazonRDS/latest/UserGuide/USER_WorkingWithAutomatedBackups.html) 
+ [ Partenaire APN : partenaires pouvant faciliter la sauvegarde ](https://partners.amazonaws.com/search/partners?keyword=Backup)
+ [AWS Marketplace: produits pouvant être utilisés pour la sauvegarde ](https://aws.amazon.com/marketplace/search/results?searchTerms=Backup)
+ [ Sauvegarde d’Amazon EFS ](https://docs.aws.amazon.com/efs/latest/ug/efs-backup-solutions.html)
+ [ S’auvegarde d’Amazon FSx for Windows File Server ](https://docs.aws.amazon.com/fsx/latest/WindowsGuide/using-backups.html)
+ [ Backup et restauration d’Amazon ElastiCache (Redis OSS) ](https://docs.aws.amazon.com/AmazonElastiCache/latest/red-ug/backups.html)

 **Vidéos connexes:** 
+ [AWS re:Invent 2023 - Backup and disaster recovery strategies for increased resilience](https://www.youtube.com/watch?v=E073XISxrSU)
+ [AWS re:Invent 2023 - What’s new with AWS Backup](https://www.youtube.com/watch?v=QIffkOyTf7I)
+ [AWS re:Invent 2021 - Backup, disaster recovery, and ransomware protection with AWS](https://www.youtube.com/watch?v=Ru4jxh9qazc)