# SUS04-BP05 Entfernen nicht benötigter oder redundanter Daten
<a name="sus_sus_data_a6"></a>

Entfernen Sie nicht benötigte oder redundante Daten, um die zum Speichern Ihrer Datensätze benötigten Speicherressourcen zu minimieren. 

 **Typische Anti-Muster:** 
+  Sie duplizieren Daten, die leicht abgerufen oder erneut erstellt werden können. 
+  Sie sichern alle Daten, ohne ihre Kritikalität zu berücksichtigen. 
+  Sie löschen Daten nur unregelmäßig, nur bei bestimmten Ereignissen oder gar nicht. 
+  Sie speichern Daten redundant, unabhängig von der Stabilität des Speicherservices. 
+  Sie aktivieren die Amazon S3-Versionsverwaltung, ohne dass dies geschäftlich gerechtfertigt ist. 

 **Vorteile der Einführung dieser bewährten Methode:** Durch das Entfernen nicht benötigter Daten werden die für Ihren Workload benötigte Speichergröße und die Umweltbelastungen durch den Workload reduziert. 

 **Risikostufe, wenn diese bewährte Methode nicht eingeführt wird:** Mittel 

## Implementierungsleitfaden
<a name="implementation-guidance"></a>

 Speichern Sie keine Daten, die Sie nicht benötigen. Automatisieren Sie das Löschen von nicht benötigten Daten. Verwenden Sie Technologien, die Daten auf Datei- und Blockebene deduplizieren. Nutzen Sie native Servicefunktionen für Replikation und Redundanz. 

 **Implementierungsschritte** 
+  Bewerten Sie, ob Sie das Speichern von Daten vermeiden können, indem Sie vorhandene, öffentlich verfügbare Datensätze in [AWS Data Exchange](https://aws.amazon.com/data-exchange/) und [offene Daten in AWS](https://registry.opendata.aws/) verwenden. 
+  Verwenden Sie Mechanismen, die Daten auf Block- und Objektebene deduplizieren können. Hier finden Sie einige Beispiele zum Deduplizieren von Daten in AWS:     
[\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/de_de/wellarchitected/2023-10-03/framework/sus_sus_data_a6.html)
+  Analysieren Sie den Datenzugriff, um nicht benötigte Daten zu identifizieren. Automatisieren Sie Lebenszyklusrichtlinien. Nutzen Sie zum Löschen native Servicefunktionen wie [Amazon DynamoDB Time To Live](https://docs.aws.amazon.com/amazondynamodb/latest/developerguide/TTL.html) [Amazon S3-Lebenszyklen](https://docs.aws.amazon.com/AmazonS3/latest/userguide/object-lifecycle-mgmt.html) oder die [Amazon CloudWatch-Protokollaufbewahrung](https://docs.aws.amazon.com/managedservices/latest/userguide/log-customize-retention.html). 
+  Verwenden Sie Virtualisierungsfunktionen in AWS, um Daten an der Quelle beizubehalten und eine Duplikation zu vermeiden. 
  +  [Cloud Native Data Virtualization on AWS](https://www.youtube.com/watch?v=BM6sMreBzoA) (Cloudnative Datenvirtualisierung in AWS) 
  +  [Lab: Optimize Data Pattern Using Amazon Redshift Data Sharing](https://wellarchitectedlabs.com/sustainability/300_labs/300_optimize_data_pattern_using_redshift_data_sharing/) (Lab: Optimierung von Datenmustern mit Amazon Redshift Data Sharing) 
+  Verwenden Sie Sicherungstechnologien, mit denen inkrementelle Sicherungen möglich sind. 
+  Nutzen Sie zum Erfüllen der Stabilitätsziele die Stabilität von [Amazon S3](https://docs.aws.amazon.com/AmazonS3/latest/userguide/DataDurability.html) und [Replikation von Amazon EBS](https://docs.aws.amazon.com/AWSEC2/latest/UserGuide/ebs-volumes.html) anstelle von selbst verwalteten Technologien wie redundanten Arrays unabhängiger Datenträger (Redundant Array Of Independent Disks, RAID). 
+  Zentralisieren Sie Protokoll- und Nachverfolgungsdaten, deduplizieren Sie identische Protokolleinträge und richten Sie Mechanismen für die Anpassung der Ausführlichkeit ein, wenn notwendig. 
+  Füllen Sie Zwischenspeicher nur vorab aus, wenn dies begründet werden kann. 
+  Richten Sie Überwachung und Automatisierung für den Cache ein, um seine Größe entsprechend anzupassen. 
+  Entfernen Sie veraltete Bereitstellungen und Komponenten aus Objektspeichern und Edge-Zwischenspeichern, wenn Sie neue Versionen Ihres Workloads veröffentlichen. 

## Ressourcen
<a name="resources"></a>

 **Zugehörige Dokumente:** 
+  [Change log data retention in CloudWatch Logs](https://docs.aws.amazon.com/Amazon/latest/logs/Working-with-log-groups-and-streams.html#SettingLogRetention) (Ändern der Protokolldatenaufbewahrung in CloudWatch Logs) 
+  [Data deduplication on Amazon FSx for Windows File Server](https://docs.aws.amazon.com/fsx/latest/WindowsGuide/using-data-dedup.html) (Datendeduplizierung in Amazon FSx für Windows File Server) 
+  [Features of Amazon FSx for ONTAP including data deduplication](https://docs.aws.amazon.com/fsx/latest/ONTAPGuide/what-is-fsx-ontap.html#features-overview) (Funktionen von Amazon FSx for ONTAP einschließlich Datendeduplizierung) 
+  [Invalidating Files on Amazon CloudFront](https://docs.aws.amazon.com/Amazon/latest/DeveloperGuide/Invalidation.html) (Invalidieren von Dateien auf Amazon CloudFront) 
+  [Using AWS Backup to back up and restore Amazon EFS file systems](https://docs.aws.amazon.com/efs/latest/ug/awsbackup.html) (Verwenden von AWS Backup, um Amazon EFS-Dateisysteme zu sichern und wiederherzustellen) 
+  [Was ist Amazon CloudWatch Logs?](https://docs.aws.amazon.com/Amazon/latest/logs/WhatIsLogs.html) 
+  [Working with backups on Amazon RDS](https://docs.aws.amazon.com/AmazonRDS/latest/UserGuide/USER_WorkingWithAutomatedBackups.html) (Arbeiten mit Backups in RDS) 

 **Zugehörige Videos:** 
+  [Fuzzy Matching and Deduplicating Data with ML Transforms for AWS Lake Formation](https://www.youtube.com/watch?v=g34xUaJ4WI4) (Fuzzy Matching und Deduplizieren von Daten mit ML Transforms für AWS Lake Formation) 

 **Zugehörige Beispiele:** 
+  [Wie analysiere ich meine Amazon S3-Serverzugriffsprotokolle mit Amazon Athena?](https://aws.amazon.com/premiumsupport/knowledge-center/analyze-logs-athena/)