

# SUS04-BP05 Entfernen nicht benötigter oder redundanter Daten
<a name="sus_sus_data_a6"></a>

Entfernen Sie nicht benötigte oder redundante Daten, um die zum Speichern Ihrer Datensätze benötigten Speicherressourcen zu minimieren. 

 **Typische Anti-Muster:** 
+  Sie duplizieren Daten, die leicht abgerufen oder erneut erstellt werden können. 
+  Sie sichern alle Daten, ohne ihre Kritikalität zu berücksichtigen. 
+  Sie löschen Daten nur unregelmäßig, nur bei bestimmten Ereignissen oder gar nicht. 
+  Sie speichern Daten redundant, unabhängig von der Stabilität des Speicherservices. 
+  Sie aktivieren die Amazon-S3-Versionsverwaltung, ohne dass dies geschäftlich gerechtfertigt ist. 

 **Vorteile der Einführung dieser bewährten Methode:** Durch das Entfernen nicht benötigter Daten werden die für Ihre Workload benötigte Speichergröße und die Umweltbelastungen durch die Workload reduziert. 

 **Risikostufe, wenn diese bewährte Methode nicht eingeführt wird:** Mittel 

## Implementierungsleitfaden
<a name="implementation-guidance"></a>

 Wenn Sie nicht benötigte und redundante Datensätze entfernen, können Sie die Speicherkosten und den ökologischen Fußabdruck reduzieren. Dieses Verfahren kann auch die Datenverarbeitung effizienter gestalten, da Datenverarbeitungsressourcen nur wichtige Daten und keine unnötigen Daten verarbeiten. Automatisieren Sie das Löschen von nicht benötigten Daten. Verwenden Sie Technologien, die Daten auf Datei- und Blockebene deduplizieren. Verwenden Sie Servicefeatures für native Replikation und Redundanz. 

### Implementierungsschritte
<a name="implementation-steps"></a>
+  **Öffentliche Datensätze bewerten:** Untersuchen Sie, ob Sie das Speichern von Daten vermeiden können, indem Sie vorhandene, öffentlich verfügbare Datensätze in [AWS Data Exchange](https://aws.amazon.com/data-exchange/) und [Offene Daten in AWS](https://registry.opendata.aws/) verwenden. 
+  **Daten deduplizieren:** Verwenden Sie Mechanismen, die Daten auf Block- und Objektebene deduplizieren können. Hier finden Sie einige Beispiele zum Deduplizieren von Daten in AWS:     
[\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/de_de/wellarchitected/latest/sustainability-pillar/sus_sus_data_a6.html)
+  **Lebenszyklusrichtlinien verwenden:** Verwenden Sie Lebenszyklusrichtlinien, damit ungenutzte Komponenten automatisch gelöscht werden. Nutzen Sie zum Löschen native Service-Features wie [Amazon DynamoDB-Gültigkeitsdauer](https://docs.aws.amazon.com/amazondynamodb/latest/developerguide/TTL.html), [Amazon-S3-Lebenszyklen](https://docs.aws.amazon.com/AmazonS3/latest/userguide/object-lifecycle-mgmt.html) oder [Amazon CloudWatch-Protokollaufbewahrung](https://docs.aws.amazon.com/managedservices/latest/userguide/log-customize-retention.html). 
+  **Datenvirtualisierung verwenden:** Verwenden Sie Virtualisierungsfunktionen in AWS, um Daten an der Quelle zu speichern und eine Duplizierung zu vermeiden. 
  +  [Cloudnative Datenvirtualisierung in AWS](https://www.youtube.com/watch?v=BM6sMreBzoA) 
  +  [Optimierung von Datenmustern mithilfe von Amazon Redshift Data Sharing](https://catalog.workshops.aws/well-architected-sustainability/en-US/3-data/optimize-data-pattern-using-redshift-data-sharing) 
+  **Inkrementelle Sicherungen verwenden:** Verwenden Sie Sicherungstechnologien, die inkrementelle Sicherungen ermöglichen. 
+  **Native Stabilität verwenden:** Nutzen Sie die Stabilität von [Amazon S3](https://docs.aws.amazon.com/AmazonS3/latest/userguide/DataDurability.html) und die [Replikation von Amazon EBS](https://docs.aws.amazon.com/AWSEC2/latest/UserGuide/ebs-volumes.html), um Ihre Stabilitätsziele zu erreichen, statt selbst verwaltete Technologien zu verwenden (z. B. ein redundantes Array unabhängiger Datenträger (RAID)). 
+  **Effiziente Protokollierung verwenden:** Zentralisieren Sie Protokoll- und Nachverfolgungsdaten, deduplizieren Sie identische Protokolleinträge und richten Sie Mechanismen für die Anpassung der Ausführlichkeit ein, wenn notwendig. 
+  **Effizientes Caching nutzen:** Füllen Sie Caches nur vorab aus, wenn dies begründet werden kann. 
+  Richten Sie Überwachung und Automatisierung für den Cache ein, um seine Größe entsprechend anzupassen. 
+  **Veraltete Versionsressourcen entfernen:** Entfernen Sie veraltete Bereitstellungen und Komponenten aus Objektspeichern und Edge-Caches, wenn Sie neue Versionen Ihres Workloads veröffentlichen. 

## Ressourcen
<a name="resources"></a>

 **Zugehörige Dokumente:** 
+  [Ändern der Protokoll-Datenaufbewahrung in CloudWatch Logs](https://docs.aws.amazon.com/AmazonCloudWatch/latest/logs/Working-with-log-groups-and-streams.html#SettingLogRetention) 
+  [Datendeduplizierung in Amazon FSx für Windows File Server](https://docs.aws.amazon.com/fsx/latest/WindowsGuide/using-data-dedup.html) 
+  [Amazon FSxs von Amazon FSx für ONTAP einschließlich Datendeduplizierung](https://docs.aws.amazon.com/fsx/latest/ONTAPGuide/what-is-fsx-ontap.html#features-overview) 
+  [Aufheben der Gültigkeit von Dateien in Amazon CloudFront](https://docs.aws.amazon.com/AmazonCloudFront/latest/DeveloperGuide/Invalidation.html) 
+  [Sichern und Wiederherstellen von Amazon-EFS-Dateisystemen mit AWS Backup](https://docs.aws.amazon.com/efs/latest/ug/awsbackup.html) 
+  [What is Amazon CloudWatch Logs?](https://docs.aws.amazon.com/AmazonCloudWatch/latest/logs/WhatIsCloudWatchLogs.html) 
+  [Arbeiten mit Sicherungen in Amazon RDS](https://docs.aws.amazon.com/AmazonRDS/latest/UserGuide/USER_WorkingWithAutomatedBackups.html) 
+  [Integrate and deduplicate datasets using AWS Lake Formation](https://aws.amazon.com/blogs/big-data/integrate-and-deduplicate-datasets-using-aws-lake-formation-findmatches/) 

 **Zugehörige Videos:** 
+  [Amazon Redshift Data Sharing Use Cases](https://www.youtube.com/watch?v=sIoTB8B5nn4) 

 **Zugehörige Beispiele:** 
+  [Wie verwende ich Amazon Athena, um meine Amazon-S3-Serverzugriffsprotokolle zu analysieren?](https://aws.amazon.com/premiumsupport/knowledge-center/analyze-logs-athena/) 