

# SUS04-BP05 Menyingkirkan data yang tidak diperlukan atau redundan
<a name="sus_sus_data_a6"></a>

Hapus data yang tidak diperlukan atau redundan untuk meminimalkan sumber daya penyimpanan yang diperlukan untuk menyimpan set data Anda. 

 **Antipola umum:** 
+  Anda menduplikasi data yang dapat diperoleh atau dibuat ulang dengan mudah 
+  Anda mencadangkan semua data tanpa mempertimbangkan tingkat kekritisannya. 
+  Anda menghapus data tidak rutin, hanya pada peristiwa operasional, atau tidak menghapusnya sama sekali. 
+  Anda menyimpan data secara redundan dengan mengabaikan durabilitas layanan penyimpanan. 
+  Anda mengaktifkan versioning Amazon S3 tanpa alasan bisnis apa pun. 

 **Manfaat menjalankan praktik terbaik ini:** Penghapusan data yang tidak diperlukan dapat mengurangi ukuran penyimpanan yang diperlukan untuk beban kerja Anda serta dampak beban kerja terhadap lingkungan. 

 **Tingkat risiko yang terjadi jika praktik terbaik ini tidak dijalankan:** Sedang 

## Panduan implementasi
<a name="implementation-guidance"></a>

 Jangan menyimpan data yang tidak Anda perlukan. Otomatiskan penghapusan data yang tidak diperlukan. Gunakan teknologi yang menghilangkan data ganda pada tingkat file dan blok. Manfaatkan fitur replikasi dan redundansi data native dari layanan. 

 **Langkah implementasi** 
+  Evaluasi apakah Anda dapat menghindari menyimpan data menggunakan set data yang saat ini tersedia untuk publik di [AWS Data Exchange](https://aws.amazon.com/data-exchange/) dan [Data Terbuka di AWS](https://registry.opendata.aws/). 
+  Gunakan mekanisme yang dapat membatalkan duplikasi data pada tingkat blok dan objek. Berikut ini adalah beberapa contoh cara membatalkan duplikasi data di AWS:     
[\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/id_id/wellarchitected/2024-06-27/framework/sus_sus_data_a6.html)
+  Analisis akses data untuk mengidentifikasi data yang tidak diperlukan. Otomatiskan kebijakan siklus hidup. Manfaatkan fitur layanan native seperti [Amazon DynamoDB Time To Live](https://docs.aws.amazon.com/amazondynamodb/latest/developerguide/TTL.html), [Siklus Hidup Amazon S3](https://docs.aws.amazon.com/AmazonS3/latest/userguide/object-lifecycle-mgmt.html), atau [retensi log Amazon CloudWatch](https://docs.aws.amazon.com/managedservices/latest/userguide/log-customize-retention.html) untuk penghapusan. 
+  Gunakan kemampuan virtualisasi data di AWS untuk mempertahankan data di sumbernya dan menghindari duplikasi data. 
  +  [Virtualisasi Data Cloud Native di AWS](https://www.youtube.com/watch?v=BM6sMreBzoA) 
  +  [Mengoptimalkan Pola Data Menggunakan Pembagian Data Amazon Redshift](https://catalog.workshops.aws/well-architected-sustainability/en-US/3-data/optimize-data-pattern-using-redshift-data-sharing) 
+  Gunakan teknologi pencadangan yang dapat membuat cadangan bertahap. 
+  Manfaatkan durabilitas [Amazon S3](https://docs.aws.amazon.com/AmazonS3/latest/userguide/DataDurability.html) dan [replikasi Amazon EBS](https://docs.aws.amazon.com/AWSEC2/latest/UserGuide/ebs-volumes.html) untuk memenuhi tujuan durabilitas Anda, bukan teknologi yang dikelola mandiri (seperti rangkaian disk independen yang redundan (RAID)). 
+  Pusatkan log dan lacak data, batalkan duplikasi entri log yang identik, dan buat mekanisme untuk menyesuaikan verbositas saat diperlukan. 
+  Pra-isi cache hanya saat ada alasan yang dibenarkan. 
+  Lakukan pemantauan dan otomatisasi cache untuk menyesuaikan ukuran cache dengan tepat. 
+  Singkirkan deployment dan aset usang dari penyimpanan objek dan cache edge saat mendorong versi baru untuk beban kerja Anda. 

## Sumber daya
<a name="resources"></a>

 **Dokumen terkait:** 
+  [Ubah retensi data log di CloudWatch Logs](https://docs.aws.amazon.com/Amazon/latest/logs/Working-with-log-groups-and-streams.html#SettingLogRetention) 
+  [Pembatalan duplikasi data di Amazon FSx untuk Windows File Server](https://docs.aws.amazon.com/fsx/latest/WindowsGuide/using-data-dedup.html) 
+  [Fitur Amazon FSx untuk ONTAP termasuk pembatalan duplikasi data](https://docs.aws.amazon.com/fsx/latest/ONTAPGuide/what-is-fsx-ontap.html#features-overview) 
+  [Membatalkan File di Amazon CloudFront](https://docs.aws.amazon.com/Amazon/latest/DeveloperGuide/Invalidation.html) 
+  [Menggunakan AWS Backup untuk mencadangkan dan memulihkan sistem file Amazon EFS](https://docs.aws.amazon.com/efs/latest/ug/awsbackup.html) 
+  [Apa yang dimaksud dengan Amazon CloudWatch Logs?](https://docs.aws.amazon.com/Amazon/latest/logs/WhatIsLogs.html) 
+  [Bekerja dengan cadangan di Amazon RDS](https://docs.aws.amazon.com/AmazonRDS/latest/UserGuide/USER_WorkingWithAutomatedBackups.html) 
+  [Mengintegrasikan dan membatalkan duplikasi set data menggunakan AWS Lake Formation](https://aws.amazon.com/blogs/big-data/integrate-and-deduplicate-datasets-using-aws-lake-formation-findmatches/) 

 **Video terkait:** 
+  [Amazon Redshift Data Sharing Use Cases](https://www.youtube.com/watch?v=sIoTB8B5nn4) 

 **Contoh terkait:** 
+  [Bagaimana cara menganalisis log akses server Amazon S3 menggunakan Amazon Athena?](https://aws.amazon.com/premiumsupport/knowledge-center/analyze-logs-athena/) 