

# SUS04-BP05 Menyingkirkan data yang tidak diperlukan atau redundan
<a name="sus_sus_data_a6"></a>

Hapus data yang tidak diperlukan atau redundan untuk meminimalkan sumber daya penyimpanan yang diperlukan untuk menyimpan set data Anda. 

 **Anti-pola umum:** 
+  Anda menduplikasi data yang dapat diperoleh atau dibuat ulang dengan mudah. 
+  Anda mencadangkan semua data tanpa mempertimbangkan tingkat kekritisannya. 
+  Anda menghapus data tidak rutin, hanya pada peristiwa operasional, atau tidak menghapusnya sama sekali. 
+  Anda menyimpan data secara redundan dengan mengabaikan daya tahan layanan penyimpanan. 
+  Anda mengaktifkan penentuan versi Amazon S3 tanpa alasan bisnis apa pun. 

 **Manfaat menjalankan praktik terbaik ini:** Menghapus data yang tidak dibutuhkan akan mengurangi ukuran penyimpanan yang diperlukan untuk beban kerja Anda dan dampak lingkungan yang ditimbulkan beban kerja Anda. 

 **Tingkat risiko yang terjadi jika praktik terbaik ini tidak diterapkan:** Sedang 

## Panduan implementasi
<a name="implementation-guidance"></a>

 Saat Anda menghapus set data yang tidak dibutuhkan dan redundan, Anda dapat mengurangi biaya penyimpanan dan jejak lingkungan. Praktik ini juga dapat membuat komputasi lebih efisien karena sumber daya komputasi hanya memproses data penting, bukan data yang tidak dibutuhkan. Otomatiskan penghapusan data yang tidak diperlukan. Gunakan teknologi yang melakukan deduplikasi data pada tingkat file dan blok. Gunakan fitur layanan untuk replikasi dan redundansi data native. 

### Langkah-langkah implementasi
<a name="implementation-steps"></a>
+  **Evaluasi set data publik:** Evaluasi apakah Anda dapat menghindari penyimpanan data dengan menggunakan set data yang tersedia untuk umum di [AWS Data Exchange](https://aws.amazon.com/data-exchange/) dan [Data Terbuka di AWS](https://registry.opendata.aws/). 
+  **Lakukan deduplikasi data:** Gunakan mekanisme yang dapat melakukan deduplikasi data pada tingkat blok dan objek. Berikut ini adalah beberapa contoh cara melakukan deduplikasi data di AWS:     
[\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/id_id/wellarchitected/latest/sustainability-pillar/sus_sus_data_a6.html)
+  **Gunakan kebijakan siklus hidup:** Gunakan kebijakan siklus hidup untuk mengotomatiskan penghapusan data yang tidak digunakan. Gunakan fitur-fitur layanan bawaan native seperti [Amazon DynamoDB Time To Live](https://docs.aws.amazon.com/amazondynamodb/latest/developerguide/TTL.html), [Siklus Hidup Amazon S3](https://docs.aws.amazon.com/AmazonS3/latest/userguide/object-lifecycle-mgmt.html), atau [retensi log Amazon CloudWatch](https://docs.aws.amazon.com/managedservices/latest/userguide/log-customize-retention.html) untuk penghapusan. 
+  **Gunakan virtualisasi data:** Gunakan kemampuan virtualisasi data di AWS untuk mempertahankan data di sumbernya dan menghindari duplikasi data. 
  +  [Virtualisasi Data Cloud Native di AWS](https://www.youtube.com/watch?v=BM6sMreBzoA) 
  +  [Optimalkan Pola Data Menggunakan Pembagian Data Amazon Redshift](https://catalog.workshops.aws/well-architected-sustainability/en-US/3-data/optimize-data-pattern-using-redshift-data-sharing) 
+  **Gunakan cadangan bertahap:** Gunakan teknologi pencadangan yang dapat membuat cadangan bertahap. 
+  **Gunakan daya tahan native:** Manfaatkan daya tahan [Amazon S3](https://docs.aws.amazon.com/AmazonS3/latest/userguide/DataDurability.html) dan [replikasi Amazon EBS](https://docs.aws.amazon.com/AWSEC2/latest/UserGuide/ebs-volumes.html) untuk memenuhi tujuan daya tahan Anda, alih-alih teknologi yang dikelola sendiri (seperti susunan disk independen (RAID) yang redundan). 
+  **Gunakan pencatatan log yang efisien:** Pusatkan log dan lacak data, lakukan deduplikasi entri log yang identik, dan buat mekanisme untuk menyesuaikan verbositas saat diperlukan. 
+  **Gunakan caching yang efisien:** Lakukan pra-pengisian cache hanya jika diperlukan. 
+  Lakukan pemantauan dan otomatisasi cache untuk menyesuaikan ukuran cache dengan tepat. 
+  **Hapus aset versi lama:** Hapus deployment dan aset usang dari penyimpanan objek dan cache edge saat mendorong versi baru beban kerja Anda. 

## Sumber daya
<a name="resources"></a>

 **Dokumen terkait:** 
+  [Mengubah retensi data log di CloudWatch Logs](https://docs.aws.amazon.com/AmazonCloudWatch/latest/logs/Working-with-log-groups-and-streams.html#SettingLogRetention) 
+  [Deduplikasi data di Amazon FSx for Windows File Server](https://docs.aws.amazon.com/fsx/latest/WindowsGuide/using-data-dedup.html) 
+  [Fitur Amazon FSx untuk ONTAP meliputi deduplikasi data](https://docs.aws.amazon.com/fsx/latest/ONTAPGuide/what-is-fsx-ontap.html#features-overview) 
+  [Membatalkan Validasi File di Amazon CloudFront](https://docs.aws.amazon.com/AmazonCloudFront/latest/DeveloperGuide/Invalidation.html) 
+  [Menggunakan AWS Backup untuk mencadangkan dan memulihkan sistem file Amazon EFS](https://docs.aws.amazon.com/efs/latest/ug/awsbackup.html) 
+  [Apa itu Log Amazon CloudWatch?](https://docs.aws.amazon.com/AmazonCloudWatch/latest/logs/WhatIsCloudWatchLogs.html) 
+  [Bekerja dengan cadangan di Amazon RDS](https://docs.aws.amazon.com/AmazonRDS/latest/UserGuide/USER_WorkingWithAutomatedBackups.html) 
+  [Mengintegrasikan dan melakukan deduplikasi set data menggunakan AWS Lake Formation](https://aws.amazon.com/blogs/big-data/integrate-and-deduplicate-datasets-using-aws-lake-formation-findmatches/) 

 **Video terkait:** 
+  [Kasus Penggunaan Berbagi Data Amazon Redshift](https://www.youtube.com/watch?v=sIoTB8B5nn4) 

 **Contoh terkait:** 
+  [Bagaimana cara menganalisis log akses server Amazon S3 menggunakan Amazon Athena?](https://aws.amazon.com/premiumsupport/knowledge-center/analyze-logs-athena/) 