

# SUS04-BP05 Remover dados desnecessários ou redundantes
<a name="sus_sus_data_a6"></a>

Remova dados desnecessários ou redundantes para minimizar os recursos de armazenamento necessários para armazenar seus conjuntos de dados. 

 **Práticas comuns que devem ser evitadas:** 
+  Você duplica dados que podem ser facilmente obtidos ou recriados. 
+  Você faz backup de todos os dados sem considerar sua criticidade. 
+  Você apenas exclui dados irregularmente, em eventos operacionais ou não os exclui. 
+  Você armazena dados de forma redundante, independentemente da durabilidade do serviço de armazenamento. 
+  Você ativa o versionamento do Amazon S3 sem qualquer justificativa comercial. 

 **Benefícios de implementar esta prática recomendada:** a remoção de dados desnecessários reduz o tamanho de armazenamento necessário para sua workload e o impacto ambiental causado por ela. 

 **Nível de risco exposto se esta prática recomendada não for estabelecida:** Médio 

## Orientação para implementação
<a name="implementation-guidance"></a>

 Ao remover conjuntos de dados desnecessários e redundantes, você pode reduzir o custo de armazenamento e a pegada ambiental. Essa prática também pode tornar a computação mais eficiente, pois os recursos computacionais processam apenas dados importantes em vez de dados desnecessários. Automatize a exclusão de dados desnecessários. Use tecnologias que eliminam dados duplicados em níveis de arquivo e bloco. Use recursos do serviço para replicação de dados nativos e redundância. 

### Etapas de implementação
<a name="implementation-steps"></a>
+  **Avalie conjuntos de dados públicos:** avalie se você pode evitar o armazenamento de dados usando conjuntos de dados existentes e publicamente disponíveis em [AWS Data Exchange](https://aws.amazon.com/data-exchange/) e [Open Data on AWS](https://registry.opendata.aws/). 
+  **Elimine duplicações de dados:** use mecanismos que possam eliminar duplicações de dados aos níveis do bloco e objeto. Aqui estão alguns exemplos de como eliminar duplicações dados na AWS:     
[\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/pt_br/wellarchitected/latest/sustainability-pillar/sus_sus_data_a6.html)
+  **Use políticas de ciclo de vida:** use políticas de ciclo de vida para automatizar a exclusão de dados não utilizados. Use recursos nativos de serviços, como a [vida útil do Amazon DynamoDB](https://docs.aws.amazon.com/amazondynamodb/latest/developerguide/TTL.html), a [funcionalidade Ciclo de Vida do Amazon S3](https://docs.aws.amazon.com/AmazonS3/latest/userguide/object-lifecycle-mgmt.html) ou a [retenção de logs do Amazon CloudWatch](https://docs.aws.amazon.com/managedservices/latest/userguide/log-customize-retention.html), para exclusão. 
+  **Use a virtualização de dados:** use os recursos de virtualização de dados na AWS para manter os dados em sua origem e evitar a duplicação de dados. 
  +  [Virtualização de dados nativos da nuvem na AWS](https://www.youtube.com/watch?v=BM6sMreBzoA) 
  +  [Otimizar o padrão de dados usando o compartilhamento de dados do Amazon Redshift](https://catalog.workshops.aws/well-architected-sustainability/en-US/3-data/optimize-data-pattern-using-redshift-data-sharing) 
+  **Use backup incremental:** use tecnologia de backup capaz de fazer backups incrementais. 
+  **Use a durabilidade nativa:** aproveite a durabilidade do [Amazon S3](https://docs.aws.amazon.com/AmazonS3/latest/userguide/DataDurability.html) e a [replicação do Amazon EBS](https://docs.aws.amazon.com/AWSEC2/latest/UserGuide/ebs-volumes.html), em vez de tecnologias autogerenciadas (como uma matriz redundante de discos independentes, ou RAID), para atingir suas metas de durabilidade. 
+  **Use o registro em log de maneira eficiente:** centralize o log e rastreie os dados, elimine a duplicação de entradas de log idênticas e estabeleça mecanismos para ajustar a prolixidade quando necessário. 
+  **Use o armazenamento em cache de maneira eficiente:** preencha os caches com antecedência somente quando justificável. 
+  Estabeleça o monitoramento e a automação de cache para redimensionar o cache de forma adequada. 
+  **Remova versões antigas de ativos:** remova implantações e ativos desatualizados dos armazenamentos de objetos e caches de borda ao enviar novas versões da workload. 

## Recursos
<a name="resources"></a>

 **Documentos relacionados:** 
+  [Alterar a retenção de dados de log no CloudWatch Logs](https://docs.aws.amazon.com/AmazonCloudWatch/latest/logs/Working-with-log-groups-and-streams.html#SettingLogRetention) 
+  [Eliminação da duplicação de dados no Amazon FSx para Windows File Server](https://docs.aws.amazon.com/fsx/latest/WindowsGuide/using-data-dedup.html) 
+  [Recursos do Amazon FSx para ONTAP, incluindo a eliminação da duplicação de dados](https://docs.aws.amazon.com/fsx/latest/ONTAPGuide/what-is-fsx-ontap.html#features-overview) 
+  [Invalidação de arquivos no Amazon CloudFront](https://docs.aws.amazon.com/AmazonCloudFront/latest/DeveloperGuide/Invalidation.html) 
+  [Usar o AWS Backup para fazer backup e restaurar sistemas de arquivos do Amazon EFS](https://docs.aws.amazon.com/efs/latest/ug/awsbackup.html) 
+  [O que é o Amazon CloudWatch Logs?](https://docs.aws.amazon.com/AmazonCloudWatch/latest/logs/WhatIsCloudWatchLogs.html) 
+  [Trabalhar com backups no Amazon RDS](https://docs.aws.amazon.com/AmazonRDS/latest/UserGuide/USER_WorkingWithAutomatedBackups.html) 
+  [Integrar e eliminar duplicações de conjuntos de dados usando o AWS Lake Formation](https://aws.amazon.com/blogs/big-data/integrate-and-deduplicate-datasets-using-aws-lake-formation-findmatches/) 

 **Vídeos relacionados:** 
+  [Casos de uso de compartilhamento de dados do Amazon Redshift](https://www.youtube.com/watch?v=sIoTB8B5nn4) 

 **Exemplos relacionados:** 
+  [Como analiso meus logs de acesso ao servidor do Amazon S3 usando o Amazon Athena?](https://aws.amazon.com/premiumsupport/knowledge-center/analyze-logs-athena/) 