# 数据管理
<a name="data"></a>

 实施数据管理实践以减少支持工作负载所需的预置存储，以及使用存储所需的资源。了解您的数据，并使用最能支持数据的商业价值及其使用方式的存储技术和配置。当需求减少时，将数据移到更高效、性能更低的存储中，并删除不再需要的数据。

**Topics**
+ [SUS04-BP01 实施数据分类策略](sus_sus_data_a2.md)
+ [SUS04-BP02 使用支持数据访问和存储模式的技术](sus_sus_data_a3.md)
+ [SUS04-BP03 使用策略管理数据集的生命周期](sus_sus_data_a4.md)
+ [SUS04-BP04 使用弹性和自动化来扩展数据块存储或文件系统](sus_sus_data_a5.md)
+ [SUS04-BP05 删除不需要或多余的数据](sus_sus_data_a6.md)
+ [SUS04-BP06 使用共享文件系统或存储来访问通用数据](sus_sus_data_a7.md)
+ [SUS04-BP07 最大限度地减少跨网络的数据移动](sus_sus_data_a8.md)
+ [SUS04-BP08 仅在难以重新创建时备份数据](sus_sus_data_a9.md)

# SUS04-BP01 实施数据分类策略
<a name="sus_sus_data_a2"></a>

对数据进行分类，以了解其对业务成果的重要性，并选择合适的节能存储层来存储数据。

 **常见反模式：**
+  您没有识别正在处理或存储的具有类似特征（如敏感性、业务关键性或监管要求）的数据资产。
+  没有实施数据目录来清点数据资产。

 **建立这种最佳实践的好处：**实施数据分类策略让您可以确定能效最高的数据存储层。

 **在未建立这种最佳实践的情况下暴露的风险等级：**中 

## 实施指导
<a name="implementation-guidance"></a>

 数据分类涉及识别在由组织拥有或运营的信息系统中正在处理和存储的数据类型。它还涉及到对数据的重要性以及数据泄露、丢失或滥用的可能影响进行判断。

 实施数据分类策略时，要从数据的使用情境进行反推，并创建一个分类方案，该方案考虑到特定数据集对组织运营的重要程度。

### 实施步骤
<a name="implementation-steps"></a>
+ **进行数据清点：**对您的工作负载存在的各种数据类型进行清点。
+ **进行数据分组：**根据给组织带来的风险，确定数据的重要性、机密性、完整性和可用性。使用这些要求将数据分组到您采用的数据分类层之一。例如，请参阅《[对数据进行分类并保护初创企业的四个简单步骤](https://aws.amazon.com/blogs/startups/four-simple-steps-to-classify-your-data-and-secure-your-startup/)》。
+ **定义数据分类级别和策略：**为每个数据组定义数据分类级别（例如，公开或机密）和处理策略。对数据做相应标记。有关数据分类类别的更多详情，请参阅《数据分类白皮书》。
+ **定期检查：**定期检查和审核您的环境中是否有未标记和未分类的数据。使用自动化功能来识别这些数据，并对数据进行适当的分类和标记。例如，请参阅《[AWS Glue 中的数据目录和爬网程序](https://docs.aws.amazon.com/glue/latest/dg/catalog-and-crawler.html)》。
+ **建立数据目录：**建立提供审计和治理功能的数据目录。
+ **文档：**记录每个数据类别的数据分类策略和处理程序。

## 资源
<a name="resources"></a>

 **相关文档：**
+  [利用 AWS 云 支持数据分类](https://docs.aws.amazon.com/whitepapers/latest/data-classification/leveraging-aws-cloud-to-support-data-classification.html) 
+  [来自 AWS Organizations 的标记策略](https://docs.aws.amazon.com/organizations/latest/userguide/orgs_manage_policies_tag-policies.html) 

 **相关视频：**
+ [AWS re:Invent 2022 - Enabling agility with data governance on AWS](https://www.youtube.com/watch?v=vznDgJkoH7k)
+ [AWS re:Invent 2023 - Data protection and resilience with AWS storage ](https://www.youtube.com/watch?v=rdG8JV3Fhk4)

# SUS04-BP02 使用支持数据访问和存储模式的技术
<a name="sus_sus_data_a3"></a>

 使用最能支持您的数据访问和存储方式的存储技术，以在支持您的工作负载的同时最大限度地减少预置资源。

 **常见反模式：**
+  假设所有工作负载都具有相似的数据存储和访问模式。
+  假设所有工作负载都位于一个存储层，且只使用该存储层。
+  假设数据访问模式会随着时间的推移保持一致。

 **建立此最佳实践的好处：**根据数据访问和存储模式选择和优化您的存储技术，有助于您减少满足业务需求所需的云资源，并提高云工作负载的整体效率。

 **在未建立这种最佳实践的情况下暴露的风险等级：**低 

## 实施指导
<a name="implementation-guidance"></a>

 选择最适合您的访问模式的存储解决方案，或者考虑根据存储解决方案更改访问模式，以便尽可能提高性能和效率。

### 实施步骤
<a name="implementation-steps"></a>
+ **评估数据和访问特性：**评估您的数据特性和访问模式，以收集您的存储需求的主要特性。要考虑的主要特性包括：
  +  **数据类型：**结构化、半结构化、非结构化 
  +  **数据增长：**有限、无界 
  +  **数据持久性：**持久、短暂、瞬时 
  +  **访问模式**:读写、频率、峰值或一致 
+ **选择适当的存储技术：**将数据迁移到支持您的数据特征和访问模式的适当存储技术。下面是 AWS 存储技术的一些示例以及它们的主要特性：    
[\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/zh_cn/wellarchitected/latest/sustainability-pillar/sus_sus_data_a3.html)
+ **自动分配存储空间：**对于固定大小的存储系统（例如 Amazon EBS 或 Amazon FSx），请监控可用的存储空间，并在达到阈值时自动分配存储空间。您可以利用 Amazon CloudWatch 来收集和分析 [Amazon EBS](https://docs.aws.amazon.com/AWSEC2/latest/UserGuide/using_cloudwatch_ebs.html) 和 [Amazon FSx](https://docs.aws.amazon.com/fsx/latest/WindowsGuide/monitoring-cloudwatch.html) 的不同指标。
+ **选择合适的存储类：**为您的数据选择合适的存储类。
  +  Amazon S3 可以在对象级别配置存储类。单个存储桶可以包含存储在所有存储类中的对象。
  +  您可以使用 [Amazon S3 生命周期策略](https://docs.aws.amazon.com/AmazonS3/latest/userguide/object-lifecycle-mgmt.html)，在不对应用程序进行任何更改的情况下，于存储类之间自动转换对象或删除数据。通常来说，在考虑这些存储机制时，您必须在资源效率、访问延迟和可靠性之间做出取舍。

## 资源
<a name="resources"></a>

 **相关文档：**
+  [Amazon EBS 卷类型](https://docs.aws.amazon.com/AWSEC2/latest/UserGuide/ebs-volume-types.html) 
+  [Amazon EC2 实例存储](https://docs.aws.amazon.com/AWSEC2/latest/UserGuide/InstanceStorage.html) 
+  [Amazon S3 Intelligent-Tiering](https://docs.aws.amazon.com/AmazonS3/latest/userguide/intelligent-tiering.html) 
+ [Amazon EBS I/O 特性](https://docs.aws.amazon.com/AWSEC2/latest/WindowsGuide/ebs-io-characteristics.html)
+ [使用 Amazon S3 存储类](https://docs.aws.amazon.com/AmazonS3/latest/userguide/storage-class-intro.html)
+  [What is Amazon Glacier?](https://docs.aws.amazon.com/amazonglacier/latest/dev/introduction.html)

 **相关视频：**
+ [AWS re:Invent 2023 - Improve Amazon EBS efficiency and be more cost-efficient ](https://www.youtube.com/watch?v=7-CB02rqiuw)
+ [AWS re:Invent 2023 - Optimizing storage price and performance with Amazon S3 ](https://www.youtube.com/watch?v=RxgYNrXPOLw)
+ [AWS re:Invent 2023 - Building and optimizing a data lake on Amazon S3](https://www.youtube.com/watch?v=mpQa_Zm1xW8)
+ [AWS re:Invent 2022 - Building modern data architectures on AWS](https://www.youtube.com/watch?v=Uk2CqEt5f0o)
+ [AWS re:Invent 2022 - Modernize apps with purpose-built databases ](https://www.youtube.com/watch?v=V-DiplATdi0)
+ [AWS re:Invent 2022 - Building data mesh architectures on AWS](https://www.youtube.com/watch?v=nGRvlobeM_U)
+ [AWS re:Invent 2023 - Deep dive into Amazon Aurora and its innovations ](https://www.youtube.com/watch?v=je6GCOZ22lI)
+ [AWS re:Invent 2023 - Advanced data modeling with Amazon DynamoDB ](https://www.youtube.com/watch?v=PVUofrFiS_A)

 **相关示例：**
+ [Amazon S3 示例](https://docs.aws.amazon.com/sdk-for-javascript/v2/developer-guide/s3-examples.html)
+ [AWS Purpose Built Databases 讲习会](https://catalog.us-east-1.prod.workshops.aws/workshops/93f64257-52be-4c12-a95b-c0a1ff3b7e2b/en-US)
+ [Databases for Developers](https://catalog.workshops.aws/db4devs/en-US)
+ [AWS Modern Data Architecture Immersion Day ](https://catalog.us-east-1.prod.workshops.aws/workshops/32f3e732-d67d-4c63-b967-c8c5eabd9ebf/en-US)
+ [Build a Data Mesh on AWS](https://catalog.us-east-1.prod.workshops.aws/workshops/23e6326b-58ee-4ab0-9bc7-3c8d730eb851/en-US)

# SUS04-BP03 使用策略管理数据集的生命周期
<a name="sus_sus_data_a4"></a>

管理所有数据的生命周期并自动执行删除，以最大限度地减少工作负载所需的总存储。

 **常见反模式：**
+  手动删除数据。
+  不删除任何工作负载数据。
+  不根据数据的保留和访问要求将数据移动到更节能的存储层。

 **建立此最佳实践的好处：**使用数据生命周期策略可确保在工作负载中高效地访问和保留数据。

 **在未建立这种最佳实践的情况下暴露的风险等级：**中 

## 实施指导
<a name="implementation-guidance"></a>

 数据集在其生命周期中通常具有不同的保留和访问要求。例如，应用程序可能需要在有限的时间段内频繁访问某些数据集。之后，这些数据集很少被访问。要随时间推移提高数据存储和计算的效率，请实施生命周期策略，这些策略是定义如何随时间推移来处理数据的规则。

 使用生命周期配置规则，您可以指示特定存储服务将数据集转换到更节能的存储层、将其归档或删除。这种做法可最大限度地减少主动数据存储和检索，从而降低能耗。此外，归档或删除过时数据等做法支持法规遵从性和数据治理。

### 实施步骤
<a name="implementation-steps"></a>
+  **使用数据分类：**[对工作负载中的数据集进行分类。](https://docs.aws.amazon.com/wellarchitected/latest/sustainability-pillar/sus_sus_data_a2.html)
+  **定义处理规则：**定义每个数据类的处理过程。
+  **启用自动化：**设置自动化生命周期策略以强制实施生命周期规则。以下是如何为不同 AWS 存储服务设置自动化生命周期策略的一些示例：    
[\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/zh_cn/wellarchitected/latest/sustainability-pillar/sus_sus_data_a4.html)
+  **删除未使用的资产：**删除未使用的卷、快照和超出保留期的数据。使用原生服务功能（如 [Amazon DynamoDB 生存时间](https://docs.aws.amazon.com/amazondynamodb/latest/developerguide/TTL.html)或 [Amazon CloudWatch log retention](https://docs.aws.amazon.com/AmazonCloudWatch/latest/logs/Working-with-log-groups-and-streams.html#SettingLogRetention)）进行删除。
+  **聚合和压缩：**在适当的情况下根据生命周期规则聚合和压缩数据。

## 资源
<a name="resources"></a>

 **相关文档：**
+  [使用 Amazon S3 存储类分析优化您的 Amazon S3 生命周期规则](https://docs.aws.amazon.com/AmazonS3/latest/userguide/analytics-storage-class.html) 
+  [使用 AWS Config 规则](https://docs.aws.amazon.com/config/latest/developerguide/evaluate-config.html) 评估资源 

 **相关视频：**
+ [AWS re:Invent 2021 - Amazon S3 Lifecycle best practices to optimize your storage spend ](https://www.youtube.com/watch?v=yGNXn7jOytA)
+ [AWS re:Invent 2023 - Optimizing storage price and performance with Amazon S3 ](https://www.youtube.com/watch?v=RxgYNrXPOLw)
+  [利用 Amazon S3 生命周期简化您的数据生命周期并优化存储成本](https://www.youtube.com/watch?v=53eHNSpaMJI) 
+ [使用 Amazon S3 Storage Lens 存储统计管理工具减少您的存储成本](https://www.youtube.com/watch?v=A8qOBLM6ITY)

# SUS04-BP04 使用弹性和自动化来扩展数据块存储或文件系统
<a name="sus_sus_data_a5"></a>

随着数据的增长，使用弹性和自动化来扩展数据块存储或文件系统，以便最大限度减少总预置存储。

 **常见反模式：**
+  购买大型数据块存储或文件系统以备将来需要。
+  过度预置文件系统的每秒输入和输出操作数（IOPS）。
+  不监控数据卷的利用率。

 **建立此最佳实践的好处：**最大限度地减少存储系统的过度预置可以减少闲置资源并提高工作负载的整体效率。

 **在未建立这种最佳实践的情况下暴露的风险等级：**中 

## 实施指导
<a name="implementation-guidance"></a>

 根据适合工作负载的大小分配、吞吐量和延迟，创建数据块存储和文件系统。随着数据的增长，使用弹性和自动化来扩展数据块存储或文件系统，而无需过度预置这些存储服务。

### 实施步骤
<a name="implementation-steps"></a>
+  对于固定大小的存储系统（例如 [Amazon EBS](https://aws.amazon.com/ebs/)），请确保您正在监控使用的存储量与总体存储量大小之间的关系，可能的话创建自动化，以便在达到阈值时增加存储大小 
+  使用弹性卷和托管式数据块数据服务，随着持久性数据的增长自动分配额外的存储。例如，您可以使用 [Amazon EBS 弹性卷](https://docs.aws.amazon.com/AWSEC2/latest/UserGuide/ebs-modify-volume.html)来更改卷大小、卷类型或调整 Amazon EBS 卷的性能。
+  为您的文件系统选择适合的存储类、性能模式和吞吐量模式，以满足您的业务需求，不要超过这个需求。
  + [Amazon EFS 性能](https://docs.aws.amazon.com/efs/latest/ug/performance.html)
  + [Linux 实例上的 Amazon EBS 卷性能](https://docs.aws.amazon.com/AWSEC2/latest/UserGuide/EBSPerformance.html)
+  为您的数据卷设置目标利用率水平，并调整超出预期范围的卷大小。
+  合理调整只读卷的大小以适应数据。
+  将数据迁移到对象存储，以避免使用数据块存储上的固定卷大小预置多余容量。
+  定期检查弹性卷和文件系统，终止空闲卷并缩减过度预置的资源，以适应当前数据大小。

## 资源
<a name="resources"></a>

 **相关文档：**
+ [调整 EBS 卷大小后扩展文件系统](https://docs.aws.amazon.com/ebs/latest/userguide/recognize-expanded-volume-linux.html)
+ [使用 Amazon EBS 弹性卷修改卷](https://docs.aws.amazon.com/ebs/latest/userguide/ebs-modify-volume.html)
+  [Amazon FSx 文档](https://docs.aws.amazon.com/fsx/index.html) 
+  [什么是 Amazon Elastic File System？](https://docs.aws.amazon.com/efs/latest/ug/whatisefs.html) 

 **相关视频：**
+ [深入了解 Amazon EBS 弹性卷](https://www.youtube.com/watch?v=Vi_1Or7QuOg)
+ [用于提高性能和节省成本的 Amazon EBS 和快照优化策略](https://www.youtube.com/watch?v=h1hzRCsJefs)
+ [使用最佳实践优化 Amazon EFS 的成本和性能](https://www.youtube.com/watch?v=9kfeh6_uZY8)

# SUS04-BP05 删除不需要或多余的数据
<a name="sus_sus_data_a6"></a>

删除不需要或多余的数据，以最大程度地减少存储数据集所需的存储资源。

 **常见反模式：**
+  复制可以轻松获取或重新创建的数据。
+  备份所有数据时不考虑其重要性。
+  只不定期地删除数据、操作事件时删除数据，或者根本不删除数据。
+  无论存储服务的持久性如何，都冗余地存储数据。
+  您在没有任何业务理由的情况下启用 Amazon S3 版本控制。

 **建立此最佳实践的好处：**删除不需要的数据可以减少工作负载所需的存储大小和工作负载对环境的影响。

 **在未建立这种最佳实践的情况下暴露的风险等级：**中 

## 实施指导
<a name="implementation-guidance"></a>

 当您移除不需要和冗余的数据集时，可以降低存储成本和环境足迹。这种做法还可以提高计算效率，因为计算资源只处理重要的数据，而不处理不需要的数据。自动删除不需要的数据。使用技术在文件和数据块级别进行重复数据删除。使用服务功能来实现原生数据复制和冗余。

### 实施步骤
<a name="implementation-steps"></a>
+  **评估公开数据集：**评估是否可以通过使用 [AWS Data Exchange](https://aws.amazon.com/data-exchange/) 和 [Open Data on AWS](https://registry.opendata.aws/) 中现有公开可用的数据集来避免存储数据。
+  **删除重复数据：**使用可以在数据块和对象级别删除重复数据的机制。以下是有关如何删除 AWS 上的重复数据的一些示例：    
[\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/zh_cn/wellarchitected/latest/sustainability-pillar/sus_sus_data_a6.html)
+  **使用生命周期策略：**使用生命周期策略来自动删除不需要的数据。使用原生服务功能（如 [Amazon DynamoDB 生存时间](https://docs.aws.amazon.com/amazondynamodb/latest/developerguide/TTL.html)、[Amazon S3 生命周期](https://docs.aws.amazon.com/AmazonS3/latest/userguide/object-lifecycle-mgmt.html)或 [Amazon CloudWatch log retention](https://docs.aws.amazon.com/managedservices/latest/userguide/log-customize-retention.html)）进行删除。
+  **使用数据虚拟化：**使用 AWS 上的数据虚拟化功能在源头维护数据并避免数据重复。
  +  [AWS 上的云原生数据虚拟化](https://www.youtube.com/watch?v=BM6sMreBzoA) 
  +  [Optimize Data Pattern Using Amazon Redshift Data Sharing](https://catalog.workshops.aws/well-architected-sustainability/en-US/3-data/optimize-data-pattern-using-redshift-data-sharing) 
+  **使用增量备份：**使用可进行增量备份的备份技术。
+  **使用原生持久性：**利用 [Amazon S3](https://docs.aws.amazon.com/AmazonS3/latest/userguide/DataDurability.html) 的持久性和 [Amazon EBS 的复制](https://docs.aws.amazon.com/AWSEC2/latest/UserGuide/ebs-volumes.html)来实现您的持久性目标，而不是使用自行管理的技术 [例如独立磁盘冗余阵列（RAID）]。
+  **使用高效的日志记录：**集中日志和跟踪数据，对相同的日志条目进行重复数据删除，并在需要时建立调整详细程度的机制。
+  **使用高效的缓存：**仅在合理的情况下预填充缓存。
+  建立缓存监控和自动化以相应地调整缓存大小。
+  **移除旧的版本资产：**推送新版本的工作负载时，从对象存储和边缘缓存中移除过时的部署和资产。

## 资源
<a name="resources"></a>

 **相关文档：**
+  [更改 CloudWatch Logs 中的日志数据留存](https://docs.aws.amazon.com/AmazonCloudWatch/latest/logs/Working-with-log-groups-and-streams.html#SettingLogRetention) 
+  [适用于 Windows File Server 的 Amazon FSx 的重复数据删除](https://docs.aws.amazon.com/fsx/latest/WindowsGuide/using-data-dedup.html) 
+  [Amazon FSx for ONTAP 的功能，包括重复数据删除](https://docs.aws.amazon.com/fsx/latest/ONTAPGuide/what-is-fsx-ontap.html#features-overview) 
+  [使 Amazon CloudFront 上的文件失效](https://docs.aws.amazon.com/AmazonCloudFront/latest/DeveloperGuide/Invalidation.html) 
+  [使用 AWS Backup 备份和恢复 Amazon EFS 文件系统](https://docs.aws.amazon.com/efs/latest/ug/awsbackup.html) 
+  [什么是 Amazon CloudWatch Logs？](https://docs.aws.amazon.com/AmazonCloudWatch/latest/logs/WhatIsCloudWatchLogs.html) 
+  [在 Amazon RDS 上使用备份](https://docs.aws.amazon.com/AmazonRDS/latest/UserGuide/USER_WorkingWithAutomatedBackups.html) 
+  [使用 AWS Lake Formation 集成数据集并删除其中的重复数据](https://aws.amazon.com/blogs/big-data/integrate-and-deduplicate-datasets-using-aws-lake-formation-findmatches/) 

 **相关视频：**
+  [Amazon Redshift 数据共享用例](https://www.youtube.com/watch?v=sIoTB8B5nn4) 

 **相关示例：**
+  [如何使用 Amazon Athena 分析我的 Amazon S3 服务器访问日志？](https://aws.amazon.com/premiumsupport/knowledge-center/analyze-logs-athena/) 

# SUS04-BP06 使用共享文件系统或存储来访问通用数据
<a name="sus_sus_data_a7"></a>

采用共享文件系统或存储来避免数据重复，并可为工作负载提供更高效的基础设施。

 **常见反模式：**
+  为每个客户端预置存储。
+  未卸下不活动的客户端的数据卷。
+  不提供跨平台和系统的存储访问。

 **建立此最佳实践的好处：**使用共享文件系统或存储可以将数据共享给一个或多个使用者，而无需复制数据。这有助于减少工作负载所需的存储资源。

 **在未建立这种最佳实践的情况下暴露的风险等级：**中 

## 实施指导
<a name="implementation-guidance"></a>

 如果您有多个用户或应用程序访问同一个数据集，则使用共享存储技术很重要，这可以让工作负载高效地使用基础设施。共享存储技术提供一个位置来集中存储和管理数据集并避免数据重复。它还加强了不同系统之间数据的一致性。此外，因为多个计算资源会同时并行访问和处理数据，所以利用共享存储技术可以更高效地使用计算能力。

 仅在需要时才从这些共享存储服务中提取数据，并卸下未使用的卷以释放资源。

### 实施步骤
<a name="implementation-steps"></a>
+  **使用共享存储：**当数据具有多个使用者时，将数据迁移到共享存储。下面是 AWS 上的共享存储技术的一些示例：    
[\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/zh_cn/wellarchitected/latest/sustainability-pillar/sus_sus_data_a7.html)
+  **根据需要提取数据：**仅在需要时，才将数据复制到共享文件系统或从共享文件系统提取数据。例如，您可以创建[由 Amazon S3 支持的适用于 Lustre 的 Amazon FSx 文件系统](https://aws.amazon.com/blogs/storage/new-enhancements-for-moving-data-between-amazon-fsx-for-lustre-and-amazon-s3/)，并且只将处理任务所需的数据子集加载到 Amazon FSx。
+  **删除不需要的数据：**根据您的使用规律适当删除数据，如 [SUS04-BP03 使用策略管理数据集的生命周期](sus_sus_data_a4.md)中所述。
+  **分离不活动的客户端：**将卷与未积极使用它们的客户端分离。

## 资源
<a name="resources"></a>

 **相关文档：**
+ [将文件系统链接到 Amazon S3 存储桶](https://docs.aws.amazon.com/fsx/latest/LustreGuide/create-dra-linked-data-repo.html)
+ [在您的无服务器应用程序中使用 AWS Lambda Amazon EFS](https://aws.amazon.com/blogs/compute/using-amazon-efs-for-aws-lambda-in-your-serverless-applications/)
+ [Amazon EFS Intelligent-Tiering 通过不断变化的访问模式来优化工作负载的成本](https://aws.amazon.com/blogs/aws/new-amazon-efs-intelligent-tiering-optimizes-costs-for-workloads-with-changing-access-patterns/)
+ [将 Amazon FSx 用于您的本地数据存储库](https://docs.aws.amazon.com/fsx/latest/LustreGuide/fsx-on-premises.html)

 **相关视频：**
+ [使用 Amazon EFS 优化存储成本](https://www.youtube.com/watch?v=0nYAwPsYvBo)
+ [AWS re:Invent 2023 - What's new with AWS file storage](https://www.youtube.com/watch?v=yXIeIKlTFV0)
+ [AWS re:Invent 2023 - File storage for builders and data scientists on Amazon Elastic File System](https://www.youtube.com/watch?v=g0f6lrmEyRM)

# SUS04-BP07 最大限度地减少跨网络的数据移动
<a name="sus_sus_data_a8"></a>

使用共享文件系统或对象存储来访问通用数据，并最大限度地减少支持工作负载数据移动所需的总网络资源。

 **常见反模式：**
+  不管数据用户位于何处，将所有数据存储在同一个 AWS 区域。
+  在网络中移动数据之前不优化数据大小和格式。

 **建立此最佳实践的好处：**优化跨网络的数据移动可以减少工作负载所需的总网络资源，并降低对环境的影响。

 **在未建立这种最佳实践的情况下暴露的风险等级：**中 

## 实施指导
<a name="implementation-guidance"></a>

 在组织中移动数据需要计算、网络和存储资源。使用相应的技术最大程度地减少数据移动并提高工作负载的整体效率。

## 实施步骤
<a name="implementation-steps"></a>
+  **使用邻近性：**在 [selecting a Region for your workload](https://aws.amazon.com/blogs/architecture/how-to-select-a-region-for-your-workload-based-on-sustainability-goals/) 时，请考虑将与数据或用户的距离作为一项决定因素。
+  **对服务进行分区：**对按区域使用的服务进行分区，以便将其特定于区域的数据存储在使用它的区域内。
+  **使用高效的文件格式：**使用高效的文件格式（如 Parquet 或 ORC），并在通过网络移动数据之前先对其进行压缩。
+  **尽量减少数据移动：**不移动未使用的数据。一些让您能够避免移动未使用数据的示例：
  +  将 API 响应缩减到仅针对相关数据。
  +  聚合详细数据（不需要记录级别信息）。
  +  请参阅 [Well-Architected Lab - Optimize Data Pattern Using Amazon Redshift Data Sharing](https://catalog.workshops.aws/well-architected-sustainability/en-US/3-data/optimize-data-pattern-using-redshift-data-sharing)。
  +  考虑 [AWS Lake Formation 中的跨账户数据共享](https://docs.aws.amazon.com/lake-formation/latest/dg/cross-account-permissions.html)。
+  **使用边缘服务：**使用有助于您在更接近工作负载用户的位置运行代码的服务。    
[\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/zh_cn/wellarchitected/latest/sustainability-pillar/sus_sus_data_a8.html)

## 资源
<a name="resources"></a>

 **相关文档：**
+  [优化您的 AWS 基础设施以实现可持续性，第 III 部分：联网](https://aws.amazon.com/blogs/architecture/optimizing-your-aws-infrastructure-for-sustainability-part-iii-networking/) 
+  [AWS 全球基础设施](https://aws.amazon.com/about-aws/global-infrastructure/) 
+  [Amazon CloudFront 主要功能，包括 CloudFront 全球边缘网络](https://aws.amazon.com/cloudfront/features/) 
+  [在 Amazon OpenSearch Service 中压缩 HTTP 请求](https://docs.aws.amazon.com/opensearch-service/latest/developerguide/gzip.html) 
+  [使用 Amazon EMR 进行中间数据压缩](https://docs.aws.amazon.com/emr/latest/ManagementGuide/emr-plan-output-compression.html#HadoopIntermediateDataCompression) 
+  [从 Amazon S3 将压缩数据文件加载到 Amazon Redshift 中](https://docs.aws.amazon.com/redshift/latest/dg/t_loading-gzip-compressed-data-files-from-S3.html) 
+  [通过 Amazon CloudFront 提供压缩文件](https://docs.aws.amazon.com/AmazonCloudFront/latest/DeveloperGuide/ServingCompressedFiles.html) 

 **相关视频：**
+ [揭秘 AWS 上的数据传输](https://www.youtube.com/watch?v=-MqXgzw1IGA)

# SUS04-BP08 仅在难以重新创建时备份数据
<a name="sus_sus_data_a9"></a>

避免备份没有商业价值的数据，尽量减少工作负载的存储资源需求。

 **常见反模式：**
+  没有为数据制定备份策略。
+  备份可以轻松重新创建的数据。

 **建立此最佳实践的好处：**避免备份非关键数据可以减少工作负载所需的存储资源并降低其对环境的影响。

 **在未建立这种最佳实践的情况下暴露的风险等级：**中 

## 实施指导
<a name="implementation-guidance"></a>

 避免备份不必要的数据有助于降低成本和减少工作负载使用的存储资源。仅备份具有商业价值或满足合规性要求所必需的数据。检查备份策略并在恢复方案中排除没有价值的临时存储。

### 实施步骤
<a name="implementation-steps"></a>
+  **对数据进行分类：**实施 [SUS04-BP01 实施数据分类策略](sus_sus_data_a2.md)中概述的数据分类策略。
+  **设计备份策略：**使用数据分类的重要性，并根据[恢复时间目标（RTO）和恢复点目标（RPO）](https://docs.aws.amazon.com/wellarchitected/latest/reliability-pillar/rel_planning_for_recovery_objective_defined_recovery.html)来设计备份策略。避免备份非关键数据。
  +  排除可以轻松重新创建的数据。
  +  从备份中排除临时数据。
  +  排除数据的本地副本，除非从公共位置恢复该数据所需的时间会超过您的服务等级协议（SLA）。
+  **使用自动备份：**使用自动化解决方案或托管式服务来备份业务关键的数据。
  +  [AWS Backup](https://docs.aws.amazon.com/aws-backup/latest/devguide/whatisbackup.html) 是一项完全托管式服务，助您轻松地在云中以及在本地集中管理和自动执行跨 AWS 服务的数据保护。有关如何使用 AWS Backup 创建自动备份的动手实践指导，请参阅 [Well-Architected Lab - Testing Backup and Restore of Data](https://catalog.workshops.aws/well-architected-reliability/en-US/4-failure-management/1-backup/30-testing-backup-and-restore-of-data)。
  +  [使用 AWS Backup 自动执行 Amazon EFS 备份并优化备份成本](https://aws.amazon.com/blogs/storage/automating-backups-and-optimizing-backup-costs-for-amazon-efs-using-aws-backup/)。

## 资源
<a name="resources"></a>

 **相关最佳实践：**
+ [REL09-BP01 识别并备份需要备份的所有数据或从源复制数据](https://docs.aws.amazon.com/wellarchitected/latest/reliability-pillar/rel_backing_up_data_identified_backups_data.html)
+ [REL09-BP03 自动执行数据备份](https://docs.aws.amazon.com/wellarchitected/latest/reliability-pillar/rel_backing_up_data_automated_backups_data.html)
+ [REL13-BP02 使用定义的恢复策略来实现恢复目标](https://docs.aws.amazon.com/wellarchitected/latest/reliability-pillar/rel_planning_for_recovery_disaster_recovery.html)

 **相关文档：**
+  [使用 AWS Backup 备份和恢复 Amazon EFS 文件系统](https://docs.aws.amazon.com/efs/latest/ug/awsbackup.html) 
+  [Amazon EBS 快照](https://docs.aws.amazon.com/AWSEC2/latest/UserGuide/EBSSnapshots.html) 
+  [使用 Amazon Relational Database Service 上的备份](https://docs.aws.amazon.com/AmazonRDS/latest/UserGuide/USER_WorkingWithAutomatedBackups.html) 
+ [APN 合作伙伴：可帮助进行备份的合作伙伴](https://partners.amazonaws.com/search/partners?keyword=Backup)
+ [AWS Marketplace：可用于备份的产品](https://aws.amazon.com/marketplace/search/results?searchTerms=Backup)
+ [Backing Up Amazon EFS](https://docs.aws.amazon.com/efs/latest/ug/efs-backup-solutions.html)
+ [Backing Up Amazon FSx for Windows File Server](https://docs.aws.amazon.com/fsx/latest/WindowsGuide/using-backups.html)
+ [Amazon ElastiCache (Redis OSS) 的备份和还原](https://docs.aws.amazon.com/AmazonElastiCache/latest/red-ug/backups.html)

 **相关视频：**
+ [AWS re:Invent 2023 - Backup and disaster recovery strategies for increased resilience](https://www.youtube.com/watch?v=E073XISxrSU)
+ [AWS re:Invent 2023 - What's new with AWS Backup](https://www.youtube.com/watch?v=QIffkOyTf7I)
+ [AWS re:Invent 2021 - Backup, disaster recovery, and ransomware protection with AWS](https://www.youtube.com/watch?v=Ru4jxh9qazc)