

# 数据模式
<a name="a-sus-data-patterns"></a>

**Topics**
+ [SUS 4 您如何利用数据访问模式和使用模式来支持您的可持续发展目标？](w2aac19c15c11b5.md)

# SUS 4 您如何利用数据访问模式和使用模式来支持您的可持续发展目标？
<a name="w2aac19c15c11b5"></a>

实施数据管理实践以减少支持工作负载所需的预置存储，以及使用存储所需的资源。了解您的数据，并使用最能支持数据的商业价值及其使用方式的存储技术和配置。当需求减少时，将数据移到更高效、性能更低的存储中，并删除不再需要的数据。 

 最佳实践： 

# SUS04-BP01 实施数据分类策略
<a name="sus_sus_data_a2"></a>

 对数据进行分类以了解其对业务成果的重要性。使用此信息来确定何时可以将数据移动到更节能的存储，或者何时可以安全删除数据。 

 **未建立此最佳实践暴露的风险等级：** 低 

## 实施指导
<a name="implementation-guidance"></a>
+  确定数据的分发、保留和删除要求。 
+  对卷和对象使用标记来记录用于确定其管理方式的元数据，包括数据分类。 
+  针对未标记和未分类的数据定期审核您的环境，并对数据进行适当的分类和标记。 

## 资源
<a name="resources"></a>

 **相关文档：** 
+  [数据分类过程](https://docs.aws.amazon.com/whitepapers/latest/data-classification/data-classification-process.html) 
+  [利用 AWS 云 支持数据分类](https://docs.aws.amazon.com/whitepapers/latest/data-classification/leveraging-aws-cloud-to-support-data-classification.html) 
+  [AWS Organizations 中的标记策略](https://docs.aws.amazon.com/organizations/latest/userguide/orgs_manage_policies_tag-policies.html) 

# SUS04-BP02 使用支持数据访问和存储模式的技术
<a name="sus_sus_data_a3"></a>

 使用最能支持您的数据访问和存储方式的存储，以在支持您的工作负载的同时最大限度地减少预置资源。例如，固态硬盘（SSD，Solid State Device）比磁性驱动器更耗能，应该仅用于活跃的数据使用场景。对不常访问的数据使用节能的存档级存储。 

 **未建立此最佳实践暴露的风险等级：** 中 

## 实施指导
<a name="implementation-guidance"></a>
+  监控您的数据访问模式。 
+  根据访问模式将数据迁移到适当的技术。 
+  将存档数据迁移到为此目的设计的存储中。 

## 资源
<a name="resources"></a>

 **相关文档：** 
+  [Amazon EBS 卷类型](https://docs.aws.amazon.com/AWSEC2/latest/UserGuide/ebs-volume-types.html) 
+  [Amazon EC2 实例存储](https://docs.aws.amazon.com/AWSEC2/latest/UserGuide/InstanceStorage.html) 
+  [Amazon S3 Intelligent-Tiering](https://docs.aws.amazon.com/AmazonS3/latest/userguide/intelligent-tiering.html) 
+  [使用 Amazon S3 存储类](https://docs.aws.amazon.com/AmazonS3/latest/userguide/storage-class-intro.html) 
+  [什么是 Amazon CloudWatch？](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/WhatIsCloudWatch.html) 
+  [什么是 Amazon Glacier？](https://docs.aws.amazon.com/amazonglacier/latest/dev/introduction.html) 

 **相关视频：** 
+  [AWS 上数据湖的架构模式](https://www.youtube.com/watch?v=XpTly4XHmqc&ab_channel=AWSEvents) 

# SUS04-BP03 使用生命周期策略删除不必要的数据
<a name="sus_sus_data_a4"></a>

 管理所有数据的生命周期并自动执行删除时间表，以最大限度地减少工作负载的总存储需求。 

 **未建立这种最佳实践的情况下暴露的风险等级：** 低 

## 实施指导
<a name="implementation-guidance"></a>
+  为所有数据分类类型定义生命周期策略。 
+  设置自动化生命周期策略以强制实施生命周期规则。 
+  删除未使用的卷和快照。 
+  在适当情况下根据生命周期规则汇总数据。 

## 资源
<a name="resources"></a>

 **相关文档：** 
+  [Amazon ECR 生命周期策略](https://docs.aws.amazon.com/AmazonECR/latest/userguide/LifecyclePolicies.html) 
+  [Amazon EFS 生命周期管理](https://docs.aws.amazon.com/efs/latest/ug/lifecycle-management-efs.html) 
+  [Amazon S3 Intelligent-Tiering](https://docs.aws.amazon.com/AmazonS3/latest/userguide/intelligent-tiering.html) 
+  [使用 AWS Config 规则 评估资源](https://docs.aws.amazon.com/config/latest/developerguide/evaluate-config.html) 
+  [在 Amazon S3 上管理存储生命周期](https://docs.aws.amazon.com/AmazonS3/latest/dev/object-lifecycle-mgmt.html) 
+  [AWS Elemental MediaStore 中的对象生命周期策略](https://docs.aws.amazon.com/mediastore/latest/ug/policies-object-lifecycle.html) 

 **相关视频：** 
+  [Amazon S3 生命周期](https://www.youtube.com/watch?v=53eHNSpaMJI&ab_channel=AmazonWebServices) 

# SUS04-BP04 最大限度地减少数据块存储中的过度预置
<a name="sus_sus_data_a5"></a>

 要尽可能减少总预置存储，请创建大小分配适合工作负载的数据块存储。随着数据的增长，使用弹性卷扩展存储，而无需调整附加到计算资源的存储大小。定期检查弹性卷并缩小过度配置的卷，以适应当前数据大小。 

 **未建立这种最佳实践的情况下暴露的风险等级：** 低 

## 实施指导
<a name="implementation-guidance"></a>
+  监控数据卷的利用率。 
+  使用弹性卷和托管式数据块数据服务，随着持久性数据的增长自动分配额外的存储。 
+  为您的数据卷设置目标利用率水平，并调整超出预期范围的卷大小。 
+  调整只读卷的大小以适应数据。 
+  将数据迁移到对象存储，以避免使用数据块存储上的固定卷大小预配多余容量。 

## 资源
<a name="resources"></a>

 **相关文档：** 
+  [Amazon EBS 弹性卷](https://docs.aws.amazon.com/AWSEC2/latest/UserGuide/ebs-modify-volume.html) 
+  [Amazon FSx 文档](https://docs.aws.amazon.com/fsx/index.html) 
+  [什么是 Amazon CloudWatch？](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/WhatIsCloudWatch.html) 
+  [什么是 Amazon Elastic File System？](https://docs.aws.amazon.com/efs/latest/ug/whatisefs.html) 

# SUS04-BP05 删除不需要或多余的数据
<a name="sus_sus_data_a6"></a>

 仅在必要时复制数据，以最大程度地减少消耗的总存储空间。使用备份技术在文件和数据块级别进行重复数据删除。限制使用独立驱动器冗余阵列（RAID，Redundant Array of Independent Drives）配置，除非需要满足服务等级协议（SLA，Service Level Agreements）。 

 **未建立这种最佳实践的情况下暴露的风险等级：** 低 

## 实施指导
<a name="implementation-guidance"></a>
+  使用可以在数据块和对象级别删除重复数据的机制。 
+  使用可以进行增量备份的备份技术，并在数据块、文件和对象级别删除重复数据。 
+  仅在需要满足您的 SLA 时才使用 RAID。 
+  集中日志和跟踪数据，对相同的日志条目进行重复数据删除，并在需要时建立调整详细程度的机制。 
+  仅在合理的情况下预填充缓存。 
+  建立缓存监控和自动化以相应地调整缓存大小。 
+  推送新版本的工作负载时，从对象存储和边缘缓存中删除过时的部署和资产。 

## 资源
<a name="resources"></a>

 **相关文档：** 
+  [Amazon EBS 快照](https://docs.aws.amazon.com/AWSEC2/latest/UserGuide/EBSSnapshots.html) 
+  [更改 CloudWatch Logs 中的日志数据留存](https://docs.aws.amazon.com/AmazonCloudWatch/latest/logs/Working-with-log-groups-and-streams.html#SettingLogRetention) 
+  [Amazon FSx for Windows File Server 上的重复数据删除](https://docs.aws.amazon.com/fsx/latest/WindowsGuide/using-data-dedup.html) 
+  [Amazon FSx for ONTAP 的功能，包括重复数据删除](https://docs.aws.amazon.com/fsx/latest/ONTAPGuide/what-is-fsx-ontap.html#features-overview) 
+  [使 Amazon CloudFront 上的文件失效](https://docs.aws.amazon.com/AmazonCloudFront/latest/DeveloperGuide/Invalidation.html) 
+  [使用 AWS Backup 备份和还原 Amazon EFS 文件系统](https://docs.aws.amazon.com/efs/latest/ug/awsbackup.html) 
+  [什么是 Amazon CloudWatch Logs？](https://docs.aws.amazon.com/AmazonCloudWatch/latest/logs/WhatIsCloudWatchLogs.html) 
+  [在 Amazon RDS 上使用备份](https://docs.aws.amazon.com/AmazonRDS/latest/UserGuide/USER_WorkingWithAutomatedBackups.html) 

 **相关示例：** 
+  [实验：使用 Amazon Redshift 数据共享优化数据模式](https://wellarchitectedlabs.com/sustainability/300_labs/300_optimize_data_pattern_using_redshift_data_sharing/) 

# SUS04-BP06 使用共享文件系统或对象存储来访问通用数据
<a name="sus_sus_data_a7"></a>

 采用共享存储和单一事实来源，以避免重复数据删除并降低工作负载的总存储需求。仅在需要时从共享存储中获取数据。分离未使用的卷以使更多资源可用。 

 **未建立此最佳实践暴露的风险等级：** 低 

## 实施指导
<a name="implementation-guidance"></a>
+  当数据具有多个使用者时，将数据迁移到共享存储。 
+  仅在需要时从共享存储中获取数据。 
+  根据您的使用模式删除数据，并实施生存时间（TTL，time-to-live）功能来管理缓存的数据。 
+  将卷与未积极使用它们的客户端分离。 

## 资源
<a name="resources"></a>

 **相关文档：** 
+  [Amazon FSx](https://aws.amazon.com/fsx/) 
+  [缓存策略](https://docs.aws.amazon.com/AmazonElastiCache/latest/mem-ug/Strategies.html) 
+  [什么是 Amazon Elastic File System？](https://docs.aws.amazon.com/efs/latest/ug/whatisefs.html) 
+  [什么是 Amazon S3？](https://docs.aws.amazon.com/AmazonS3/latest/dev/Welcome.html) 

# SUS04-BP07 最大限度地减少跨网络的数据移动
<a name="sus_sus_data_a8"></a>

 使用共享存储和访问区域数据存储中的数据，以最大限度地减少支持工作负载数据移动所需的总网络资源。 

 **未建立这种最佳实践的情况下暴露的风险等级：** 低 

## 实施指导
<a name="implementation-guidance"></a>
+  将数据存储在尽可能靠近使用者的位置。 
+  按区域对使用的服务进行分区，以便将其特定于区域的数据存储在使用它的区域内。 
+  跨网络复制更改时，使用数据块级重复数据删除，而不是文件或对象级重复数据删除。 
+  在通过网络移动数据之前，先对其进行压缩。 

## 资源
<a name="resources"></a>

 **相关文档：** 
+  [优化您的 AWS 基础设施以实现可持续性，第 III 部分：联网](https://aws.amazon.com/blogs/architecture/optimizing-your-aws-infrastructure-for-sustainability-part-iii-networking/) 
+  [AWS 全球基础设施](https://aws.amazon.com/about-aws/global-infrastructure/) 
+  [Amazon CloudFront 主要功能，包括 CloudFront 全球边缘网络](https://aws.amazon.com/cloudfront/features/) 
+  [在 Amazon OpenSearch Service 中压缩 HTTP 请求](https://docs.aws.amazon.com/opensearch-service/latest/developerguide/gzip.html) 
+  [使用 Amazon EMR 进行中间数据压缩](https://docs.aws.amazon.com/emr/latest/ManagementGuide/emr-plan-output-compression.html#HadoopIntermediateDataCompression) 
+  [将压缩数据文件从 Amazon S3 加载到 Amazon Redshift](https://docs.aws.amazon.com/redshift/latest/dg/t_loading-gzip-compressed-data-files-from-S3.html) 
+  [通过 Amazon CloudFront 提供压缩文件](https://docs.aws.amazon.com/AmazonCloudFront/latest/DeveloperGuide/ServingCompressedFiles.html) 

# SUS04-BP08 仅在难以重新创建时备份数据
<a name="sus_sus_data_a9"></a>

 为了最大限度地减少存储消耗，仅备份具有商业价值或满足合规性要求所必需的数据。检查备份策略并在恢复方案中排除没有价值的临时存储。 

 **未建立这种最佳实践的情况下暴露的风险等级：** 低 

## 实施指导
<a name="implementation-guidance"></a>
+  使用数据分类来确定需要备份的数据。 
+  排除您可以轻松重新创建的数据。 
+  从备份中排除临时数据。 
+  排除数据的本地副本，除非从公共位置恢复该数据所需的时间会超过您的服务等级协议（SLA，service level agreements）。 

## 资源
<a name="resources"></a>

 **相关文档：** 
+  [使用 AWS Backup 备份和还原 Amazon EFS 文件系统](https://docs.aws.amazon.com/efs/latest/ug/awsbackup.html) 
+  [Amazon EBS 快照](https://docs.aws.amazon.com/AWSEC2/latest/UserGuide/EBSSnapshots.html) 
+  [在 Amazon Relational Database Service 上使用备份](https://docs.aws.amazon.com/AmazonRDS/latest/UserGuide/USER_WorkingWithAutomatedBackups.html) 