

本文属于机器翻译版本。若本译文内容与英语原文存在差异，则一律以英文原文为准。

# EKS 最佳实践指南上的 Amazon EMR 链接 GitHub
<a name="best-practices"></a>

我们通过开源社区协作编写了 [Amazon EMR on EKS 最佳实践指南](https://aws.github.io/aws-emr-containers-best-practices/)，以便我们可以快速迭代，并为创建和运行虚拟集群的各个方面提供建议。我们建议您在这些部分中使用 [Amazon EMR on EKS 最佳实践指南](https://aws.github.io/aws-emr-containers-best-practices/)。选择每个部分中的链接以转到该 GitHub站点。

## 安全性
<a name="security"></a>

**注意**  
有关 Amazon EMR on EKS 安全性的更多信息，请参阅 [Amazon EMR on EKS 安全最佳实践](security-best-practices.md)。

[加密最佳实践：](https://aws.github.io/aws-emr-containers-best-practices/security/docs/spark/encryption/)如何对静态数据和传输中的数据进行加密。

[管理网络安全](https://aws.github.io/aws-emr-containers-best-practices/security/docs/spark/network-security/)描述了如何在连接 Amazon RDS 和 Amazon Redshift 等 AWS 服务 中托管的数据来源时为 Amazon EMR on EKS 的容器组（pod）配置安全组。

[使用 AWS 密钥管理器存储机密](https://aws.github.io/aws-emr-containers-best-practices/security/docs/spark/encryption/)。

## Pyspark 作业提交
<a name="pyspark-job-submission"></a>

[Pyspark 作业提交：](https://aws.github.io/aws-emr-containers-best-practices/submit-applications/docs/spark/pyspark/)使用 zip、egg、wheel 和 pex 等打包格式为 PySpark 应用程序指定不同类型的打包。

## 仓储服务
<a name="storage"></a>

[使用 EBS 卷：](https://aws.github.io/aws-emr-containers-best-practices/storage/docs/spark/ebs/)如何对需要 EBS 卷的作业使用静态和动态预置。

[使用 Amazon FSx 获取 Lustre 卷：](https://aws.github.io/aws-emr-containers-best-practices/storage/docs/spark/fsx-lustre/)如何为需要亚马逊 FSx 提供 Luster 卷的任务使用静态和动态配置。

[使用实例存储卷：](https://aws.github.io/aws-emr-containers-best-practices/storage/docs/spark/instance-store/)如何使用实例存储卷进行作业处理。

## 元数据仓集成
<a name="metastore-integration"></a>

[使用 Hive 元数据仓：](https://aws.github.io/aws-emr-containers-best-practices/metastore-integrations/docs/hive-metastore/)提供使用 Hive 元数据仓的不同方式。

[使用 AWS Glue：](https://aws.github.io/aws-emr-containers-best-practices/metastore-integrations/docs/hive-metastore/)提供了不同的方式来配置 AWS Glue 目录。

## 调试
<a name="debugging"></a>

[使用 Spark 调试：](https://aws.github.io/aws-emr-containers-best-practices/troubleshooting/docs/change-log-level/)如何更改日志级别。

[在驱动程序容器组（pod）上连接到 Spark UI](https://aws.github.io/aws-emr-containers-best-practices/troubleshooting/docs/connect-spark-ui/)。

[如何通过 Amazon EMR on EKS 使用自托管 Spark 历史记录服务器](https://aws.github.io/aws-emr-containers-best-practices/troubleshooting/docs/self-hosted-shs/)。

## 排查 Amazon EMR on EKS 中的问题
<a name="troubleshooting"></a>

[故障排除](https://aws.github.io/aws-emr-containers-best-practices/troubleshooting/docs/where-to-look-for-spark-logs/)。

## 节点放置
<a name="node-placement"></a>

[将 Kubernetes 节点选择器](https://aws.github.io/aws-emr-containers-best-practices/node-placement/docs/eks-node-placement/)用于 `single-az` 和其他使用案例。

[使用 Fargate 节点放置](https://aws.github.io/aws-emr-containers-best-practices/node-placement/docs/fargate-node-placement/)。

## 性能
<a name="performance"></a>

[使用动态资源分配（DRA）](https://aws.github.io/aws-emr-containers-best-practices/performance/docs/dra/)。

Amazon VPC 容器网络接口插件（CNI）、Cluster Autoscaler 和 Core DNS 的 [EKS 最佳实践](https://aws.github.io/aws-emr-containers-best-practices/best-practices-and-recommendations/eks-best-practices/)。

## 成本优化
<a name="cost-optimization"></a>

[使用竞价型实例：](https://aws.github.io/aws-emr-containers-best-practices/cost-optimization/docs/cost-optimization/)Amazon EC2 竞价型实例最佳实践以及如何使用 Spark 节点停用功能。

## 使用 AWS Outposts
<a name="using-outposts"></a>

[使用 EKS 在 EKS 上运行亚马逊 EMR AWS Outposts](https://aws.github.io/aws-emr-containers-best-practices/outposts/emr-containers-on-outposts/)