

本文属于机器翻译版本。若本译文内容与英语原文存在差异，则一律以英文原文为准。

# Amazon EMR 4.x 发行版
<a name="emr-release-4x"></a>

本部分内容涵盖每个 Amazon EMR 4.x 发行版中可用的应用程序版本、发布说明、组件版本和配置分类。

启动集群时，有多个 Amazon EMR 发行版可供选择。这允许您测试和使用满足您解决方案兼容性需求的应用程序版本。您可以使用*发行版标注*指定版本号。版本标签的格式是 `emr-x.x.x`。例如 `emr-7.12.0`。

从初始发布日期的第一个区域开始，新的 Amazon EMR 发行版将在几天内陆续在不同区域提供。在此期间，您所在区域可能无法提供最新发行版。

有关每个 Amazon EMR 4.x 发行版本中应用程序版本的综合表格，请参阅[Amazon EMR 4.x 发行版中的应用程序版本](emr-release-app-versions-4.x.md)。

**Topics**
+ [Amazon EMR 4.x 发行版中的应用程序版本](emr-release-app-versions-4.x.md)
+ [各 Amazon EMR 4.x 发行版之间的差异](emr-release-differences-4x.md)
+ [Amazon EMR 发行版 4.9.6](emr-496-release.md)
+ [Amazon EMR 发行版 4.9.5](emr-495-release.md)
+ [Amazon EMR 发行版 4.9.4](emr-494-release.md)
+ [Amazon EMR 发行版 4.9.3](emr-493-release.md)
+ [Amazon EMR 发行版 4.9.2](emr-492-release.md)
+ [Amazon EMR 发行版 4.9.1](emr-491-release.md)
+ [Amazon EMR 发行版 4.8.5](emr-485-release.md)
+ [Amazon EMR 发行版 4.8.4](emr-484-release.md)
+ [Amazon EMR 发行版 4.8.3](emr-483-release.md)
+ [Amazon EMR 发行版 4.8.2](emr-482-release.md)
+ [Amazon EMR 发行版 4.8.1](emr-481-release.md)
+ [Amazon EMR 发行版 4.8.0](emr-480-release.md)
+ [Amazon EMR 发行版 4.7.4](emr-474-release.md)
+ [Amazon EMR 发行版 4.7.3](emr-473-release.md)
+ [Amazon EMR 发行版 4.7.2](emr-472-release.md)
+ [Amazon EMR 发行版 4.7.1](emr-471-release.md)
+ [Amazon EMR 发行版 4.7.0](emr-470-release.md)
+ [Amazon EMR 发行版 4.6.1](emr-461-release.md)
+ [Amazon EMR 发行版 4.6.0](emr-460-release.md)
+ [Amazon EMR 发行版 4.5.0](emr-450-release.md)
+ [Amazon EMR 发行版 4.4.0](emr-440-release.md)
+ [Amazon EMR 发行版 4.3.0](emr-430-release.md)
+ [Amazon EMR 发行版 4.2.0](emr-420-release.md)
+ [Amazon EMR 发行版 4.1.0](emr-410-release.md)
+ [Amazon EMR 发行版 4.0.0](emr-400-release.md)

# Amazon EMR 4.x 发行版中的应用程序版本
<a name="emr-release-app-versions-4.x"></a>

下表列出了每个 Amazon EMR 4.x 发行版中可用的应用程序版本。


**应用程序版本信息**  

|  | emr-4.9.6 | emr-4.9.5 | emr-4.9.4 | emr-4.9.3 | emr-4.9.2 | emr-4.9.1 | emr-4.8.5 | emr-4.8.4 | emr-4.8.3 | emr-4.8.2 | emr-4.8.1 | emr-4.8.0 | emr-4.7.4 | emr-4.7.3 | emr-4.7.2 | emr-4.7.1 | emr-4.7.0 | emr-4.6.1 | emr-4.6.0 | emr-4.5.0 | emr-4.4.0 | emr-4.3.0 | emr-4.2.0 | emr-4.1.0 | emr-4.0.0 | 
| --- | --- | --- | --- | --- | --- | --- | --- | --- | --- | --- | --- | --- | --- | --- | --- | --- | --- | --- | --- | --- | --- | --- | --- | --- | --- | 
| AWS 适用于 Java 的 SDK | 1.10.75 | 1.10.75 | 1.10.75 | 1.10.75 | 1.10.75 | 1.10.75 | 1.10.75 | 1.10.75 | 1.10.75 | 1.10.75 | 1.10.75 | 1.10.75 | 1.10.75 | 1.10.75 | 1.10.75 | 1.10.75 | 1.10.75 | 1.10.27 | 1.10.27 | 1.10.27 | 1.10.27 | 1.10.27 | 1.10.27 | 未跟踪 | 未跟踪 | 
| Python | 未跟踪 | 未跟踪 | 未跟踪 | 未跟踪 | 未跟踪 | 未跟踪 | 未跟踪 | 未跟踪 | 未跟踪 | 未跟踪 | 未跟踪 | 未跟踪 | 未跟踪 | 未跟踪 | 未跟踪 | 未跟踪 | 未跟踪 | 未跟踪 | 未跟踪 | 未跟踪 | 未跟踪 | 未跟踪 | 未跟踪 | 未跟踪 | 未跟踪 | 
| Scala | 未跟踪 | 未跟踪 | 未跟踪 | 未跟踪 | 未跟踪 | 未跟踪 | 未跟踪 | 未跟踪 | 未跟踪 | 未跟踪 | 未跟踪 | 未跟踪 | 未跟踪 | 未跟踪 | 未跟踪 | 未跟踪 | 未跟踪 | 未跟踪 | 未跟踪 | 未跟踪 | 未跟踪 | 未跟踪 | 未跟踪 | 未跟踪 | 未跟踪 | 
| AmazonCloudWatchAgent |  -  |  -  |  -  |  -  |  -  |  -  |  -  |  -  |  -  |  -  |  -  |  -  |  -  |  -  |  -  |  -  |  -  |  -  |  -  |  -  |  -  |  -  |  -  |  -  |  -  | 
| Delta |  -  |  -  |  -  |  -  |  -  |  -  |  -  |  -  |  -  |  -  |  -  |  -  |  -  |  -  |  -  |  -  |  -  |  -  |  -  |  -  |  -  |  -  |  -  |  -  |  -  | 
| Flink |  -  |  -  |  -  |  -  |  -  |  -  |  -  |  -  |  -  |  -  |  -  |  -  |  -  |  -  |  -  |  -  |  -  |  -  |  -  |  -  |  -  |  -  |  -  |  -  |  -  | 
| Ganglia | 3.7.2 | 3.7.2 | 3.7.2 | 3.7.2 | 3.7.2 | 3.7.2 | 3.7.2 | 3.7.2 | 3.7.2 | 3.7.2 | 3.7.2 | 3.7.2 | 3.7.2 | 3.7.2 | 3.7.2 | 3.7.2 | 3.7.2 | 3.7.2 | 3.7.2 | 3.7.2 | 3.7.2 | 3.7.2 | 3.6.0 |  -  |  -  | 
| HBase | 1.2.2 | 1.2.2 | 1.2.2 | 1.2.2 | 1.2.2 | 1.2.2 | 1.2.2 | 1.2.2 | 1.2.2 | 1.2.2 | 1.2.2 | 1.2.2 | 1.2.1 | 1.2.1 | 1.2.1 | 1.2.1 | 1.2.1 | 1.2.0 | 1.2.0 |  -  |  -  |  -  |  -  |  -  |  -  | 
| HCatalog | 1.0.0-amzn-9 | 1.0.0-amzn-9 | 1.0.0-amzn-9 | 1.0.0-amzn-9 | 1.0.0-amzn-9 | 1.0.0-amzn-9 | 1.0.0-amzn-8 | 1.0.0-amzn-8 | 1.0.0-amzn-8 | 1.0.0-amzn-7 | 1.0.0-amzn-7 | 1.0.0-amzn-7 | 1.0.0-amzn-6 | 1.0.0-amzn-6 | 1.0.0-amzn-6 | 1.0.0-amzn-5 | 1.0.0-amzn-5 | 1.0.0-amzn-4 | 1.0.0-amzn-4 | 1.0.0-amzn-4 | 1.0.0-amzn-3 |  -  |  -  |  -  |  -  | 
| Hadoop | 2.7.3-amzn-2 | 2.7.3-amzn-2 | 2.7.3-amzn-2 | 2.7.3-amzn-2 | 2.7.3-amzn-2 | 2.7.3-amzn-2 | 2.7.3-amzn-1 | 2.7.3-amzn-1 | 2.7.3-amzn-1 | 2.7.3-amzn-0 | 2.7.2-amzn-4 | 2.7.2-amzn-4 | 2.7.2-amzn-3 | 2.7.2-amzn-3 | 2.7.2-amzn-3 | 2.7.2-amzn-2 | 2.7.2-amzn-2 | 2.7.2-amzn-1 | 2.7.2-amzn-1 | 2.7.2-amzn-0 | 2.7.1-amzn-1 | 2.7.1-amzn-0 | 2.6.0-amzn-2 | 2.6.0-amzn-1 | 2.6.0-amzn-0 | 
| Hive | 1.0.0-amzn-9 | 1.0.0-amzn-9 | 1.0.0-amzn-9 | 1.0.0-amzn-9 | 1.0.0-amzn-9 | 1.0.0-amzn-9 | 1.0.0-amzn-8 | 1.0.0-amzn-8 | 1.0.0-amzn-8 | 1.0.0-amzn-7 | 1.0.0-amzn-7 | 1.0.0-amzn-7 | 1.0.0-amzn-6 | 1.0.0-amzn-6 | 1.0.0-amzn-6 | 1.0.0-amzn-5 | 1.0.0-amzn-5 | 1.0.0-amzn-4 | 1.0.0-amzn-4 | 1.0.0-amzn-4 | 1.0.0-amzn-3 | 1.0.0-amzn-2 | 1.0.0-amzn-1 | 1.0.0-amzn-1 | 1.0.0-amzn-0 | 
| Hudi |  -  |  -  |  -  |  -  |  -  |  -  |  -  |  -  |  -  |  -  |  -  |  -  |  -  |  -  |  -  |  -  |  -  |  -  |  -  |  -  |  -  |  -  |  -  |  -  |  -  | 
| Hue | 3.7.1-amzn-7 | 3.7.1-amzn-7 | 3.7.1-amzn-7 | 3.7.1-amzn-7 | 3.7.1-amzn-7 | 3.7.1-amzn-7 | 3.7.1-amzn-7 | 3.7.1-amzn-7 | 3.7.1-amzn-7 | 3.7.1-amzn-7 | 3.7.1-amzn-7 | 3.7.1-amzn-7 | 3.7.1-amzn-7 | 3.7.1-amzn-7 | 3.7.1-amzn-7 | 3.7.1-amzn-7 | 3.7.1-amzn-7 | 3.7.1-amzn-6 | 3.7.1-amzn-6 | 3.7.1-amzn-5 | 3.7.1-amzn-5 | 3.7.1-amzn-5 | 3.7.1-amzn-5 | 3.7.1-amzn-4 |  -  | 
| Iceberg |  -  |  -  |  -  |  -  |  -  |  -  |  -  |  -  |  -  |  -  |  -  |  -  |  -  |  -  |  -  |  -  |  -  |  -  |  -  |  -  |  -  |  -  |  -  |  -  |  -  | 
| JupyterEnterpriseGateway |  -  |  -  |  -  |  -  |  -  |  -  |  -  |  -  |  -  |  -  |  -  |  -  |  -  |  -  |  -  |  -  |  -  |  -  |  -  |  -  |  -  |  -  |  -  |  -  |  -  | 
| JupyterHub |  -  |  -  |  -  |  -  |  -  |  -  |  -  |  -  |  -  |  -  |  -  |  -  |  -  |  -  |  -  |  -  |  -  |  -  |  -  |  -  |  -  |  -  |  -  |  -  |  -  | 
| Livy |  -  |  -  |  -  |  -  |  -  |  -  |  -  |  -  |  -  |  -  |  -  |  -  |  -  |  -  |  -  |  -  |  -  |  -  |  -  |  -  |  -  |  -  |  -  |  -  |  -  | 
| MXNet |  -  |  -  |  -  |  -  |  -  |  -  |  -  |  -  |  -  |  -  |  -  |  -  |  -  |  -  |  -  |  -  |  -  |  -  |  -  |  -  |  -  |  -  |  -  |  -  |  -  | 
| Mahout | 0.12.2 | 0.12.2 | 0.12.2 | 0.12.2 | 0.12.2 | 0.12.2 | 0.12.2 | 0.12.2 | 0.12.2 | 0.12.2 | 0.12.2 | 0.12.2 | 0.12.2 | 0.12.2 | 0.12.2 | 0.12.0 | 0.12.0 | 0.11.1 | 0.11.1 | 0.11.1 | 0.11.1 | 0.11.0 | 0.11.0 | 0.11.0 | 0.10.0 | 
| Oozie |  -  |  -  |  -  |  -  |  -  |  -  |  -  |  -  |  -  |  -  |  -  |  -  |  -  |  -  |  -  |  -  |  -  |  -  |  -  |  -  |  -  |  -  |  -  |  -  |  -  | 
| Oozie-Sandbox | 4.2.0 | 4.2.0 | 4.2.0 | 4.2.0 | 4.2.0 | 4.2.0 | 4.2.0 | 4.2.0 | 4.2.0 | 4.2.0 | 4.2.0 | 4.2.0 | 4.2.0 | 4.2.0 | 4.2.0 | 4.2.0 | 4.2.0 | 4.2.0 | 4.2.0 | 4.2.0 | 4.2.0 | 4.2.0 | 4.2.0 | 4.0.1 |  -  | 
| Phoenix | 4.7.0--1.2 HBase | 4.7.0--1.2 HBase | 4.7.0--1.2 HBase | 4.7.0--1.2 HBase | 4.7.0--1.2 HBase | 4.7.0--1.2 HBase | 4.7.0--1.2 HBase | 4.7.0--1.2 HBase | 4.7.0--1.2 HBase | 4.7.0--1.2 HBase | 4.7.0--1.2 HBase | 4.7.0--1.2 HBase | 4.7.0--1.2 HBase | 4.7.0--1.2 HBase | 4.7.0--1.2 HBase | 4.7.0--1.2 HBase | 4.7.0--1.2 HBase |  -  |  -  |  -  |  -  |  -  |  -  |  -  |  -  | 
| Pig | 0.14.0-amzn-0 | 0.14.0-amzn-0 | 0.14.0-amzn-0 | 0.14.0-amzn-0 | 0.14.0-amzn-0 | 0.14.0-amzn-0 | 0.14.0-amzn-0 | 0.14.0-amzn-0 | 0.14.0-amzn-0 | 0.14.0-amzn-0 | 0.14.0-amzn-0 | 0.14.0-amzn-0 | 0.14.0-amzn-0 | 0.14.0-amzn-0 | 0.14.0-amzn-0 | 0.14.0-amzn-0 | 0.14.0-amzn-0 | 0.14.0-amzn-0 | 0.14.0-amzn-0 | 0.14.0-amzn-0 | 0.14.0-amzn-0 | 0.14.0-amzn-0 | 0.14.0-amzn-0 | 0.14.0-amzn-0 | 0.14.0-amzn-0 | 
| Presto |  -  |  -  |  -  |  -  |  -  |  -  |  -  |  -  |  -  |  -  |  -  |  -  |  -  |  -  |  -  |  -  |  -  |  -  |  -  |  -  |  -  |  -  |  -  |  -  |  -  | 
| Presto-Sandbox | 0.157.1 | 0.157.1 | 0.157.1 | 0.157.1 | 0.157.1 | 0.157.1 | 0.157.1 | 0.157.1 | 0.157.1 | 0.152.3 | 0.151 | 0.151 | 0.148 | 0.148 | 0.148 | 0.147 | 0.147 | 0.143 | 0.143 | 0.140 | 0.136 | 0.130 | 0.125 | 0.119 |  -  | 
| Spark | 1.6.3 | 1.6.3 | 1.6.3 | 1.6.3 | 1.6.3 | 1.6.3 | 1.6.3 | 1.6.3 | 1.6.3 | 1.6.2 | 1.6.2 | 1.6.2 | 1.6.2 | 1.6.2 | 1.6.2 | 1.6.1 | 1.6.1 | 1.6.1 | 1.6.1 | 1.6.1 | 1.6.0 | 1.6.0 | 1.5.2 | 1.5.0 | 1.4.1 | 
| Sqoop |  -  |  -  |  -  |  -  |  -  |  -  |  -  |  -  |  -  |  -  |  -  |  -  |  -  |  -  |  -  |  -  |  -  |  -  |  -  |  -  |  -  |  -  |  -  |  -  |  -  | 
| Sqoop-Sandbox | 1.4.6 | 1.4.6 | 1.4.6 | 1.4.6 | 1.4.6 | 1.4.6 | 1.4.6 | 1.4.6 | 1.4.6 | 1.4.6 | 1.4.6 | 1.4.6 | 1.4.6 | 1.4.6 | 1.4.6 | 1.4.6 | 1.4.6 | 1.4.6 | 1.4.6 | 1.4.6 | 1.4.6 |  -  |  -  |  -  |  -  | 
| TensorFlow |  -  |  -  |  -  |  -  |  -  |  -  |  -  |  -  |  -  |  -  |  -  |  -  |  -  |  -  |  -  |  -  |  -  |  -  |  -  |  -  |  -  |  -  |  -  |  -  |  -  | 
| Tez | 0.8.4 | 0.8.4 | 0.8.4 | 0.8.4 | 0.8.4 | 0.8.4 | 0.8.4 | 0.8.4 | 0.8.4 | 0.8.4 | 0.8.4 | 0.8.4 | 0.8.3 | 0.8.3 | 0.8.3 | 0.8.3 | 0.8.3 |  -  |  -  |  -  |  -  |  -  |  -  |  -  |  -  | 
| Trino (PrestoSQL) |  -  |  -  |  -  |  -  |  -  |  -  |  -  |  -  |  -  |  -  |  -  |  -  |  -  |  -  |  -  |  -  |  -  |  -  |  -  |  -  |  -  |  -  |  -  |  -  |  -  | 
| Zeppelin |  -  |  -  |  -  |  -  |  -  |  -  |  -  |  -  |  -  |  -  |  -  |  -  |  -  |  -  |  -  |  -  |  -  |  -  |  -  |  -  |  -  |  -  |  -  |  -  |  -  | 
| Zeppelin-Sandbox | 0.6.1 | 0.6.1 | 0.6.1 | 0.6.1 | 0.6.1 | 0.6.1 | 0.6.1 | 0.6.1 | 0.6.1 | 0.6.1 | 0.6.1 | 0.6.1 | 0.5.6-incubating | 0.5.6-incubating | 0.5.6-incubating | 0.5.6-incubating | 0.5.6-incubating | 0.5.6-incubating | 0.5.6-incubating | 0.5.6-incubating | 0.5.6-incubating | 0.5.5-incubating-amzn-1 | 0.5.5-incubating-amzn-0 | 0.6.0-incubating-SNAPSHOT |  -  | 
| ZooKeeper |  -  |  -  |  -  |  -  |  -  |  -  |  -  |  -  |  -  |  -  |  -  |  -  |  -  |  -  |  -  |  -  |  -  |  -  |  -  |  -  |  -  |  -  |  -  |  -  |  -  | 
| ZooKeeper-Sandbox | 3.4.9 | 3.4.9 | 3.4.9 | 3.4.9 | 3.4.9 | 3.4.9 | 3.4.9 | 3.4.9 | 3.4.9 | 3.4.8 | 3.4.8 | 3.4.8 | 3.4.8 | 3.4.8 | 3.4.8 | 3.4.8 | 3.4.8 | 3.4.8 | 3.4.8 |  -  |  -  |  -  |  -  |  -  |  -  | 

# 各 Amazon EMR 4.x 发行版之间的差异
<a name="emr-release-differences-4x"></a>

《Amazon EMR 管理指南》**中有关 Amazon EMR 功能的文档指定开始提供某种功能的 Amazon EMR 发行版以及追溯至 4.0.0 的 Amazon EMR 功能之间的适用差异。

从 Amazon EMR 发行版 5.0.0 开始，一些应用程序已进行重大版本升级，安装或运行详细信息改变，另一些应用程序则从沙盒应用程序提升为本机应用程序。此节中的各个主题提供使用 Amazon EMR 4.x 发行版时特定于应用程序的明显差异。

**Topics**
+ [沙盒应用程序](emr-sandbox-apps-4x.md)
+ [使用 Amazon EMR 4.x 上的 Hive 的注意事项](emr-Hive-4x.md)
+ [使用 Amazon EMR 4.x 上的 Pig 的注意事项](emr-Pig-4x.md)

# 沙盒应用程序
<a name="emr-sandbox-apps-4x"></a>

使用 Amazon EMR 4.x 发行版时，一些应用程序会被视为*沙盒*应用程序。沙盒应用程序是我们在初始 Amazon EMR 发行版时因需求提供的应用程序的早期版本。您可以使用控制台或 API 让 Amazon EMR 以与原生应用程序相同的方式安装沙盒应用程序，但是沙盒应用程序的支持和文档有限。 AWS CLI沙盒应用程序在 Amazon EMR 发行版 5.0.0 及更高版本中变为完全受支持的本机应用程序。以下是 Amazon EMR 4.x 发行版中的沙盒应用程序。
+ Oozie
+ ：Presto
+ Sqoop
+ Zeppelin
+ ZooKeeper

当您安装沙盒应用程序时，使用后缀 `-sandbox` 指示应用程序名称。例如，要安装的沙盒版本*Presto*，请使用`Presto-sandbox`。与完全受支持的应用程序相比，安装时间可能更长。此节中列出的每个应用程序的版本号对应于应用程序的社区版本。

## Oozie（沙盒版本）
<a name="emr-Oozie-sandbox-4x"></a>

Oozie 从 Amazon EMR 发行版 4.1.0 开始作为沙盒应用程序提供。

默认情况下，不会使用沙盒版本安装 Oozie 示例。要安装以上示例，可使用 SSH 连接到主节点并运行 `install-oozie-examples`。


**Oozie 沙盒版本信息**  

| Amazon EMR 发行版标签 | Oozie 沙盒版本 | 随 Oozie 沙盒安装的组件 | 
| --- | --- | --- | 
| emr-4.9.6 | 4.2.0 | emrfs, emr-ddb, emr-goodies, emr-kinesis, emr-s3-dist-cp, hadoop-client, hadoop-mapred, hadoop-hdfs-datanode, hadoop-hdfs-library, hadoop-hdfs-namenode, hadoop-httpfs-server, hadoop-kms-server, hadoop-yarn-nodemanager, hadoop-yarn-resourcemanager, oozie-client, oozie-server | 
| emr-4.9.5 | 4.2.0 | emrfs, emr-ddb, emr-goodies, emr-kinesis, emr-s3-dist-cp, hadoop-client, hadoop-mapred, hadoop-hdfs-datanode, hadoop-hdfs-library, hadoop-hdfs-namenode, hadoop-httpfs-server, hadoop-kms-server, hadoop-yarn-nodemanager, hadoop-yarn-resourcemanager, oozie-client, oozie-server | 
| emr-4.9.4 | 4.2.0 | emrfs, emr-ddb, emr-goodies, emr-kinesis, emr-s3-dist-cp, hadoop-client, hadoop-mapred, hadoop-hdfs-datanode, hadoop-hdfs-library, hadoop-hdfs-namenode, hadoop-httpfs-server, hadoop-kms-server, hadoop-yarn-nodemanager, hadoop-yarn-resourcemanager, oozie-client, oozie-server | 
| emr-4.9.3 | 4.2.0 | emrfs, emr-ddb, emr-goodies, emr-kinesis, emr-s3-dist-cp, hadoop-client, hadoop-mapred, hadoop-hdfs-datanode, hadoop-hdfs-library, hadoop-hdfs-namenode, hadoop-httpfs-server, hadoop-kms-server, hadoop-yarn-nodemanager, hadoop-yarn-resourcemanager, oozie-client, oozie-server | 
| emr-4.9.2 | 4.2.0 | emrfs, emr-ddb, emr-goodies, emr-kinesis, emr-s3-dist-cp, hadoop-client, hadoop-mapred, hadoop-hdfs-datanode, hadoop-hdfs-library, hadoop-hdfs-namenode, hadoop-httpfs-server, hadoop-kms-server, hadoop-yarn-nodemanager, hadoop-yarn-resourcemanager, oozie-client, oozie-server | 
| emr-4.9.1 | 4.2.0 | emrfs, emr-ddb, emr-goodies, emr-kinesis, emr-s3-dist-cp, hadoop-client, hadoop-mapred, hadoop-hdfs-datanode, hadoop-hdfs-library, hadoop-hdfs-namenode, hadoop-httpfs-server, hadoop-kms-server, hadoop-yarn-nodemanager, hadoop-yarn-resourcemanager, oozie-client, oozie-server | 
| emr-4.8.5 | 4.2.0 | emrfs, emr-ddb, emr-goodies, emr-kinesis, emr-s3-dist-cp, hadoop-client, hadoop-mapred, hadoop-hdfs-datanode, hadoop-hdfs-library, hadoop-hdfs-namenode, hadoop-httpfs-server, hadoop-kms-server, hadoop-yarn-nodemanager, hadoop-yarn-resourcemanager, oozie-client, oozie-server | 
| emr-4.8.4 | 4.2.0 | emrfs, emr-ddb, emr-goodies, emr-kinesis, emr-s3-dist-cp, hadoop-client, hadoop-mapred, hadoop-hdfs-datanode, hadoop-hdfs-library, hadoop-hdfs-namenode, hadoop-httpfs-server, hadoop-kms-server, hadoop-yarn-nodemanager, hadoop-yarn-resourcemanager, oozie-client, oozie-server | 
| emr-4.8.3 | 4.2.0 | emrfs, emr-ddb, emr-goodies, emr-kinesis, emr-s3-dist-cp, hadoop-client, hadoop-mapred, hadoop-hdfs-datanode, hadoop-hdfs-library, hadoop-hdfs-namenode, hadoop-httpfs-server, hadoop-kms-server, hadoop-yarn-nodemanager, hadoop-yarn-resourcemanager, oozie-client, oozie-server | 
| emr-4.8.2 | 4.2.0 | emrfs, emr-ddb, emr-goodies, emr-kinesis, emr-s3-dist-cp, hadoop-client, hadoop-mapred, hadoop-hdfs-datanode, hadoop-hdfs-library, hadoop-hdfs-namenode, hadoop-httpfs-server, hadoop-kms-server, hadoop-yarn-nodemanager, hadoop-yarn-resourcemanager, oozie-client, oozie-server | 
| emr-4.8.1 | 4.2.0 | emrfs, emr-ddb, emr-goodies, emr-kinesis, emr-s3-dist-cp, hadoop-client, hadoop-mapred, hadoop-hdfs-datanode, hadoop-hdfs-library, hadoop-hdfs-namenode, hadoop-httpfs-server, hadoop-kms-server, hadoop-yarn-nodemanager, hadoop-yarn-resourcemanager, oozie-client, oozie-server | 
| emr-4.8.0 | 4.2.0 | emrfs, emr-ddb, emr-goodies, emr-kinesis, emr-s3-dist-cp, hadoop-client, hadoop-mapred, hadoop-hdfs-datanode, hadoop-hdfs-library, hadoop-hdfs-namenode, hadoop-httpfs-server, hadoop-kms-server, hadoop-yarn-nodemanager, hadoop-yarn-resourcemanager, oozie-client, oozie-server | 
| emr-4.7.4 | 4.2.0 | emrfs, emr-ddb, emr-goodies, emr-kinesis, emr-s3-dist-cp, hadoop-client, hadoop-mapred, hadoop-hdfs-datanode, hadoop-hdfs-library, hadoop-hdfs-namenode, hadoop-httpfs-server, hadoop-kms-server, hadoop-yarn-nodemanager, hadoop-yarn-resourcemanager, oozie-client, oozie-server | 
| emr-4.7.3 | 4.2.0 | emrfs, emr-ddb, emr-goodies, emr-kinesis, emr-s3-dist-cp, hadoop-client, hadoop-mapred, hadoop-hdfs-datanode, hadoop-hdfs-library, hadoop-hdfs-namenode, hadoop-httpfs-server, hadoop-kms-server, hadoop-yarn-nodemanager, hadoop-yarn-resourcemanager, oozie-client, oozie-server | 
| emr-4.7.2 | 4.2.0 | emrfs, emr-ddb, emr-goodies, emr-kinesis, emr-s3-dist-cp, hadoop-client, hadoop-mapred, hadoop-hdfs-datanode, hadoop-hdfs-library, hadoop-hdfs-namenode, hadoop-httpfs-server, hadoop-kms-server, hadoop-yarn-nodemanager, hadoop-yarn-resourcemanager, oozie-client, oozie-server | 
| emr-4.7.1 | 4.2.0 | emrfs, emr-ddb, emr-goodies, emr-kinesis, emr-s3-dist-cp, hadoop-client, hadoop-mapred, hadoop-hdfs-datanode, hadoop-hdfs-library, hadoop-hdfs-namenode, hadoop-httpfs-server, hadoop-kms-server, hadoop-yarn-nodemanager, hadoop-yarn-resourcemanager, oozie-client, oozie-server | 
| emr-4.7.0 | 4.2.0 | emrfs, emr-ddb, emr-goodies, emr-kinesis, emr-s3-dist-cp, hadoop-client, hadoop-mapred, hadoop-hdfs-datanode, hadoop-hdfs-library, hadoop-hdfs-namenode, hadoop-httpfs-server, hadoop-kms-server, hadoop-yarn-nodemanager, hadoop-yarn-resourcemanager, oozie-client, oozie-server | 
| emr-4.6.1 | 4.2.0 | emrfs, emr-ddb, emr-goodies, emr-kinesis, emr-s3-dist-cp, hadoop-client, hadoop-mapred, hadoop-hdfs-datanode, hadoop-hdfs-library, hadoop-hdfs-namenode, hadoop-httpfs-server, hadoop-yarn-nodemanager, hadoop-yarn-resourcemanager, oozie-client, oozie-server | 
| emr-4.6.0 | 4.2.0 | emrfs, emr-ddb, emr-goodies, emr-kinesis, emr-s3-dist-cp, hadoop-client, hadoop-mapred, hadoop-hdfs-datanode, hadoop-hdfs-library, hadoop-hdfs-namenode, hadoop-httpfs-server, hadoop-yarn-nodemanager, hadoop-yarn-resourcemanager, oozie-client, oozie-server | 
| emr-4.5.0 | 4.2.0 | emrfs, emr-ddb, emr-goodies, emr-kinesis, emr-s3-dist-cp, hadoop-client, hadoop-mapred, hadoop-hdfs-datanode, hadoop-hdfs-library, hadoop-hdfs-namenode, hadoop-httpfs-server, hadoop-yarn-nodemanager, hadoop-yarn-resourcemanager, oozie-client, oozie-server | 
| emr-4.4.0 | 4.2.0 | emrfs, emr-ddb, emr-goodies, emr-kinesis, emr-s3-dist-cp, hadoop-client, hadoop-mapred, hadoop-hdfs-datanode, hadoop-hdfs-library, hadoop-hdfs-namenode, hadoop-httpfs-server, hadoop-yarn-nodemanager, hadoop-yarn-resourcemanager, oozie-client, oozie-server | 
| emr-4.3.0 | 4.2.0 | emrfs, emr-ddb, emr-goodies, emr-kinesis, emr-s3-dist-cp, hadoop-client, hadoop-mapred, hadoop-hdfs-datanode, hadoop-hdfs-library, hadoop-hdfs-namenode, hadoop-httpfs-server, hadoop-yarn-nodemanager, hadoop-yarn-resourcemanager, oozie-client, oozie-server | 
| emr-4.2.0 | 4.2.0 | emrfs, emr-ddb, emr-goodies, emr-kinesis, emr-s3-dist-cp, hadoop-client, hadoop-mapred, hadoop-hdfs-datanode, hadoop-hdfs-library, hadoop-hdfs-namenode, hadoop-httpfs-server, hadoop-yarn-nodemanager, hadoop-yarn-resourcemanager, oozie-client, oozie-server | 
| emr-4.1.0 | 4.0.1 | emrfs, emr-ddb, emr-goodies, emr-kinesis, emr-s3-dist-cp, hadoop-client, hadoop-mapred, hadoop-hdfs-datanode, hadoop-hdfs-library, hadoop-hdfs-namenode, hadoop-httpfs-server, hadoop-yarn-nodemanager, hadoop-yarn-resourcemanager, oozie-client, oozie-server | 

## Presto（沙盒版本）
<a name="emr-Presto-sandbox-4x"></a>

Presto 从 Amazon EMR 发行版 4.1.0 开始作为沙盒应用程序提供。


**Presto 沙盒版本信息**  

| Amazon EMR 发行版标签 | Presto 沙盒版本 | 随 Presto 沙盒安装的组件 | 
| --- | --- | --- | 
| emr-4.9.6 | 0.157.1 | emrfs, emr-goodies, hadoop-client, hadoop-hdfs-datanode, hadoop-hdfs-library, hadoop-hdfs-namenode, hadoop-kms-server, hadoop-yarn-nodemanager, hadoop-yarn-resourcemanager, hive-client, hcatalog-server, mysql-server, presto-coordinator, presto-worker | 
| emr-4.9.5 | 0.157.1 | emrfs, emr-goodies, hadoop-client, hadoop-hdfs-datanode, hadoop-hdfs-library, hadoop-hdfs-namenode, hadoop-kms-server, hadoop-yarn-nodemanager, hadoop-yarn-resourcemanager, hive-client, hcatalog-server, mysql-server, presto-coordinator, presto-worker | 
| emr-4.9.4 | 0.157.1 | emrfs, emr-goodies, hadoop-client, hadoop-hdfs-datanode, hadoop-hdfs-library, hadoop-hdfs-namenode, hadoop-kms-server, hadoop-yarn-nodemanager, hadoop-yarn-resourcemanager, hive-client, hcatalog-server, mysql-server, presto-coordinator, presto-worker | 
| emr-4.9.3 | 0.157.1 | emrfs, emr-goodies, hadoop-client, hadoop-hdfs-datanode, hadoop-hdfs-library, hadoop-hdfs-namenode, hadoop-kms-server, hadoop-yarn-nodemanager, hadoop-yarn-resourcemanager, hive-client, hcatalog-server, mysql-server, presto-coordinator, presto-worker | 
| emr-4.9.2 | 0.157.1 | emrfs, emr-goodies, hadoop-client, hadoop-hdfs-datanode, hadoop-hdfs-library, hadoop-hdfs-namenode, hadoop-kms-server, hadoop-yarn-nodemanager, hadoop-yarn-resourcemanager, hive-client, hcatalog-server, mysql-server, presto-coordinator, presto-worker | 
| emr-4.9.1 | 0.157.1 | emrfs, emr-goodies, hadoop-client, hadoop-hdfs-datanode, hadoop-hdfs-library, hadoop-hdfs-namenode, hadoop-kms-server, hadoop-yarn-nodemanager, hadoop-yarn-resourcemanager, hive-client, hcatalog-server, mysql-server, presto-coordinator, presto-worker | 
| emr-4.8.5 | 0.157.1 | emrfs, emr-goodies, hadoop-client, hadoop-hdfs-datanode, hadoop-hdfs-library, hadoop-hdfs-namenode, hadoop-kms-server, hadoop-yarn-nodemanager, hadoop-yarn-resourcemanager, hive-client, hcatalog-server, mysql-server, presto-coordinator, presto-worker | 
| emr-4.8.4 | 0.157.1 | emrfs, emr-goodies, hadoop-client, hadoop-hdfs-datanode, hadoop-hdfs-library, hadoop-hdfs-namenode, hadoop-kms-server, hadoop-yarn-nodemanager, hadoop-yarn-resourcemanager, hive-client, hcatalog-server, mysql-server, presto-coordinator, presto-worker | 
| emr-4.8.3 | 0.157.1 | emrfs, emr-goodies, hadoop-client, hadoop-hdfs-datanode, hadoop-hdfs-library, hadoop-hdfs-namenode, hadoop-kms-server, hadoop-yarn-nodemanager, hadoop-yarn-resourcemanager, hive-client, hcatalog-server, mysql-server, presto-coordinator, presto-worker | 
| emr-4.8.2 | 0.152.3 | emrfs, emr-goodies, hadoop-client, hadoop-hdfs-datanode, hadoop-hdfs-library, hadoop-hdfs-namenode, hadoop-kms-server, hadoop-yarn-nodemanager, hadoop-yarn-resourcemanager, hive-client, hcatalog-server, mysql-server, presto-coordinator, presto-worker | 
| emr-4.8.1 | 0.151 | emrfs, emr-goodies, hadoop-client, hadoop-hdfs-datanode, hadoop-hdfs-library, hadoop-hdfs-namenode, hadoop-kms-server, hadoop-yarn-nodemanager, hadoop-yarn-resourcemanager, hive-client, hcatalog-server, mysql-server, presto-coordinator, presto-worker | 
| emr-4.8.0 | 0.151 | emrfs, emr-goodies, hadoop-client, hadoop-hdfs-datanode, hadoop-hdfs-library, hadoop-hdfs-namenode, hadoop-kms-server, hadoop-yarn-nodemanager, hadoop-yarn-resourcemanager, hive-client, hcatalog-server, mysql-server, presto-coordinator, presto-worker | 
| emr-4.7.4 | 0.148 | emrfs, emr-goodies, hadoop-client, hadoop-hdfs-datanode, hadoop-hdfs-library, hadoop-hdfs-namenode, hadoop-kms-server, hadoop-yarn-nodemanager, hadoop-yarn-resourcemanager, hive-client, hcatalog-server, mysql-server, presto-coordinator, presto-worker | 
| emr-4.7.3 | 0.148 | emrfs, emr-goodies, hadoop-client, hadoop-hdfs-datanode, hadoop-hdfs-library, hadoop-hdfs-namenode, hadoop-kms-server, hadoop-yarn-nodemanager, hadoop-yarn-resourcemanager, hive-client, hcatalog-server, mysql-server, presto-coordinator, presto-worker | 
| emr-4.7.2 | 0.148 | emrfs, emr-goodies, hadoop-client, hadoop-hdfs-datanode, hadoop-hdfs-library, hadoop-hdfs-namenode, hadoop-kms-server, hadoop-yarn-nodemanager, hadoop-yarn-resourcemanager, hive-client, hcatalog-server, mysql-server, presto-coordinator, presto-worker | 
| emr-4.7.1 | 0.147 | emrfs, emr-goodies, hadoop-client, hadoop-hdfs-datanode, hadoop-hdfs-library, hadoop-hdfs-namenode, hadoop-kms-server, hadoop-yarn-nodemanager, hadoop-yarn-resourcemanager, hive-client, hcatalog-server, mysql-server, presto-coordinator, presto-worker | 
| emr-4.7.0 | 0.147 | emrfs, emr-goodies, hadoop-client, hadoop-hdfs-datanode, hadoop-hdfs-library, hadoop-hdfs-namenode, hadoop-kms-server, hadoop-yarn-nodemanager, hadoop-yarn-resourcemanager, hive-client, hcatalog-server, mysql-server, presto-coordinator, presto-worker | 
| emr-4.6.1 | 0.143 | emrfs, emr-goodies, hadoop-client, hadoop-hdfs-datanode, hadoop-hdfs-library, hadoop-hdfs-namenode, hadoop-yarn-nodemanager, hadoop-yarn-resourcemanager, hive-client, hive-metastore-server, mysql-server, presto-coordinator, presto-worker | 
| emr-4.6.0 | 0.143 | emrfs, emr-goodies, hadoop-client, hadoop-hdfs-datanode, hadoop-hdfs-library, hadoop-hdfs-namenode, hadoop-yarn-nodemanager, hadoop-yarn-resourcemanager, hive-client, hive-metastore-server, mysql-server, presto-coordinator, presto-worker | 
| emr-4.5.0 | 0.140 | emrfs, emr-goodies, hadoop-client, hadoop-hdfs-datanode, hadoop-hdfs-library, hadoop-hdfs-namenode, hadoop-yarn-nodemanager, hadoop-yarn-resourcemanager, hive-client, hive-metastore-server, mysql-server, presto-coordinator, presto-worker | 
| emr-4.4.0 | 0.136 | emrfs, emr-goodies, hadoop-client, hadoop-hdfs-datanode, hadoop-hdfs-library, hadoop-hdfs-namenode, hadoop-yarn-nodemanager, hadoop-yarn-resourcemanager, hive-client, hive-metastore-server, mysql-server, presto-coordinator, presto-worker | 
| emr-4.3.0 | 0.130 | emrfs, emr-goodies, hadoop-client, hadoop-hdfs-datanode, hadoop-hdfs-library, hadoop-hdfs-namenode, hadoop-yarn-nodemanager, hadoop-yarn-resourcemanager, hive-client, hive-metastore-server, mysql-server, presto-coordinator, presto-worker | 
| emr-4.2.0 | 0.125 | emrfs, emr-goodies, hadoop-client, hadoop-hdfs-datanode, hadoop-hdfs-library, hadoop-hdfs-namenode, hadoop-yarn-nodemanager, hadoop-yarn-resourcemanager, hive-client, hive-metastore-server, mysql-server, presto-coordinator, presto-worker | 
| emr-4.1.0 | 0.119 | emrfs, emr-goodies, hadoop-client, hadoop-hdfs-datanode, hadoop-hdfs-library, hadoop-hdfs-namenode, hadoop-yarn-nodemanager, hadoop-yarn-resourcemanager, hive-client, hive-metastore-server, mysql-server, presto-coordinator, presto-worker | 

## Sqoop（沙盒版本）
<a name="emr-Sqoop-sandbox-4x"></a>

Sqoop 从 Amazon EMR 发行版 4.4.0 开始作为沙盒应用程序提供。


**Sqoop 沙盒版本信息**  

| Amazon EMR 发行版标签 | Sqoop 沙盒版本 | 随 Sqoop 沙盒安装的组件 | 
| --- | --- | --- | 
| emr-4.9.6 | 1.4.6 | emrfs, emr-ddb, emr-goodies, hadoop-client, hadoop-mapred, hadoop-hdfs-datanode, hadoop-hdfs-library, hadoop-hdfs-namenode, hadoop-httpfs-server, hadoop-kms-server, hadoop-yarn-nodemanager, hadoop-yarn-resourcemanager, mysql-server, sqoop-client | 
| emr-4.9.5 | 1.4.6 | emrfs, emr-ddb, emr-goodies, hadoop-client, hadoop-mapred, hadoop-hdfs-datanode, hadoop-hdfs-library, hadoop-hdfs-namenode, hadoop-httpfs-server, hadoop-kms-server, hadoop-yarn-nodemanager, hadoop-yarn-resourcemanager, mysql-server, sqoop-client | 
| emr-4.9.4 | 1.4.6 | emrfs, emr-ddb, emr-goodies, hadoop-client, hadoop-mapred, hadoop-hdfs-datanode, hadoop-hdfs-library, hadoop-hdfs-namenode, hadoop-httpfs-server, hadoop-kms-server, hadoop-yarn-nodemanager, hadoop-yarn-resourcemanager, mysql-server, sqoop-client | 
| emr-4.9.3 | 1.4.6 | emrfs, emr-ddb, emr-goodies, hadoop-client, hadoop-mapred, hadoop-hdfs-datanode, hadoop-hdfs-library, hadoop-hdfs-namenode, hadoop-httpfs-server, hadoop-kms-server, hadoop-yarn-nodemanager, hadoop-yarn-resourcemanager, mysql-server, sqoop-client | 
| emr-4.9.2 | 1.4.6 | emrfs, emr-ddb, emr-goodies, hadoop-client, hadoop-mapred, hadoop-hdfs-datanode, hadoop-hdfs-library, hadoop-hdfs-namenode, hadoop-httpfs-server, hadoop-kms-server, hadoop-yarn-nodemanager, hadoop-yarn-resourcemanager, mysql-server, sqoop-client | 
| emr-4.9.1 | 1.4.6 | emrfs, emr-ddb, emr-goodies, hadoop-client, hadoop-mapred, hadoop-hdfs-datanode, hadoop-hdfs-library, hadoop-hdfs-namenode, hadoop-httpfs-server, hadoop-kms-server, hadoop-yarn-nodemanager, hadoop-yarn-resourcemanager, mysql-server, sqoop-client | 
| emr-4.8.5 | 1.4.6 | emrfs, emr-ddb, emr-goodies, hadoop-client, hadoop-mapred, hadoop-hdfs-datanode, hadoop-hdfs-library, hadoop-hdfs-namenode, hadoop-httpfs-server, hadoop-kms-server, hadoop-yarn-nodemanager, hadoop-yarn-resourcemanager, mysql-server, sqoop-client | 
| emr-4.8.4 | 1.4.6 | emrfs, emr-ddb, emr-goodies, hadoop-client, hadoop-mapred, hadoop-hdfs-datanode, hadoop-hdfs-library, hadoop-hdfs-namenode, hadoop-httpfs-server, hadoop-kms-server, hadoop-yarn-nodemanager, hadoop-yarn-resourcemanager, mysql-server, sqoop-client | 
| emr-4.8.3 | 1.4.6 | emrfs, emr-ddb, emr-goodies, hadoop-client, hadoop-mapred, hadoop-hdfs-datanode, hadoop-hdfs-library, hadoop-hdfs-namenode, hadoop-httpfs-server, hadoop-kms-server, hadoop-yarn-nodemanager, hadoop-yarn-resourcemanager, mysql-server, sqoop-client | 
| emr-4.8.2 | 1.4.6 | emrfs, emr-ddb, emr-goodies, hadoop-client, hadoop-mapred, hadoop-hdfs-datanode, hadoop-hdfs-library, hadoop-hdfs-namenode, hadoop-httpfs-server, hadoop-kms-server, hadoop-yarn-nodemanager, hadoop-yarn-resourcemanager, mysql-server, sqoop-client | 
| emr-4.8.1 | 1.4.6 | emrfs, emr-ddb, emr-goodies, hadoop-client, hadoop-mapred, hadoop-hdfs-datanode, hadoop-hdfs-library, hadoop-hdfs-namenode, hadoop-httpfs-server, hadoop-kms-server, hadoop-yarn-nodemanager, hadoop-yarn-resourcemanager, mysql-server, sqoop-client | 
| emr-4.8.0 | 1.4.6 | emrfs, emr-ddb, emr-goodies, hadoop-client, hadoop-mapred, hadoop-hdfs-datanode, hadoop-hdfs-library, hadoop-hdfs-namenode, hadoop-httpfs-server, hadoop-kms-server, hadoop-yarn-nodemanager, hadoop-yarn-resourcemanager, mysql-server, sqoop-client | 
| emr-4.7.4 | 1.4.6 | emrfs, emr-ddb, emr-goodies, hadoop-client, hadoop-mapred, hadoop-hdfs-datanode, hadoop-hdfs-library, hadoop-hdfs-namenode, hadoop-httpfs-server, hadoop-kms-server, hadoop-yarn-nodemanager, hadoop-yarn-resourcemanager, mysql-server, sqoop-client | 
| emr-4.7.3 | 1.4.6 | emrfs, emr-ddb, emr-goodies, hadoop-client, hadoop-mapred, hadoop-hdfs-datanode, hadoop-hdfs-library, hadoop-hdfs-namenode, hadoop-httpfs-server, hadoop-kms-server, hadoop-yarn-nodemanager, hadoop-yarn-resourcemanager, mysql-server, sqoop-client | 
| emr-4.7.2 | 1.4.6 | emrfs, emr-ddb, emr-goodies, hadoop-client, hadoop-mapred, hadoop-hdfs-datanode, hadoop-hdfs-library, hadoop-hdfs-namenode, hadoop-httpfs-server, hadoop-kms-server, hadoop-yarn-nodemanager, hadoop-yarn-resourcemanager, mysql-server, sqoop-client | 
| emr-4.7.1 | 1.4.6 | emrfs, emr-ddb, emr-goodies, hadoop-client, hadoop-mapred, hadoop-hdfs-datanode, hadoop-hdfs-library, hadoop-hdfs-namenode, hadoop-httpfs-server, hadoop-kms-server, hadoop-yarn-nodemanager, hadoop-yarn-resourcemanager, mysql-server, sqoop-client | 
| emr-4.7.0 | 1.4.6 | emrfs, emr-ddb, emr-goodies, hadoop-client, hadoop-mapred, hadoop-hdfs-datanode, hadoop-hdfs-library, hadoop-hdfs-namenode, hadoop-httpfs-server, hadoop-kms-server, hadoop-yarn-nodemanager, hadoop-yarn-resourcemanager, mysql-server, sqoop-client | 
| emr-4.6.1 | 1.4.6 | emrfs, emr-ddb, emr-goodies, hadoop-client, hadoop-mapred, hadoop-hdfs-datanode, hadoop-hdfs-library, hadoop-hdfs-namenode, hadoop-httpfs-server, hadoop-yarn-nodemanager, hadoop-yarn-resourcemanager, mysql-server, sqoop-client | 
| emr-4.6.0 | 1.4.6 | emrfs, emr-ddb, emr-goodies, hadoop-client, hadoop-mapred, hadoop-hdfs-datanode, hadoop-hdfs-library, hadoop-hdfs-namenode, hadoop-httpfs-server, hadoop-yarn-nodemanager, hadoop-yarn-resourcemanager, mysql-server, sqoop-client | 
| emr-4.5.0 | 1.4.6 | emrfs, emr-ddb, emr-goodies, hadoop-client, hadoop-mapred, hadoop-hdfs-datanode, hadoop-hdfs-library, hadoop-hdfs-namenode, hadoop-httpfs-server, hadoop-yarn-nodemanager, hadoop-yarn-resourcemanager, sqoop-client | 
| emr-4.4.0 | 1.4.6 | emrfs, emr-ddb, emr-goodies, hadoop-client, hadoop-mapred, hadoop-hdfs-datanode, hadoop-hdfs-library, hadoop-hdfs-namenode, hadoop-httpfs-server, hadoop-yarn-nodemanager, hadoop-yarn-resourcemanager, sqoop-client | 

## Zeppelin（沙盒版本）
<a name="emr-Zeppelin-sandbox-4x"></a>

Zeppelin 从 Amazon EMR 发行版 4.1.0 开始作为沙盒应用程序提供。


**Zeppelin 沙盒版本信息**  

| Amazon EMR 发行版标签 | Zeppelin 沙盒版本 | 随 Zeppelin 沙盒安装的组件 | 
| --- | --- | --- | 
| emr-4.9.6 | 0.6.1 | emrfs, emr-goodies, hadoop-client, hadoop-hdfs-datanode, hadoop-hdfs-library, hadoop-hdfs-namenode, hadoop-httpfs-server, hadoop-kms-server, hadoop-yarn-nodemanager, hadoop-yarn-resourcemanager, spark-client, spark-history-server, spark-on-yarn, spark-yarn-slave, zeppelin-server | 
| emr-4.9.5 | 0.6.1 | emrfs, emr-goodies, hadoop-client, hadoop-hdfs-datanode, hadoop-hdfs-library, hadoop-hdfs-namenode, hadoop-httpfs-server, hadoop-kms-server, hadoop-yarn-nodemanager, hadoop-yarn-resourcemanager, spark-client, spark-history-server, spark-on-yarn, spark-yarn-slave, zeppelin-server | 
| emr-4.9.4 | 0.6.1 | emrfs, emr-goodies, hadoop-client, hadoop-hdfs-datanode, hadoop-hdfs-library, hadoop-hdfs-namenode, hadoop-httpfs-server, hadoop-kms-server, hadoop-yarn-nodemanager, hadoop-yarn-resourcemanager, spark-client, spark-history-server, spark-on-yarn, spark-yarn-slave, zeppelin-server | 
| emr-4.9.3 | 0.6.1 | emrfs, emr-goodies, hadoop-client, hadoop-hdfs-datanode, hadoop-hdfs-library, hadoop-hdfs-namenode, hadoop-httpfs-server, hadoop-kms-server, hadoop-yarn-nodemanager, hadoop-yarn-resourcemanager, spark-client, spark-history-server, spark-on-yarn, spark-yarn-slave, zeppelin-server | 
| emr-4.9.2 | 0.6.1 | emrfs, emr-goodies, hadoop-client, hadoop-hdfs-datanode, hadoop-hdfs-library, hadoop-hdfs-namenode, hadoop-httpfs-server, hadoop-kms-server, hadoop-yarn-nodemanager, hadoop-yarn-resourcemanager, spark-client, spark-history-server, spark-on-yarn, spark-yarn-slave, zeppelin-server | 
| emr-4.9.1 | 0.6.1 | emrfs, emr-goodies, hadoop-client, hadoop-hdfs-datanode, hadoop-hdfs-library, hadoop-hdfs-namenode, hadoop-httpfs-server, hadoop-kms-server, hadoop-yarn-nodemanager, hadoop-yarn-resourcemanager, spark-client, spark-history-server, spark-on-yarn, spark-yarn-slave, zeppelin-server | 
| emr-4.8.5 | 0.6.1 | emrfs, emr-goodies, hadoop-client, hadoop-hdfs-datanode, hadoop-hdfs-library, hadoop-hdfs-namenode, hadoop-httpfs-server, hadoop-kms-server, hadoop-yarn-nodemanager, hadoop-yarn-resourcemanager, spark-client, spark-history-server, spark-on-yarn, spark-yarn-slave, zeppelin-server | 
| emr-4.8.4 | 0.6.1 | emrfs, emr-goodies, hadoop-client, hadoop-hdfs-datanode, hadoop-hdfs-library, hadoop-hdfs-namenode, hadoop-httpfs-server, hadoop-kms-server, hadoop-yarn-nodemanager, hadoop-yarn-resourcemanager, spark-client, spark-history-server, spark-on-yarn, spark-yarn-slave, zeppelin-server | 
| emr-4.8.3 | 0.6.1 | emrfs, emr-goodies, hadoop-client, hadoop-hdfs-datanode, hadoop-hdfs-library, hadoop-hdfs-namenode, hadoop-httpfs-server, hadoop-kms-server, hadoop-yarn-nodemanager, hadoop-yarn-resourcemanager, spark-client, spark-history-server, spark-on-yarn, spark-yarn-slave, zeppelin-server | 
| emr-4.8.2 | 0.6.1 | emrfs, emr-goodies, hadoop-client, hadoop-hdfs-datanode, hadoop-hdfs-library, hadoop-hdfs-namenode, hadoop-httpfs-server, hadoop-kms-server, hadoop-yarn-nodemanager, hadoop-yarn-resourcemanager, spark-client, spark-history-server, spark-on-yarn, spark-yarn-slave, zeppelin-server | 
| emr-4.8.1 | 0.6.1 | emrfs, emr-goodies, hadoop-client, hadoop-hdfs-datanode, hadoop-hdfs-library, hadoop-hdfs-namenode, hadoop-httpfs-server, hadoop-kms-server, hadoop-yarn-nodemanager, hadoop-yarn-resourcemanager, spark-client, spark-history-server, spark-on-yarn, spark-yarn-slave, zeppelin-server | 
| emr-4.8.0 | 0.6.1 | emrfs, emr-goodies, hadoop-client, hadoop-hdfs-datanode, hadoop-hdfs-library, hadoop-hdfs-namenode, hadoop-httpfs-server, hadoop-kms-server, hadoop-yarn-nodemanager, hadoop-yarn-resourcemanager, spark-client, spark-history-server, spark-on-yarn, spark-yarn-slave, zeppelin-server | 
| emr-4.7.4 | 0.5.6-incubating | emrfs, emr-goodies, hadoop-client, hadoop-hdfs-datanode, hadoop-hdfs-library, hadoop-hdfs-namenode, hadoop-httpfs-server, hadoop-kms-server, hadoop-yarn-nodemanager, hadoop-yarn-resourcemanager, spark-client, spark-history-server, spark-on-yarn, spark-yarn-slave, zeppelin-server | 
| emr-4.7.3 | 0.5.6-incubating | emrfs, emr-goodies, hadoop-client, hadoop-hdfs-datanode, hadoop-hdfs-library, hadoop-hdfs-namenode, hadoop-httpfs-server, hadoop-kms-server, hadoop-yarn-nodemanager, hadoop-yarn-resourcemanager, spark-client, spark-history-server, spark-on-yarn, spark-yarn-slave, zeppelin-server | 
| emr-4.7.2 | 0.5.6-incubating | emrfs, emr-goodies, hadoop-client, hadoop-hdfs-datanode, hadoop-hdfs-library, hadoop-hdfs-namenode, hadoop-httpfs-server, hadoop-kms-server, hadoop-yarn-nodemanager, hadoop-yarn-resourcemanager, spark-client, spark-history-server, spark-on-yarn, spark-yarn-slave, zeppelin-server | 
| emr-4.7.1 | 0.5.6-incubating | emrfs, emr-goodies, hadoop-client, hadoop-hdfs-datanode, hadoop-hdfs-library, hadoop-hdfs-namenode, hadoop-httpfs-server, hadoop-kms-server, hadoop-yarn-nodemanager, hadoop-yarn-resourcemanager, spark-client, spark-history-server, spark-on-yarn, spark-yarn-slave, zeppelin-server | 
| emr-4.7.0 | 0.5.6-incubating | emrfs, emr-goodies, hadoop-client, hadoop-hdfs-datanode, hadoop-hdfs-library, hadoop-hdfs-namenode, hadoop-httpfs-server, hadoop-kms-server, hadoop-yarn-nodemanager, hadoop-yarn-resourcemanager, spark-client, spark-history-server, spark-on-yarn, spark-yarn-slave, zeppelin-server | 
| emr-4.6.1 | 0.5.6-incubating | emrfs, emr-goodies, hadoop-client, hadoop-hdfs-datanode, hadoop-hdfs-library, hadoop-hdfs-namenode, hadoop-httpfs-server, hadoop-yarn-nodemanager, hadoop-yarn-resourcemanager, spark-client, spark-history-server, spark-on-yarn, spark-yarn-slave, zeppelin-server | 
| emr-4.6.0 | 0.5.6-incubating | emrfs, emr-goodies, hadoop-client, hadoop-hdfs-datanode, hadoop-hdfs-library, hadoop-hdfs-namenode, hadoop-httpfs-server, hadoop-yarn-nodemanager, hadoop-yarn-resourcemanager, spark-client, spark-history-server, spark-on-yarn, spark-yarn-slave, zeppelin-server | 
| emr-4.5.0 | 0.5.6-incubating | emrfs, emr-goodies, hadoop-client, hadoop-hdfs-datanode, hadoop-hdfs-library, hadoop-hdfs-namenode, hadoop-httpfs-server, hadoop-yarn-nodemanager, hadoop-yarn-resourcemanager, spark-client, spark-history-server, spark-on-yarn, spark-yarn-slave, zeppelin-server | 
| emr-4.4.0 | 0.5.6-incubating | emrfs, emr-goodies, hadoop-client, hadoop-hdfs-datanode, hadoop-hdfs-library, hadoop-hdfs-namenode, hadoop-httpfs-server, hadoop-yarn-nodemanager, hadoop-yarn-resourcemanager, spark-client, spark-history-server, spark-on-yarn, spark-yarn-slave, zeppelin-server | 
| emr-4.3.0 | 0.5.5-incubating-amzn-1 | emrfs, emr-goodies, hadoop-client, hadoop-hdfs-datanode, hadoop-hdfs-library, hadoop-hdfs-namenode, hadoop-httpfs-server, hadoop-yarn-nodemanager, hadoop-yarn-resourcemanager, spark-client, spark-history-server, spark-on-yarn, spark-yarn-slave, zeppelin-server | 
| emr-4.2.0 | 0.5.5-incubating-amzn-0 | emrfs, emr-goodies, hadoop-client, hadoop-hdfs-datanode, hadoop-hdfs-library, hadoop-hdfs-namenode, hadoop-httpfs-server, hadoop-yarn-nodemanager, hadoop-yarn-resourcemanager, spark-client, spark-history-server, spark-on-yarn, spark-yarn-slave, zeppelin-server | 
| emr-4.1.0 | 0.6.0-incubating-SNAPSHOT | emrfs, emr-goodies, hadoop-client, hadoop-hdfs-datanode, hadoop-hdfs-library, hadoop-hdfs-namenode, hadoop-httpfs-server, hadoop-yarn-nodemanager, hadoop-yarn-resourcemanager, spark-client, spark-history-server, spark-on-yarn, spark-yarn-slave, zeppelin-server | 

## ZooKeeper （沙盒版本）
<a name="emr-Zookeeper-sandbox-4x"></a>

Zookeeper 从 Amazon EMR 发行版 4.6.0 开始作为沙盒应用程序提供。


**ZooKeeper-沙盒版本信息**  

| Amazon EMR 发行版标签 | ZooKeeper-沙盒版 | 与沙盒一起安装的 ZooKeeper组件 | 
| --- | --- | --- | 
| emr-4.9.6 | 3.4.9 | emrfs, emr-goodies, hadoop-client, hadoop-hdfs-datanode, hadoop-hdfs-library, hadoop-hdfs-namenode, hadoop-httpfs-server, hadoop-kms-server, hadoop-yarn-nodemanager, hadoop-yarn-resourcemanager, zookeeper-client, zookeeper-server | 
| emr-4.9.5 | 3.4.9 | emrfs, emr-goodies, hadoop-client, hadoop-hdfs-datanode, hadoop-hdfs-library, hadoop-hdfs-namenode, hadoop-httpfs-server, hadoop-kms-server, hadoop-yarn-nodemanager, hadoop-yarn-resourcemanager, zookeeper-client, zookeeper-server | 
| emr-4.9.4 | 3.4.9 | emrfs, emr-goodies, hadoop-client, hadoop-hdfs-datanode, hadoop-hdfs-library, hadoop-hdfs-namenode, hadoop-httpfs-server, hadoop-kms-server, hadoop-yarn-nodemanager, hadoop-yarn-resourcemanager, zookeeper-client, zookeeper-server | 
| emr-4.9.3 | 3.4.9 | emrfs, emr-goodies, hadoop-client, hadoop-hdfs-datanode, hadoop-hdfs-library, hadoop-hdfs-namenode, hadoop-httpfs-server, hadoop-kms-server, hadoop-yarn-nodemanager, hadoop-yarn-resourcemanager, zookeeper-client, zookeeper-server | 
| emr-4.9.2 | 3.4.9 | emrfs, emr-goodies, hadoop-client, hadoop-hdfs-datanode, hadoop-hdfs-library, hadoop-hdfs-namenode, hadoop-httpfs-server, hadoop-kms-server, hadoop-yarn-nodemanager, hadoop-yarn-resourcemanager, zookeeper-client, zookeeper-server | 
| emr-4.9.1 | 3.4.9 | emrfs, emr-goodies, hadoop-client, hadoop-hdfs-datanode, hadoop-hdfs-library, hadoop-hdfs-namenode, hadoop-httpfs-server, hadoop-kms-server, hadoop-yarn-nodemanager, hadoop-yarn-resourcemanager, zookeeper-client, zookeeper-server | 
| emr-4.8.5 | 3.4.9 | emrfs, emr-goodies, hadoop-client, hadoop-hdfs-datanode, hadoop-hdfs-library, hadoop-hdfs-namenode, hadoop-httpfs-server, hadoop-kms-server, hadoop-yarn-nodemanager, hadoop-yarn-resourcemanager, zookeeper-client, zookeeper-server | 
| emr-4.8.4 | 3.4.9 | emrfs, emr-goodies, hadoop-client, hadoop-hdfs-datanode, hadoop-hdfs-library, hadoop-hdfs-namenode, hadoop-httpfs-server, hadoop-kms-server, hadoop-yarn-nodemanager, hadoop-yarn-resourcemanager, zookeeper-client, zookeeper-server | 
| emr-4.8.3 | 3.4.9 | emrfs, emr-goodies, hadoop-client, hadoop-hdfs-datanode, hadoop-hdfs-library, hadoop-hdfs-namenode, hadoop-httpfs-server, hadoop-kms-server, hadoop-yarn-nodemanager, hadoop-yarn-resourcemanager, zookeeper-client, zookeeper-server | 
| emr-4.8.2 | 3.4.8 | emrfs, emr-goodies, hadoop-client, hadoop-hdfs-datanode, hadoop-hdfs-library, hadoop-hdfs-namenode, hadoop-httpfs-server, hadoop-kms-server, hadoop-yarn-nodemanager, hadoop-yarn-resourcemanager, zookeeper-client, zookeeper-server | 
| emr-4.8.1 | 3.4.8 | emrfs, emr-goodies, hadoop-client, hadoop-hdfs-datanode, hadoop-hdfs-library, hadoop-hdfs-namenode, hadoop-httpfs-server, hadoop-kms-server, hadoop-yarn-nodemanager, hadoop-yarn-resourcemanager, zookeeper-client, zookeeper-server | 
| emr-4.8.0 | 3.4.8 | emrfs, emr-goodies, hadoop-client, hadoop-hdfs-datanode, hadoop-hdfs-library, hadoop-hdfs-namenode, hadoop-httpfs-server, hadoop-kms-server, hadoop-yarn-nodemanager, hadoop-yarn-resourcemanager, zookeeper-client, zookeeper-server | 
| emr-4.7.4 | 3.4.8 | emrfs, emr-goodies, hadoop-client, hadoop-hdfs-datanode, hadoop-hdfs-library, hadoop-hdfs-namenode, hadoop-httpfs-server, hadoop-kms-server, hadoop-yarn-nodemanager, hadoop-yarn-resourcemanager, zookeeper-client, zookeeper-server | 
| emr-4.7.3 | 3.4.8 | emrfs, emr-goodies, hadoop-client, hadoop-hdfs-datanode, hadoop-hdfs-library, hadoop-hdfs-namenode, hadoop-httpfs-server, hadoop-kms-server, hadoop-yarn-nodemanager, hadoop-yarn-resourcemanager, zookeeper-client, zookeeper-server | 
| emr-4.7.2 | 3.4.8 | emrfs, emr-goodies, hadoop-client, hadoop-hdfs-datanode, hadoop-hdfs-library, hadoop-hdfs-namenode, hadoop-httpfs-server, hadoop-kms-server, hadoop-yarn-nodemanager, hadoop-yarn-resourcemanager, zookeeper-client, zookeeper-server | 
| emr-4.7.1 | 3.4.8 | emrfs, emr-goodies, hadoop-client, hadoop-hdfs-datanode, hadoop-hdfs-library, hadoop-hdfs-namenode, hadoop-httpfs-server, hadoop-kms-server, hadoop-yarn-nodemanager, hadoop-yarn-resourcemanager, zookeeper-client, zookeeper-server | 
| emr-4.7.0 | 3.4.8 | emrfs, emr-goodies, hadoop-client, hadoop-hdfs-datanode, hadoop-hdfs-library, hadoop-hdfs-namenode, hadoop-httpfs-server, hadoop-kms-server, hadoop-yarn-nodemanager, hadoop-yarn-resourcemanager, zookeeper-client, zookeeper-server | 
| emr-4.6.1 | 3.4.8 | emrfs, emr-goodies, hadoop-client, hadoop-hdfs-datanode, hadoop-hdfs-library, hadoop-hdfs-namenode, hadoop-httpfs-server, hadoop-yarn-nodemanager, hadoop-yarn-resourcemanager, zookeeper-client, zookeeper-server | 
| emr-4.6.0 | 3.4.8 | emrfs, emr-goodies, hadoop-client, hadoop-hdfs-datanode, hadoop-hdfs-library, hadoop-hdfs-namenode, hadoop-httpfs-server, hadoop-yarn-nodemanager, hadoop-yarn-resourcemanager, zookeeper-client, zookeeper-server | 

# 使用 Amazon EMR 4.x 上的 Hive 的注意事项
<a name="emr-Hive-4x"></a>

本节介绍在使用 Amazon EMR 4.x 发行版上的 Hive 版本 1.0.0 时要注意的差异（与 Amazon EMR 5.x 发行版上的 Hive 2.x 相比）。

## 不支持 ACID 事务
<a name="emr-Hive-acid-4x"></a>

使用 Amazon EMR 4.x 发行版时，4.x 发行版上的 Hive 不支持 Hive 数据存储在 Amazon S3 中的 ACID 事务。如果您尝试在 Amazon S3 中创建事务表，将出现异常。

## 对 Amazon S3 中的表的读写操作
<a name="emr-Hive-s3table-4x"></a>

Amazon EMR 4.x 发行版上的 Hive 可直接写入 Amazon S3，无需使用临时文件。这可以改善性能，但导致您无法在同一个 Hive 语句内读写 Amazon S3 中的同一个表。一种解决办法是在 HDFS 中创建并使用临时表。

以下示例显示了如何使用多 Hive 语句更新 Amazon S3 中的表。这些语句基于 Amazon S3 中一个名为 `my_s3_table` 的表在 HDFS 中创建一个名为 `tmp` 的临时表。之后将使用此临时表的内容更新 Amazon S3 中的表。

```
CREATE TEMPORARY TABLE tmp LIKE my_s3_table;
INSERT OVERWRITE TABLE tmp SELECT ....;
INSERT OVERWRITE TABLE my_s3_table SELECT * FROM tmp;
```

## Log4j 与 Log4j 2 的对比
<a name="emr-Hive-log4j-4x"></a>

Amazon EMR 4.x 发行版上的 Hive 使用 Log4j。从版本 5.0.0 开始，默认情况下使用 Log4j 2。这些版本可能需要不同的日志记录配置。有关更多信息，请参阅 [Apache Log4j 2](http://logging.apache.org/log4j/2.x/)。

## MapReduce 是默认的执行引擎
<a name="emr-Hive-tez-4x"></a>

亚马逊 EMR 4.x 发行版上的 Hive MapReduce 用作默认执行引擎。从 Amazon EMR 版本 5.0.0 开始，Tez 为默认引擎，这将改善大多数工作流的性能。

## Hive 授权
<a name="emr-Hive-authz-4x"></a>

Amazon EMR 4.x 发行版上的 Hive 对于 HDFS 支持 [Hive 授权](https://cwiki.apache.org/confluence/display/Hive/LanguageManual+Authorization)，但对于 EMRFS 和 Amazon S3 不支持此授权。默认情况下，Amazon EMR 集群在禁用授权的状态下运行。

## Amazon S3 中的 Hive 文件合并操作
<a name="emr-Hive-filemerge-4x"></a>

如果 `hive.merge.mapfiles` 为 `true`，Amazon EMR 4.x 发行版上的 Hive 将在仅映射任务结束时合并小型文件。仅当任务的平均输出大小低于 `hive.merge.smallfiles.avgsize` 设置时，才会触发合并。如果最终输出路径位于 HDFS 中，那么 Amazon EMR Hive 的行为将完全相同。但是，如果输出路径位于 Amazon S3 中，将忽略 `hive.merge.smallfiles.avgsize` 参数。在那种情况下，如果 `hive.merge.mapfiles` 设置为 `true`，会始终触发合并任务。

# 使用 Amazon EMR 4.x 上的 Pig 的注意事项
<a name="emr-Pig-4x"></a>

Pig 版本 0.14.0 安装在使用 Amazon EMR 4.x 发行版创建的集群上。Pig 在 Amazon EMR 5.0.0 中已升级到版本 0.16.0。下面介绍了明显差异。

## 不同的默认执行引擎
<a name="emr-Pig-engine-4x"></a>

亚马逊 EMR 4.x 发行版上的 Pig 版本 0.14.0 MapReduce 用作默认执行引擎。Pig 0.16.0 及更高版本均使用 Apache Tez。你可以在`pig-properties`配置分类`exectype=mapreduce`中明确设置要使用 MapReduce。

## 丢弃了 Pig 用户定义的函数 (UDFs)
<a name="emr-Pig-udf-4x"></a>

Pig on Amazon EMR 4.x 发行版本中提供的自定义 UDFs 版本从 Pig 0.16.0 开始被删除。其中大多数 UDFs 都有等效的函数，你可以改用。下表列出了删除的函数 UDFs 和等效函数。有关更多信息，请参阅 Apache Pig 网站上的[内置函数](https://pig.apache.org/docs/r0.16.0/func.html)。


| 已删除的 UDF | 等效函数 | 
| --- | --- | 
|  FORMAT\$1DT(dtformat, date)  |  GetHour（日期）、 GetMinute（日期）、 GetMonth（日期）、 GetSecond（日期）、 GetWeek（日期）、 GetYear（日期）、 GetDay（日期）  | 
|  EXTRACT(string, pattern)  |  REGEX\$1EXTRACT\$1ALL(string, pattern)  | 
|  REPLACE(string, pattern, replacement)  |  REPLACE(string, pattern, replacement)  | 
|  DATE\$1TIME()  |  ToDate()  | 
|  DURATION(dt, dt2)  |  WeeksBetween(dt, dt2), (dt, dt2), YearsBetween (dt, dt2), SecondsBetween (dt, dt2), (dt, dt2), MonthsBetween (dt, dt2), MinutesBetween (dt, dt2) HoursBetween  | 
|  EXTRACT\$1DT(format, date)  |  GetHour（日期）、 GetMinute（日期）、 GetMonth（日期）、 GetSecond（日期）、 GetWeek（日期）、 GetYear（日期）、 GetDay（日期）  | 
|  OFFSET\$1DT(date, duration)  |  AddDuration（日期、持续时间）、 SubtractDuration（日期、持续时间）  | 
|  PERIOD(dt, dt2)  |  WeeksBetween(dt, dt2), (dt, dt2), YearsBetween (dt, dt2), SecondsBetween (dt, dt2), (dt, dt2), MonthsBetween (dt, dt2), MinutesBetween (dt, dt2) HoursBetween  | 
|  CAPITALIZE(string)  |  UCFIRST(string)  | 
|  CONCAT\$1WITH()  |  CONCAT()  | 
|  INDEX\$1OF()  |  INDEXOF()  | 
|  LAST\$1INDEX\$1OF()  |  LAST\$1INDEXOF()  | 
|  SPLIT\$1ON\$1REGEX()  |  STRSPLT()  | 
|  UNCAPITALIZE()  |  LCFIRST()  | 

以下内容 UDFs 被删除但没有等效项：FORMAT ()、LOCAL\$1DATE ()、LOCAL\$1TIME ()、CENTER ()、LEFT\$1PAD ()、REPLET\$1ONCE ()、RIP\$1PAD ()、STRIP\$1END ()、STRIP\$1END ()、STRIP\$1START ()、SWAP\$1CASE ()。

## 已停止使用 Grunt 命令
<a name="emr-pig-gruntcmd-4x"></a>

某些 Grunt 命令已从 Pig 0.16.0 开始停用。下表列出了 Pig 0.14.0 中的 Grunt 命令以及当前版本中的等效命令（如果适用）。


**Pig 0.14.0 和等效的当前 Grunt 命令**  

| Pig 0.14.0 Grunt 命令 | 0.16.0 及更高版本中的 Pig Grunt 命令 | 
| --- | --- | 
|  cat < non-hdfs-path >)  |  fs-cat < non-hdfs-path >;  | 
| cd < non-hdfs-path >; |  无等效函数  | 
| ls < non-hdfs-path >; | fs-ls < non-hdfs-path >; | 
|  移动 < non-hdfs-path > < non-hdfs-path >;  |  fs-mv < non-hdfs-path > < non-hdfs-path >;  | 
| 复制 < non-hdfs-path > < non-hdfs-path >; |  fs-cp < non-hdfs-path > < non-hdfs-path >;  | 
| copyToLocal < non-hdfs-path ><local-path>; |  fs-copyToLocal < non-hdfs-path ><local-path>;  | 
| copyFromLocal <local-path>< non-hdfs-path >; |  fs-copyFromLocal <local-path>< non-hdfs-path >;  | 
| mkdir < non-hdfs-path >; |  fs-mkdir < >; non-hdfs-path   | 
| rm < non-hdfs-path >; |  fs-rm-r-r-skipTrash < >; non-hdfs-path   | 
|  rmf < non-hdfs-path >;  |  fs-rm-r-r-skipTrash < >; non-hdfs-path   | 

## 针对非 HDFS 主目录删除的功能
<a name="emr-Pig-users-4x"></a>

Amazon EMR 4.x 发行版上的 Pig 0.14.0 具有两种机制，以允许无主目录的 `hadoop` 用户之外的用户运行 Pig 脚本。第一种机制是自动后备，将初始工作目录设置为根目录 (如果主目录不存在)。第二种机制是 `pig.initial.fs.name` 属性，它允许您更改初始工作目录。

这两种机制从 Amazon EMR 版本 5.0.0 开始不可用，因此用户必须在 HDFS 上有一个主目录。这不适用于 `hadoop` 用户，因为在启动时会配置一个主目录。使用 Hadoop jar 步骤运行的脚本默认为由 Hadoop 用户运行，除非使用 `command-runner.jar` 显式指定了其它用户。

# Amazon EMR 发行版 4.9.6
<a name="emr-496-release"></a>

## 4.9.6 应用程序版本
<a name="emr-496-app-versions"></a>

此版本包括以下应用程序：[http://ganglia.info](http://ganglia.info)、[http://hbase.apache.org/](http://hbase.apache.org/)、[https://cwiki.apache.org/confluence/display/Hive/HCatalog](https://cwiki.apache.org/confluence/display/Hive/HCatalog)、[http://hadoop.apache.org/docs/current/](http://hadoop.apache.org/docs/current/)、[http://hive.apache.org/](http://hive.apache.org/)、[http://gethue.com/](http://gethue.com/)、[http://mahout.apache.org/](http://mahout.apache.org/)、[http://oozie.apache.org/](http://oozie.apache.org/)、[https://phoenix.apache.org/](https://phoenix.apache.org/)、[http://pig.apache.org/](http://pig.apache.org/)、[https://prestodb.io/](https://prestodb.io/)、[https://spark.apache.org/docs/latest/](https://spark.apache.org/docs/latest/)、[http://sqoop.apache.org/](http://sqoop.apache.org/)、[https://tez.apache.org/](https://tez.apache.org/)、[https://zeppelin.incubator.apache.org/](https://zeppelin.incubator.apache.org/) 和 [https://zookeeper.apache.org](https://zookeeper.apache.org)。

下表列出了此版本的 Amazon EMR 中提供的应用程序版本以及前三个 Amazon EMR 发行版中的应用程序版本（若适用）。

有关每个发行版的 Amazon EMR 的应用程序版本的全面历史记录，请参见以下主题：
+ [Amazon EMR 7.x 发行版中的应用程序版本](emr-release-app-versions-7.x.md)
+ [Amazon EMR 6.x 发行版中的应用程序版本](emr-release-app-versions-6.x.md)
+ [Amazon EMR 5.x 发行版中的应用程序版本](emr-release-app-versions-5.x.md)
+ [Amazon EMR 4.x 发行版中的应用程序版本](emr-release-app-versions-4.x.md)


**应用程序版本信息**  

|  | emr-4.9.6 | emr-4.9.5 | emr-4.9.4 | emr-4.9.3 | 
| --- | --- | --- | --- | --- | 
| AWS 适用于 Java 的 SDK | 1.10.75 | 1.10.75 | 1.10.75 | 1.10.75 | 
| Python | 未跟踪 | 未跟踪 | 未跟踪 | 未跟踪 | 
| Scala | 未跟踪 | 未跟踪 | 未跟踪 | 未跟踪 | 
| AmazonCloudWatchAgent |  -  |  -  |  -  |  -  | 
| Delta |  -  |  -  |  -  |  -  | 
| Flink |  -  |  -  |  -  |  -  | 
| Ganglia | 3.7.2 | 3.7.2 | 3.7.2 | 3.7.2 | 
| HBase | 1.2.2 | 1.2.2 | 1.2.2 | 1.2.2 | 
| HCatalog | 1.0.0-amzn-9 | 1.0.0-amzn-9 | 1.0.0-amzn-9 | 1.0.0-amzn-9 | 
| Hadoop | 2.7.3-amzn-2 | 2.7.3-amzn-2 | 2.7.3-amzn-2 | 2.7.3-amzn-2 | 
| Hive | 1.0.0-amzn-9 | 1.0.0-amzn-9 | 1.0.0-amzn-9 | 1.0.0-amzn-9 | 
| Hudi |  -  |  -  |  -  |  -  | 
| Hue | 3.7.1-amzn-7 | 3.7.1-amzn-7 | 3.7.1-amzn-7 | 3.7.1-amzn-7 | 
| Iceberg |  -  |  -  |  -  |  -  | 
| JupyterEnterpriseGateway |  -  |  -  |  -  |  -  | 
| JupyterHub |  -  |  -  |  -  |  -  | 
| Livy |  -  |  -  |  -  |  -  | 
| MXNet |  -  |  -  |  -  |  -  | 
| Mahout | 0.12.2 | 0.12.2 | 0.12.2 | 0.12.2 | 
| Oozie |  -  |  -  |  -  |  -  | 
| Oozie-Sandbox | 4.2.0 | 4.2.0 | 4.2.0 | 4.2.0 | 
| Phoenix | 4.7.0--1.2 HBase | 4.7.0--1.2 HBase | 4.7.0--1.2 HBase | 4.7.0--1.2 HBase | 
| Pig | 0.14.0-amzn-0 | 0.14.0-amzn-0 | 0.14.0-amzn-0 | 0.14.0-amzn-0 | 
| Presto |  -  |  -  |  -  |  -  | 
| Presto-Sandbox | 0.157.1 | 0.157.1 | 0.157.1 | 0.157.1 | 
| Spark | 1.6.3 | 1.6.3 | 1.6.3 | 1.6.3 | 
| Sqoop |  -  |  -  |  -  |  -  | 
| Sqoop-Sandbox | 1.4.6 | 1.4.6 | 1.4.6 | 1.4.6 | 
| TensorFlow |  -  |  -  |  -  |  -  | 
| Tez | 0.8.4 | 0.8.4 | 0.8.4 | 0.8.4 | 
| Trino (PrestoSQL) |  -  |  -  |  -  |  -  | 
| Zeppelin |  -  |  -  |  -  |  -  | 
| Zeppelin-Sandbox | 0.6.1 | 0.6.1 | 0.6.1 | 0.6.1 | 
| ZooKeeper |  -  |  -  |  -  |  -  | 
| ZooKeeper-Sandbox | 3.4.9 | 3.4.9 | 3.4.9 | 3.4.9 | 

## 4.9.6 发布说明
<a name="emr-496-relnotes"></a>

这是一个补丁版本，用于为向 Amazon S3 发出的请求添加 AWS 签名版本 4 身份验证。所有应用程序和组件都与之前的 Amazon EMR 发行版相同。

**重要**  
在此版本中，Amazon EMR 仅使用 AWS 签名版本 4 来验证向 Amazon S3 发出的请求。有关更多信息，请参阅[新功能](https://docs.aws.amazon.com/emr/latest/ReleaseGuide/emr-whatsnew.html)。

## 4.9.6 组件版本
<a name="emr-496-components"></a>

下面列出了 Amazon EMR 随此发行版一起安装的组件。一些组件作为大数据应用程序包的一部分安装。其它组件是 Amazon EMR 独有的，并且已为系统流程和功能安装这些组件。它们通常以 `emr` 或 `aws` 开头。最新的 Amazon EMR 发行版中的大数据应用程序包通常是在社区中找到的最新版本。我们会尽快在 Amazon EMR 中提供社区发行版。

Amazon EMR 中的某些组件与社区版本不同。这些组件具有以下形式的 `CommunityVersion-amzn-EmrVersion` 的发行版标注。`EmrVersion` 从 0 开始。例如，假设已对名为 `myapp-component` 的版本 2.2 的开源社区组件进行三次修改，以包含在不同的 Amazon EMR 发行版中，则其发行版将为 `2.2-amzn-2`。


| 组件 | 版本 | 说明 | 
| --- | --- | --- | 
| emr-ddb | 4.3.0 | 适用于 Hadoop 生态系统应用程序的 Amazon DynamoDB 连接器。 | 
| emr-goodies | 2.2.0 | 适用于 Hadoop 生态系统的方便易用的库。 | 
| emr-kinesis | 3.3.0 | 适用于 Hadoop 生态系统应用程序的 Amazon Kinesis 连接器。 | 
| emr-s3-dist-cp | 2.4.0 | 针对 Amazon S3 优化的分布式复制应用程序。 | 
| emrfs | 2.17.0 | 适用于 Hadoop 生态系统应用程序的 Amazon S3 连接器。 | 
| ganglia-monitor | 3.7.2 | 适用于 Hadoop 生态系统应用程序的嵌入式 Ganglia 代理以及 Ganglia 监控代理。 | 
| ganglia-metadata-collector | 3.7.2 | 用于从 Ganglia 监控代理中聚合指标的 Ganglia 元数据收集器。 | 
| ganglia-web | 3.7.1 | 用于查看由 Ganglia 元数据收集器收集的指标的 Web 应用程序。 | 
| hadoop-client | 2.7.3-amzn-2 | Hadoop 命令行客户端，如“hdfs”、“hadoop”或“yarn”。 | 
| hadoop-hdfs-datanode | 2.7.3-amzn-2 | 用于存储数据块的 HDFS 节点级服务。 | 
| hadoop-hdfs-library | 2.7.3-amzn-2 | HDFS 命令行客户端和库 | 
| hadoop-hdfs-namenode | 2.7.3-amzn-2 | 用于跟踪文件名和数据块位置的 HDFS 服务。 | 
| hadoop-httpfs-server | 2.7.3-amzn-2 | 用于 HDFS 操作的 HTTP 终端节点。 | 
| hadoop-kms-server | 2.7.3-amzn-2 | 基于 Hadoop 的 API 的加密密钥管理服务器。 KeyProvider  | 
| hadoop-mapred | 2.7.3-amzn-2 | MapReduce 用于运行 MapReduce 应用程序的执行引擎库。 | 
| hadoop-yarn-nodemanager | 2.7.3-amzn-2 | 用于管理单个节点上的容器的 YARN 服务。 | 
| hadoop-yarn-resourcemanager | 2.7.3-amzn-2 | 用于分配和管理集群资源与分布式应用程序的 YARN 服务。 | 
| hadoop-yarn-timeline-server | 2.7.3-amzn-2 | 用于检索 YARN 应用程序的当前信息和历史信息的服务。 | 
| hbase-hmaster | 1.2.2 | 为负责协调区域和执行管理命令的 HBase 集群提供服务。 | 
| hbase-region-server | 1.2.2 | 为一个或多个 HBase 地区提供服务的服务。 | 
| hbase-client | 1.2.2 | HBase 命令行客户端。 | 
| hbase-rest-server | 1.2.2 | 为提供 RESTful HTTP 端点的服务 HBase。 | 
| hbase-thrift-server | 1.2.2 | 为其提供 Thrift 端点的 HBase服务。 | 
| hcatalog-client | 1.0.0-amzn-9 | 用于操作 hcatalog-server 的“hcat”命令行客户端。 | 
| hcatalog-server | 1.0.0-amzn-9 | 提供服务 HCatalog，为分布式应用程序提供表和存储管理层。 | 
| hcatalog-webhcat-server | 1.0.0-amzn-9 | 为其提供 REST 接口的 HTTP 端点 HCatalog。 | 
| hive-client | 1.0.0-amzn-9 | Hive 命令行客户端。 | 
| hive-metastore-server | 1.0.0-amzn-9 | 用于访问 Hive 元存储 (一个用于存储 Hadoop 操作中的 SQL 的元数据的语义存储库) 的服务。 | 
| hive-server | 1.0.0-amzn-9 | 用于将 Hive 查询作为 Web 请求接受的服务。 | 
| hue-server | 3.7.1-amzn-7 | 用于使用 Hadoop 生态系统应用程序分析数据的 Web 应用程序 | 
| mahout-client | 0.12.2 | 用于机器学习的库。 | 
| mysql-server | 5.5.54\$1 | MySQL 数据库服务器。 | 
| oozie-client | 4.2.0 | Oozie 命令行客户端。 | 
| oozie-server | 4.2.0 | 用于接受 Oozie 工作流请求的服务。 | 
| phoenix-library | 4.7.0--1.2 HBase | 服务器和客户端的 phoenix 库 | 
| phoenix-query-server | 4.7.0--1.2 HBase | 向 Avatica API 提供 JDBC 访问权限以及协议缓冲区和 JSON 格式访问权限的轻量级服务器  | 
| presto-coordinator | 0.157.1 | 用于在 presto-worker 之中接受查询并管理查询的服务。 | 
| presto-worker | 0.157.1 | 用于执行查询的各个部分的服务。 | 
| pig-client | 0.14.0-amzn-0 | Pig 命令行客户端。 | 
| spark-client | 1.6.3 | Spark 命令行客户端。 | 
| spark-history-server | 1.6.3 | 用于查看完整的 Spark 应用程序的生命周期的已记录事件的 Web UI。 | 
| spark-on-yarn | 1.6.3 | 适用于 YARN 的内存中执行引擎。 | 
| spark-yarn-slave | 1.6.3 | YARN 从属项所需的 Apache Spark 库。 | 
| sqoop-client | 1.4.6 | Apache Sqoop 命令行客户端。 | 
| tez-on-yarn | 0.8.4 | tez YARN 应用程序和库。 | 
| webserver | 2.4.25\$1 | Apache HTTP 服务器。 | 
| zeppelin-server | 0.6.1 | 支持交互式数据分析的基于 Web 的 Notebook。 | 
| zookeeper-server | 3.4.9 | 用于维护配置信息、命名、提供分布式同步以及提供组服务的集中式服务。 | 
| zookeeper-client | 3.4.9 | ZooKeeper 命令行客户端。 | 

## 4.9.6 配置分类
<a name="emr-496-class"></a>

配置分类允许您自定义应用程序。这些通常与应用程序的配置 XML 文件（例如 `hive-site.xml`）相对应。有关更多信息，请参阅[配置应用程序](emr-configure-apps.md)。


**emr-4.9.6 分类**  

| 分类 | 说明 | 
| --- | --- | 
| capacity-scheduler | 更改 Hadoop 的 capacity-scheduler.xml 文件中的值。 | 
| core-site | 更改 Hadoop 的 core-site.xml 文件中的值。 | 
| emrfs-site | 更改 EMRFS 设置。 | 
| hadoop-env | 更改适用于所有 Hadoop 组件的 Hadoop 环境中的值。 | 
| hadoop-log4j | 更改 Hadoop 的 log4j.properties 文件中的值。 | 
| hadoop-ssl-server | 更改 hadoop ssl 服务器配置 | 
| hadoop-ssl-client | 更改 hadoop ssl 客户端配置 | 
| hbase-env | 更改环境 HBase中的值。 | 
| hbase-log4j | 更改 hbase- HBase log4j.properties 文件中的值。 | 
| hbase-metrics | 更改 hadoop-metrics2-hb HBase aase.properties 文件中的值。 | 
| hbase-policy | 更改 hbase-policy.xml 文件 HBase中的值。 | 
| hbase-site | 更改 HBase的 hbase-site.xml 文件中的值。 | 
| hdfs-encryption-zones | 配置 HDFS 加密区域。 | 
| hdfs-site | 更改 HDFS 的 hdfs-site.xml 中的值。 | 
| hcatalog-env | 更改环境 HCatalog中的值。 | 
| hcatalog-server-jndi | 更改 HCatalog的 jndi.properties 中的值。 | 
| hcatalog-server-proto-hive-site | 更改 proto-hive-site .x HCatalog ml 中的值。 | 
| hcatalog-webhcat-env | 更改 HCatalog Web 环境HCat中的值。 | 
| hcatalog-webhcat-log4j | 更改 HCatalog Web HCat 的 log4j.properties 中的值。 | 
| hcatalog-webhcat-site | 更改 HCatalog Web HCat 的 webhcat-site.xml 文件中的值。 | 
| hive-env | 更改 Hive 环境中的值。 | 
| hive-exec-log4j | 更改 Hive 的 hive-exec-log 4j.properties 文件中的值。 | 
| hive-log4j | 更改 Hive 的 hive-log4j.properties 文件中的值。 | 
| hive-site | 更改 Hive 的 hive-site.xml 文件中的值 | 
| hiveserver2-site | 更改 Hive Server2 的 hiveserver2-site.xml 文件中的值 | 
| hue-ini | 更改 Hue 的 ini 文件中的值 | 
| httpfs-env | 更改 HTTPFS 环境中的值。 | 
| httpfs-site | 更改 Hadoop 的 httpfs-site.xml 文件中的值。 | 
| hadoop-kms-acls | 更改 Hadoop 的 kms-acls.xml 文件中的值。 | 
| hadoop-kms-env | 更改 Hadoop KMS 环境中的值。 | 
| hadoop-kms-log4j | 更改 Hadoop 的 kms-log4j.properties 文件中的值。 | 
| hadoop-kms-site | 更改 Hadoop 的 kms-site.xml 文件中的值。 | 
| mapred-env | 更改 MapReduce 应用程序环境中的值。 | 
| mapred-site | 更改 MapReduce 应用程序的 mapred-site.xml 文件中的值。 | 
| oozie-env | 更改 Oozie 的环境中的值。 | 
| oozie-log4j | 更改 Oozie 的 oozie-log4j.properties 文件中的值。 | 
| oozie-site | 更改 Oozie 的 oozie-site.xml 文件中的值。 | 
| phoenix-hbase-metrics | 更改 Phoenix 的 hadoop-metrics2-hbase.properties 文件中的值。 | 
| phoenix-hbase-site | 更改 Phoenix 的 hbase-site.xml 文件中的值。 | 
| phoenix-log4j | 更改 Phoenix 的 log4j.properties 文件中的值。 | 
| phoenix-metrics | 更改 Phoenix 的 hadoop-metrics2-phoenix.properties 文件中的值。 | 
| pig-properties | 更改 Pig 的 pig.properties 文件中的值。 | 
| pig-log4j | 更改 Pig 的 log4j.properties 文件中的值。 | 
| presto-log | 更改 Presto 的 log.properties 文件中的值。 | 
| presto-config | 更改 Presto 的 config.properties 文件中的值。 | 
| presto-connector-blackhole | 更改 Presto 的 blackhole.properties 文件中的值。 | 
| presto-connector-cassandra | 更改 Presto 的 cassandra.properties 文件中的值。 | 
| presto-connector-hive | 更改 Presto 的 hive.properties 文件中的值。 | 
| presto-connector-jmx | 更改 Presto 的 jmx.properties 文件中的值。 | 
| presto-connector-kafka | 更改 Presto 的 kafka.properties 文件中的值。 | 
| presto-connector-localfile | 更改 Presto 的 localfile.properties 文件中的值。 | 
| presto-connector-mongodb | 更改 Presto 的 mongodb.properties 文件中的值。 | 
| presto-connector-mysql | 更改 Presto 的 mysql.properties 文件中的值。 | 
| presto-connector-postgresql | 更改 Presto 的 postgresql.properties 文件中的值。 | 
| presto-connector-raptor | 更改 Presto 的 raptor.properties 文件中的值。 | 
| presto-connector-redis | 更改 Presto 的 redis.properties 文件中的值。 | 
| presto-connector-tpch | 更改 Presto 的 tpch.properties 文件中的值。 | 
| spark | 适用于 Apache Spark 的 Amazon EMR 辅助设置。 | 
| spark-defaults | 更改 Spark 的 spark-defaults.conf 文件中的值。 | 
| spark-env | 更改 Spark 环境中的值。 | 
| spark-log4j | 更改 Spark 的 log4j.properties 文件中的值。 | 
| spark-metrics | 更改 Spark 的 metrics.properties 文件中的值。 | 
| sqoop-env | 更改 Sqoop 的环境中的值。 | 
| sqoop-oraoop-site | 更改 Sqoop OraOop 的 oraoop-site.xml 文件中的值。 | 
| sqoop-site | 更改 Sqoop 的 sqoop-site.xml 文件中的值。 | 
| tez-site | 更改 Tez 的 tez-site.xml 文件中的值。 | 
| yarn-env | 更改 YARN 环境中的值。 | 
| yarn-site | 更改 YARN 的 yarn-site.xml 文件中的值。 | 
| zeppelin-env | 更改 Zeppelin 环境中的值。 | 
| zookeeper-config | 更改 ZooKeeper的 zoo.cfg 文件中的值。 | 
| zookeeper-log4j | 更改 ZooKeeper的 log4j.properties 文件中的值。 | 

# Amazon EMR 发行版 4.9.5
<a name="emr-495-release"></a>

## 4.9.5 应用程序版本
<a name="emr-495-app-versions"></a>

此版本包括以下应用程序：[http://ganglia.info](http://ganglia.info)、[http://hbase.apache.org/](http://hbase.apache.org/)、[https://cwiki.apache.org/confluence/display/Hive/HCatalog](https://cwiki.apache.org/confluence/display/Hive/HCatalog)、[http://hadoop.apache.org/docs/current/](http://hadoop.apache.org/docs/current/)、[http://hive.apache.org/](http://hive.apache.org/)、[http://gethue.com/](http://gethue.com/)、[http://mahout.apache.org/](http://mahout.apache.org/)、[http://oozie.apache.org/](http://oozie.apache.org/)、[https://phoenix.apache.org/](https://phoenix.apache.org/)、[http://pig.apache.org/](http://pig.apache.org/)、[https://prestodb.io/](https://prestodb.io/)、[https://spark.apache.org/docs/latest/](https://spark.apache.org/docs/latest/)、[http://sqoop.apache.org/](http://sqoop.apache.org/)、[https://tez.apache.org/](https://tez.apache.org/)、[https://zeppelin.incubator.apache.org/](https://zeppelin.incubator.apache.org/) 和 [https://zookeeper.apache.org](https://zookeeper.apache.org)。

下表列出了此版本的 Amazon EMR 中提供的应用程序版本以及前三个 Amazon EMR 发行版中的应用程序版本（若适用）。

有关每个发行版的 Amazon EMR 的应用程序版本的全面历史记录，请参见以下主题：
+ [Amazon EMR 7.x 发行版中的应用程序版本](emr-release-app-versions-7.x.md)
+ [Amazon EMR 6.x 发行版中的应用程序版本](emr-release-app-versions-6.x.md)
+ [Amazon EMR 5.x 发行版中的应用程序版本](emr-release-app-versions-5.x.md)
+ [Amazon EMR 4.x 发行版中的应用程序版本](emr-release-app-versions-4.x.md)


**应用程序版本信息**  

|  | emr-4.9.5 | emr-4.9.4 | emr-4.9.3 | emr-4.9.2 | 
| --- | --- | --- | --- | --- | 
| AWS 适用于 Java 的 SDK | 1.10.75 | 1.10.75 | 1.10.75 | 1.10.75 | 
| Python | 未跟踪 | 未跟踪 | 未跟踪 | 未跟踪 | 
| Scala | 未跟踪 | 未跟踪 | 未跟踪 | 未跟踪 | 
| AmazonCloudWatchAgent |  -  |  -  |  -  |  -  | 
| Delta |  -  |  -  |  -  |  -  | 
| Flink |  -  |  -  |  -  |  -  | 
| Ganglia | 3.7.2 | 3.7.2 | 3.7.2 | 3.7.2 | 
| HBase | 1.2.2 | 1.2.2 | 1.2.2 | 1.2.2 | 
| HCatalog | 1.0.0-amzn-9 | 1.0.0-amzn-9 | 1.0.0-amzn-9 | 1.0.0-amzn-9 | 
| Hadoop | 2.7.3-amzn-2 | 2.7.3-amzn-2 | 2.7.3-amzn-2 | 2.7.3-amzn-2 | 
| Hive | 1.0.0-amzn-9 | 1.0.0-amzn-9 | 1.0.0-amzn-9 | 1.0.0-amzn-9 | 
| Hudi |  -  |  -  |  -  |  -  | 
| Hue | 3.7.1-amzn-7 | 3.7.1-amzn-7 | 3.7.1-amzn-7 | 3.7.1-amzn-7 | 
| Iceberg |  -  |  -  |  -  |  -  | 
| JupyterEnterpriseGateway |  -  |  -  |  -  |  -  | 
| JupyterHub |  -  |  -  |  -  |  -  | 
| Livy |  -  |  -  |  -  |  -  | 
| MXNet |  -  |  -  |  -  |  -  | 
| Mahout | 0.12.2 | 0.12.2 | 0.12.2 | 0.12.2 | 
| Oozie |  -  |  -  |  -  |  -  | 
| Oozie-Sandbox | 4.2.0 | 4.2.0 | 4.2.0 | 4.2.0 | 
| Phoenix | 4.7.0--1.2 HBase | 4.7.0--1.2 HBase | 4.7.0--1.2 HBase | 4.7.0--1.2 HBase | 
| Pig | 0.14.0-amzn-0 | 0.14.0-amzn-0 | 0.14.0-amzn-0 | 0.14.0-amzn-0 | 
| Presto |  -  |  -  |  -  |  -  | 
| Presto-Sandbox | 0.157.1 | 0.157.1 | 0.157.1 | 0.157.1 | 
| Spark | 1.6.3 | 1.6.3 | 1.6.3 | 1.6.3 | 
| Sqoop |  -  |  -  |  -  |  -  | 
| Sqoop-Sandbox | 1.4.6 | 1.4.6 | 1.4.6 | 1.4.6 | 
| TensorFlow |  -  |  -  |  -  |  -  | 
| Tez | 0.8.4 | 0.8.4 | 0.8.4 | 0.8.4 | 
| Trino (PrestoSQL) |  -  |  -  |  -  |  -  | 
| Zeppelin |  -  |  -  |  -  |  -  | 
| Zeppelin-Sandbox | 0.6.1 | 0.6.1 | 0.6.1 | 0.6.1 | 
| ZooKeeper |  -  |  -  |  -  |  -  | 
| ZooKeeper-Sandbox | 3.4.9 | 3.4.9 | 3.4.9 | 3.4.9 | 

## 4.9.5 发布说明
<a name="emr-495-relnotes"></a>

以下发布说明包括有关 Amazon EMR 发行版 4.9.5 的信息。更改与 4.9.4 有关。

首次发布日期：2018年 8 月 29 日

**更改、增强功能和解决的问题**
+ HBase
  + 此版本解决了潜在的安全漏洞。

## 4.9.5 组件版本
<a name="emr-495-components"></a>

下面列出了 Amazon EMR 随此发行版一起安装的组件。一些组件作为大数据应用程序包的一部分安装。其它组件是 Amazon EMR 独有的，并且已为系统流程和功能安装这些组件。它们通常以 `emr` 或 `aws` 开头。最新的 Amazon EMR 发行版中的大数据应用程序包通常是在社区中找到的最新版本。我们会尽快在 Amazon EMR 中提供社区发行版。

Amazon EMR 中的某些组件与社区版本不同。这些组件具有以下形式的 `CommunityVersion-amzn-EmrVersion` 的发行版标注。`EmrVersion` 从 0 开始。例如，假设已对名为 `myapp-component` 的版本 2.2 的开源社区组件进行三次修改，以包含在不同的 Amazon EMR 发行版中，则其发行版将为 `2.2-amzn-2`。


| 组件 | 版本 | 说明 | 
| --- | --- | --- | 
| emr-ddb | 4.3.0 | 适用于 Hadoop 生态系统应用程序的 Amazon DynamoDB 连接器。 | 
| emr-goodies | 2.2.0 | 适用于 Hadoop 生态系统的方便易用的库。 | 
| emr-kinesis | 3.3.0 | 适用于 Hadoop 生态系统应用程序的 Amazon Kinesis 连接器。 | 
| emr-s3-dist-cp | 2.4.0 | 针对 Amazon S3 优化的分布式复制应用程序。 | 
| emrfs | 2.17.0 | 适用于 Hadoop 生态系统应用程序的 Amazon S3 连接器。 | 
| ganglia-monitor | 3.7.2 | 适用于 Hadoop 生态系统应用程序的嵌入式 Ganglia 代理以及 Ganglia 监控代理。 | 
| ganglia-metadata-collector | 3.7.2 | 用于从 Ganglia 监控代理中聚合指标的 Ganglia 元数据收集器。 | 
| ganglia-web | 3.7.1 | 用于查看由 Ganglia 元数据收集器收集的指标的 Web 应用程序。 | 
| hadoop-client | 2.7.3-amzn-2 | Hadoop 命令行客户端，如“hdfs”、“hadoop”或“yarn”。 | 
| hadoop-hdfs-datanode | 2.7.3-amzn-2 | 用于存储数据块的 HDFS 节点级服务。 | 
| hadoop-hdfs-library | 2.7.3-amzn-2 | HDFS 命令行客户端和库 | 
| hadoop-hdfs-namenode | 2.7.3-amzn-2 | 用于跟踪文件名和数据块位置的 HDFS 服务。 | 
| hadoop-httpfs-server | 2.7.3-amzn-2 | 用于 HDFS 操作的 HTTP 终端节点。 | 
| hadoop-kms-server | 2.7.3-amzn-2 | 基于 Hadoop 的 API 的加密密钥管理服务器。 KeyProvider  | 
| hadoop-mapred | 2.7.3-amzn-2 | MapReduce 用于运行 MapReduce 应用程序的执行引擎库。 | 
| hadoop-yarn-nodemanager | 2.7.3-amzn-2 | 用于管理单个节点上的容器的 YARN 服务。 | 
| hadoop-yarn-resourcemanager | 2.7.3-amzn-2 | 用于分配和管理集群资源与分布式应用程序的 YARN 服务。 | 
| hadoop-yarn-timeline-server | 2.7.3-amzn-2 | 用于检索 YARN 应用程序的当前信息和历史信息的服务。 | 
| hbase-hmaster | 1.2.2 | 为负责协调区域和执行管理命令的 HBase 集群提供服务。 | 
| hbase-region-server | 1.2.2 | 为一个或多个 HBase 地区提供服务的服务。 | 
| hbase-client | 1.2.2 | HBase 命令行客户端。 | 
| hbase-rest-server | 1.2.2 | 为提供 RESTful HTTP 端点的服务 HBase。 | 
| hbase-thrift-server | 1.2.2 | 为其提供 Thrift 端点的 HBase服务。 | 
| hcatalog-client | 1.0.0-amzn-9 | 用于操作 hcatalog-server 的“hcat”命令行客户端。 | 
| hcatalog-server | 1.0.0-amzn-9 | 提供服务 HCatalog，为分布式应用程序提供表和存储管理层。 | 
| hcatalog-webhcat-server | 1.0.0-amzn-9 | 为其提供 REST 接口的 HTTP 端点 HCatalog。 | 
| hive-client | 1.0.0-amzn-9 | Hive 命令行客户端。 | 
| hive-metastore-server | 1.0.0-amzn-9 | 用于访问 Hive 元存储 (一个用于存储 Hadoop 操作中的 SQL 的元数据的语义存储库) 的服务。 | 
| hive-server | 1.0.0-amzn-9 | 用于将 Hive 查询作为 Web 请求接受的服务。 | 
| hue-server | 3.7.1-amzn-7 | 用于使用 Hadoop 生态系统应用程序分析数据的 Web 应用程序 | 
| mahout-client | 0.12.2 | 用于机器学习的库。 | 
| mysql-server | 5.5.54\$1 | MySQL 数据库服务器。 | 
| oozie-client | 4.2.0 | Oozie 命令行客户端。 | 
| oozie-server | 4.2.0 | 用于接受 Oozie 工作流请求的服务。 | 
| phoenix-library | 4.7.0--1.2 HBase | 服务器和客户端的 phoenix 库 | 
| phoenix-query-server | 4.7.0--1.2 HBase | 向 Avatica API 提供 JDBC 访问权限以及协议缓冲区和 JSON 格式访问权限的轻量级服务器  | 
| presto-coordinator | 0.157.1 | 用于在 presto-worker 之中接受查询并管理查询的服务。 | 
| presto-worker | 0.157.1 | 用于执行查询的各个部分的服务。 | 
| pig-client | 0.14.0-amzn-0 | Pig 命令行客户端。 | 
| spark-client | 1.6.3 | Spark 命令行客户端。 | 
| spark-history-server | 1.6.3 | 用于查看完整的 Spark 应用程序的生命周期的已记录事件的 Web UI。 | 
| spark-on-yarn | 1.6.3 | 适用于 YARN 的内存中执行引擎。 | 
| spark-yarn-slave | 1.6.3 | YARN 从属项所需的 Apache Spark 库。 | 
| sqoop-client | 1.4.6 | Apache Sqoop 命令行客户端。 | 
| tez-on-yarn | 0.8.4 | tez YARN 应用程序和库。 | 
| webserver | 2.4.25\$1 | Apache HTTP 服务器。 | 
| zeppelin-server | 0.6.1 | 支持交互式数据分析的基于 Web 的 Notebook。 | 
| zookeeper-server | 3.4.9 | 用于维护配置信息、命名、提供分布式同步以及提供组服务的集中式服务。 | 
| zookeeper-client | 3.4.9 | ZooKeeper 命令行客户端。 | 

## 4.9.5 配置分类
<a name="emr-495-class"></a>

配置分类允许您自定义应用程序。这些通常与应用程序的配置 XML 文件（例如 `hive-site.xml`）相对应。有关更多信息，请参阅[配置应用程序](emr-configure-apps.md)。


**emr-4.9.5 分类**  

| 分类 | 说明 | 
| --- | --- | 
| capacity-scheduler | 更改 Hadoop 的 capacity-scheduler.xml 文件中的值。 | 
| core-site | 更改 Hadoop 的 core-site.xml 文件中的值。 | 
| emrfs-site | 更改 EMRFS 设置。 | 
| hadoop-env | 更改适用于所有 Hadoop 组件的 Hadoop 环境中的值。 | 
| hadoop-log4j | 更改 Hadoop 的 log4j.properties 文件中的值。 | 
| hadoop-ssl-server | 更改 hadoop ssl 服务器配置 | 
| hadoop-ssl-client | 更改 hadoop ssl 客户端配置 | 
| hbase-env | 更改环境 HBase中的值。 | 
| hbase-log4j | 更改 hbase- HBase log4j.properties 文件中的值。 | 
| hbase-metrics | 更改 hadoop-metrics2-hb HBase aase.properties 文件中的值。 | 
| hbase-policy | 更改 hbase-policy.xml 文件 HBase中的值。 | 
| hbase-site | 更改 HBase的 hbase-site.xml 文件中的值。 | 
| hdfs-encryption-zones | 配置 HDFS 加密区域。 | 
| hdfs-site | 更改 HDFS 的 hdfs-site.xml 中的值。 | 
| hcatalog-env | 更改环境 HCatalog中的值。 | 
| hcatalog-server-jndi | 更改 HCatalog的 jndi.properties 中的值。 | 
| hcatalog-server-proto-hive-site | 更改 proto-hive-site .x HCatalog ml 中的值。 | 
| hcatalog-webhcat-env | 更改 HCatalog Web 环境HCat中的值。 | 
| hcatalog-webhcat-log4j | 更改 HCatalog Web HCat 的 log4j.properties 中的值。 | 
| hcatalog-webhcat-site | 更改 HCatalog Web HCat 的 webhcat-site.xml 文件中的值。 | 
| hive-env | 更改 Hive 环境中的值。 | 
| hive-exec-log4j | 更改 Hive 的 hive-exec-log 4j.properties 文件中的值。 | 
| hive-log4j | 更改 Hive 的 hive-log4j.properties 文件中的值。 | 
| hive-site | 更改 Hive 的 hive-site.xml 文件中的值 | 
| hiveserver2-site | 更改 Hive Server2 的 hiveserver2-site.xml 文件中的值 | 
| hue-ini | 更改 Hue 的 ini 文件中的值 | 
| httpfs-env | 更改 HTTPFS 环境中的值。 | 
| httpfs-site | 更改 Hadoop 的 httpfs-site.xml 文件中的值。 | 
| hadoop-kms-acls | 更改 Hadoop 的 kms-acls.xml 文件中的值。 | 
| hadoop-kms-env | 更改 Hadoop KMS 环境中的值。 | 
| hadoop-kms-log4j | 更改 Hadoop 的 kms-log4j.properties 文件中的值。 | 
| hadoop-kms-site | 更改 Hadoop 的 kms-site.xml 文件中的值。 | 
| mapred-env | 更改 MapReduce 应用程序环境中的值。 | 
| mapred-site | 更改 MapReduce 应用程序的 mapred-site.xml 文件中的值。 | 
| oozie-env | 更改 Oozie 的环境中的值。 | 
| oozie-log4j | 更改 Oozie 的 oozie-log4j.properties 文件中的值。 | 
| oozie-site | 更改 Oozie 的 oozie-site.xml 文件中的值。 | 
| phoenix-hbase-metrics | 更改 Phoenix 的 hadoop-metrics2-hbase.properties 文件中的值。 | 
| phoenix-hbase-site | 更改 Phoenix 的 hbase-site.xml 文件中的值。 | 
| phoenix-log4j | 更改 Phoenix 的 log4j.properties 文件中的值。 | 
| phoenix-metrics | 更改 Phoenix 的 hadoop-metrics2-phoenix.properties 文件中的值。 | 
| pig-properties | 更改 Pig 的 pig.properties 文件中的值。 | 
| pig-log4j | 更改 Pig 的 log4j.properties 文件中的值。 | 
| presto-log | 更改 Presto 的 log.properties 文件中的值。 | 
| presto-config | 更改 Presto 的 config.properties 文件中的值。 | 
| presto-connector-blackhole | 更改 Presto 的 blackhole.properties 文件中的值。 | 
| presto-connector-cassandra | 更改 Presto 的 cassandra.properties 文件中的值。 | 
| presto-connector-hive | 更改 Presto 的 hive.properties 文件中的值。 | 
| presto-connector-jmx | 更改 Presto 的 jmx.properties 文件中的值。 | 
| presto-connector-kafka | 更改 Presto 的 kafka.properties 文件中的值。 | 
| presto-connector-localfile | 更改 Presto 的 localfile.properties 文件中的值。 | 
| presto-connector-mongodb | 更改 Presto 的 mongodb.properties 文件中的值。 | 
| presto-connector-mysql | 更改 Presto 的 mysql.properties 文件中的值。 | 
| presto-connector-postgresql | 更改 Presto 的 postgresql.properties 文件中的值。 | 
| presto-connector-raptor | 更改 Presto 的 raptor.properties 文件中的值。 | 
| presto-connector-redis | 更改 Presto 的 redis.properties 文件中的值。 | 
| presto-connector-tpch | 更改 Presto 的 tpch.properties 文件中的值。 | 
| spark | 适用于 Apache Spark 的 Amazon EMR 辅助设置。 | 
| spark-defaults | 更改 Spark 的 spark-defaults.conf 文件中的值。 | 
| spark-env | 更改 Spark 环境中的值。 | 
| spark-log4j | 更改 Spark 的 log4j.properties 文件中的值。 | 
| spark-metrics | 更改 Spark 的 metrics.properties 文件中的值。 | 
| sqoop-env | 更改 Sqoop 的环境中的值。 | 
| sqoop-oraoop-site | 更改 Sqoop OraOop 的 oraoop-site.xml 文件中的值。 | 
| sqoop-site | 更改 Sqoop 的 sqoop-site.xml 文件中的值。 | 
| tez-site | 更改 Tez 的 tez-site.xml 文件中的值。 | 
| yarn-env | 更改 YARN 环境中的值。 | 
| yarn-site | 更改 YARN 的 yarn-site.xml 文件中的值。 | 
| zeppelin-env | 更改 Zeppelin 环境中的值。 | 
| zookeeper-config | 更改 ZooKeeper的 zoo.cfg 文件中的值。 | 
| zookeeper-log4j | 更改 ZooKeeper的 log4j.properties 文件中的值。 | 

# Amazon EMR 发行版 4.9.4
<a name="emr-494-release"></a>

## 4.9.4 应用程序版本
<a name="emr-494-app-versions"></a>

此版本包括以下应用程序：[http://ganglia.info](http://ganglia.info)、[http://hbase.apache.org/](http://hbase.apache.org/)、[https://cwiki.apache.org/confluence/display/Hive/HCatalog](https://cwiki.apache.org/confluence/display/Hive/HCatalog)、[http://hadoop.apache.org/docs/current/](http://hadoop.apache.org/docs/current/)、[http://hive.apache.org/](http://hive.apache.org/)、[http://gethue.com/](http://gethue.com/)、[http://mahout.apache.org/](http://mahout.apache.org/)、[http://oozie.apache.org/](http://oozie.apache.org/)、[https://phoenix.apache.org/](https://phoenix.apache.org/)、[http://pig.apache.org/](http://pig.apache.org/)、[https://prestodb.io/](https://prestodb.io/)、[https://spark.apache.org/docs/latest/](https://spark.apache.org/docs/latest/)、[http://sqoop.apache.org/](http://sqoop.apache.org/)、[https://tez.apache.org/](https://tez.apache.org/)、[https://zeppelin.incubator.apache.org/](https://zeppelin.incubator.apache.org/) 和 [https://zookeeper.apache.org](https://zookeeper.apache.org)。

下表列出了此版本的 Amazon EMR 中提供的应用程序版本以及前三个 Amazon EMR 发行版中的应用程序版本（若适用）。

有关每个发行版的 Amazon EMR 的应用程序版本的全面历史记录，请参见以下主题：
+ [Amazon EMR 7.x 发行版中的应用程序版本](emr-release-app-versions-7.x.md)
+ [Amazon EMR 6.x 发行版中的应用程序版本](emr-release-app-versions-6.x.md)
+ [Amazon EMR 5.x 发行版中的应用程序版本](emr-release-app-versions-5.x.md)
+ [Amazon EMR 4.x 发行版中的应用程序版本](emr-release-app-versions-4.x.md)


**应用程序版本信息**  

|  | emr-4.9.4 | emr-4.9.3 | emr-4.9.2 | emr-4.9.1 | 
| --- | --- | --- | --- | --- | 
| AWS 适用于 Java 的 SDK | 1.10.75 | 1.10.75 | 1.10.75 | 1.10.75 | 
| Python | 未跟踪 | 未跟踪 | 未跟踪 | 未跟踪 | 
| Scala | 未跟踪 | 未跟踪 | 未跟踪 | 未跟踪 | 
| AmazonCloudWatchAgent |  -  |  -  |  -  |  -  | 
| Delta |  -  |  -  |  -  |  -  | 
| Flink |  -  |  -  |  -  |  -  | 
| Ganglia | 3.7.2 | 3.7.2 | 3.7.2 | 3.7.2 | 
| HBase | 1.2.2 | 1.2.2 | 1.2.2 | 1.2.2 | 
| HCatalog | 1.0.0-amzn-9 | 1.0.0-amzn-9 | 1.0.0-amzn-9 | 1.0.0-amzn-9 | 
| Hadoop | 2.7.3-amzn-2 | 2.7.3-amzn-2 | 2.7.3-amzn-2 | 2.7.3-amzn-2 | 
| Hive | 1.0.0-amzn-9 | 1.0.0-amzn-9 | 1.0.0-amzn-9 | 1.0.0-amzn-9 | 
| Hudi |  -  |  -  |  -  |  -  | 
| Hue | 3.7.1-amzn-7 | 3.7.1-amzn-7 | 3.7.1-amzn-7 | 3.7.1-amzn-7 | 
| Iceberg |  -  |  -  |  -  |  -  | 
| JupyterEnterpriseGateway |  -  |  -  |  -  |  -  | 
| JupyterHub |  -  |  -  |  -  |  -  | 
| Livy |  -  |  -  |  -  |  -  | 
| MXNet |  -  |  -  |  -  |  -  | 
| Mahout | 0.12.2 | 0.12.2 | 0.12.2 | 0.12.2 | 
| Oozie |  -  |  -  |  -  |  -  | 
| Oozie-Sandbox | 4.2.0 | 4.2.0 | 4.2.0 | 4.2.0 | 
| Phoenix | 4.7.0--1.2 HBase | 4.7.0--1.2 HBase | 4.7.0--1.2 HBase | 4.7.0--1.2 HBase | 
| Pig | 0.14.0-amzn-0 | 0.14.0-amzn-0 | 0.14.0-amzn-0 | 0.14.0-amzn-0 | 
| Presto |  -  |  -  |  -  |  -  | 
| Presto-Sandbox | 0.157.1 | 0.157.1 | 0.157.1 | 0.157.1 | 
| Spark | 1.6.3 | 1.6.3 | 1.6.3 | 1.6.3 | 
| Sqoop |  -  |  -  |  -  |  -  | 
| Sqoop-Sandbox | 1.4.6 | 1.4.6 | 1.4.6 | 1.4.6 | 
| TensorFlow |  -  |  -  |  -  |  -  | 
| Tez | 0.8.4 | 0.8.4 | 0.8.4 | 0.8.4 | 
| Trino (PrestoSQL) |  -  |  -  |  -  |  -  | 
| Zeppelin |  -  |  -  |  -  |  -  | 
| Zeppelin-Sandbox | 0.6.1 | 0.6.1 | 0.6.1 | 0.6.1 | 
| ZooKeeper |  -  |  -  |  -  |  -  | 
| ZooKeeper-Sandbox | 3.4.9 | 3.4.9 | 3.4.9 | 3.4.9 | 

## 4.9.4 发布说明
<a name="emr-494-relnotes"></a>

以下发布说明包括有关 Amazon EMR 发行版 4.9.4 的信息。更改与 4.9.3 有关。

首次发布日期：2018 年 3 月 29 日

**更改、增强功能和解决的问题**
+ 更新了 Amazon EMR 的默认 Amazon Linux AMI 的 Amazon Linux 内核，解决了潜在漏洞。

## 4.9.4 组件版本
<a name="emr-494-components"></a>

下面列出了 Amazon EMR 随此发行版一起安装的组件。一些组件作为大数据应用程序包的一部分安装。其它组件是 Amazon EMR 独有的，并且已为系统流程和功能安装这些组件。它们通常以 `emr` 或 `aws` 开头。最新的 Amazon EMR 发行版中的大数据应用程序包通常是在社区中找到的最新版本。我们会尽快在 Amazon EMR 中提供社区发行版。

Amazon EMR 中的某些组件与社区版本不同。这些组件具有以下形式的 `CommunityVersion-amzn-EmrVersion` 的发行版标注。`EmrVersion` 从 0 开始。例如，假设已对名为 `myapp-component` 的版本 2.2 的开源社区组件进行三次修改，以包含在不同的 Amazon EMR 发行版中，则其发行版将为 `2.2-amzn-2`。


| 组件 | 版本 | 说明 | 
| --- | --- | --- | 
| emr-ddb | 4.3.0 | 适用于 Hadoop 生态系统应用程序的 Amazon DynamoDB 连接器。 | 
| emr-goodies | 2.2.0 | 适用于 Hadoop 生态系统的方便易用的库。 | 
| emr-kinesis | 3.3.0 | 适用于 Hadoop 生态系统应用程序的 Amazon Kinesis 连接器。 | 
| emr-s3-dist-cp | 2.4.0 | 针对 Amazon S3 优化的分布式复制应用程序。 | 
| emrfs | 2.17.0 | 适用于 Hadoop 生态系统应用程序的 Amazon S3 连接器。 | 
| ganglia-monitor | 3.7.2 | 适用于 Hadoop 生态系统应用程序的嵌入式 Ganglia 代理以及 Ganglia 监控代理。 | 
| ganglia-metadata-collector | 3.7.2 | 用于从 Ganglia 监控代理中聚合指标的 Ganglia 元数据收集器。 | 
| ganglia-web | 3.7.1 | 用于查看由 Ganglia 元数据收集器收集的指标的 Web 应用程序。 | 
| hadoop-client | 2.7.3-amzn-2 | Hadoop 命令行客户端，如“hdfs”、“hadoop”或“yarn”。 | 
| hadoop-hdfs-datanode | 2.7.3-amzn-2 | 用于存储数据块的 HDFS 节点级服务。 | 
| hadoop-hdfs-library | 2.7.3-amzn-2 | HDFS 命令行客户端和库 | 
| hadoop-hdfs-namenode | 2.7.3-amzn-2 | 用于跟踪文件名和数据块位置的 HDFS 服务。 | 
| hadoop-httpfs-server | 2.7.3-amzn-2 | 用于 HDFS 操作的 HTTP 终端节点。 | 
| hadoop-kms-server | 2.7.3-amzn-2 | 基于 Hadoop 的 API 的加密密钥管理服务器。 KeyProvider  | 
| hadoop-mapred | 2.7.3-amzn-2 | MapReduce 用于运行 MapReduce 应用程序的执行引擎库。 | 
| hadoop-yarn-nodemanager | 2.7.3-amzn-2 | 用于管理单个节点上的容器的 YARN 服务。 | 
| hadoop-yarn-resourcemanager | 2.7.3-amzn-2 | 用于分配和管理集群资源与分布式应用程序的 YARN 服务。 | 
| hadoop-yarn-timeline-server | 2.7.3-amzn-2 | 用于检索 YARN 应用程序的当前信息和历史信息的服务。 | 
| hbase-hmaster | 1.2.2 | 为负责协调区域和执行管理命令的 HBase 集群提供服务。 | 
| hbase-region-server | 1.2.2 | 为一个或多个 HBase 地区提供服务的服务。 | 
| hbase-client | 1.2.2 | HBase 命令行客户端。 | 
| hbase-rest-server | 1.2.2 | 为提供 RESTful HTTP 端点的服务 HBase。 | 
| hbase-thrift-server | 1.2.2 | 为其提供 Thrift 端点的 HBase服务。 | 
| hcatalog-client | 1.0.0-amzn-9 | 用于操作 hcatalog-server 的“hcat”命令行客户端。 | 
| hcatalog-server | 1.0.0-amzn-9 | 提供服务 HCatalog，为分布式应用程序提供表和存储管理层。 | 
| hcatalog-webhcat-server | 1.0.0-amzn-9 | 为其提供 REST 接口的 HTTP 端点 HCatalog。 | 
| hive-client | 1.0.0-amzn-9 | Hive 命令行客户端。 | 
| hive-metastore-server | 1.0.0-amzn-9 | 用于访问 Hive 元存储 (一个用于存储 Hadoop 操作中的 SQL 的元数据的语义存储库) 的服务。 | 
| hive-server | 1.0.0-amzn-9 | 用于将 Hive 查询作为 Web 请求接受的服务。 | 
| hue-server | 3.7.1-amzn-7 | 用于使用 Hadoop 生态系统应用程序分析数据的 Web 应用程序 | 
| mahout-client | 0.12.2 | 用于机器学习的库。 | 
| mysql-server | 5.5.54\$1 | MySQL 数据库服务器。 | 
| oozie-client | 4.2.0 | Oozie 命令行客户端。 | 
| oozie-server | 4.2.0 | 用于接受 Oozie 工作流请求的服务。 | 
| phoenix-library | 4.7.0--1.2 HBase | 服务器和客户端的 phoenix 库 | 
| phoenix-query-server | 4.7.0--1.2 HBase | 向 Avatica API 提供 JDBC 访问权限以及协议缓冲区和 JSON 格式访问权限的轻量级服务器  | 
| presto-coordinator | 0.157.1 | 用于在 presto-worker 之中接受查询并管理查询的服务。 | 
| presto-worker | 0.157.1 | 用于执行查询的各个部分的服务。 | 
| pig-client | 0.14.0-amzn-0 | Pig 命令行客户端。 | 
| spark-client | 1.6.3 | Spark 命令行客户端。 | 
| spark-history-server | 1.6.3 | 用于查看完整的 Spark 应用程序的生命周期的已记录事件的 Web UI。 | 
| spark-on-yarn | 1.6.3 | 适用于 YARN 的内存中执行引擎。 | 
| spark-yarn-slave | 1.6.3 | YARN 从属项所需的 Apache Spark 库。 | 
| sqoop-client | 1.4.6 | Apache Sqoop 命令行客户端。 | 
| tez-on-yarn | 0.8.4 | tez YARN 应用程序和库。 | 
| webserver | 2.4.25\$1 | Apache HTTP 服务器。 | 
| zeppelin-server | 0.6.1 | 支持交互式数据分析的基于 Web 的 Notebook。 | 
| zookeeper-server | 3.4.9 | 用于维护配置信息、命名、提供分布式同步以及提供组服务的集中式服务。 | 
| zookeeper-client | 3.4.9 | ZooKeeper 命令行客户端。 | 

## 4.9.4 配置分类
<a name="emr-494-class"></a>

配置分类允许您自定义应用程序。这些通常与应用程序的配置 XML 文件（例如 `hive-site.xml`）相对应。有关更多信息，请参阅[配置应用程序](emr-configure-apps.md)。


**emr-4.9.4 分类**  

| 分类 | 说明 | 
| --- | --- | 
| capacity-scheduler | 更改 Hadoop 的 capacity-scheduler.xml 文件中的值。 | 
| core-site | 更改 Hadoop 的 core-site.xml 文件中的值。 | 
| emrfs-site | 更改 EMRFS 设置。 | 
| hadoop-env | 更改适用于所有 Hadoop 组件的 Hadoop 环境中的值。 | 
| hadoop-log4j | 更改 Hadoop 的 log4j.properties 文件中的值。 | 
| hadoop-ssl-server | 更改 hadoop ssl 服务器配置 | 
| hadoop-ssl-client | 更改 hadoop ssl 客户端配置 | 
| hbase-env | 更改环境 HBase中的值。 | 
| hbase-log4j | 更改 hbase- HBase log4j.properties 文件中的值。 | 
| hbase-metrics | 更改 hadoop-metrics2-hb HBase aase.properties 文件中的值。 | 
| hbase-policy | 更改 hbase-policy.xml 文件 HBase中的值。 | 
| hbase-site | 更改 HBase的 hbase-site.xml 文件中的值。 | 
| hdfs-encryption-zones | 配置 HDFS 加密区域。 | 
| hdfs-site | 更改 HDFS 的 hdfs-site.xml 中的值。 | 
| hcatalog-env | 更改环境 HCatalog中的值。 | 
| hcatalog-server-jndi | 更改 HCatalog的 jndi.properties 中的值。 | 
| hcatalog-server-proto-hive-site | 更改 proto-hive-site .x HCatalog ml 中的值。 | 
| hcatalog-webhcat-env | 更改 HCatalog Web 环境HCat中的值。 | 
| hcatalog-webhcat-log4j | 更改 HCatalog Web HCat 的 log4j.properties 中的值。 | 
| hcatalog-webhcat-site | 更改 HCatalog Web HCat 的 webhcat-site.xml 文件中的值。 | 
| hive-env | 更改 Hive 环境中的值。 | 
| hive-exec-log4j | 更改 Hive 的 hive-exec-log 4j.properties 文件中的值。 | 
| hive-log4j | 更改 Hive 的 hive-log4j.properties 文件中的值。 | 
| hive-site | 更改 Hive 的 hive-site.xml 文件中的值 | 
| hiveserver2-site | 更改 Hive Server2 的 hiveserver2-site.xml 文件中的值 | 
| hue-ini | 更改 Hue 的 ini 文件中的值 | 
| httpfs-env | 更改 HTTPFS 环境中的值。 | 
| httpfs-site | 更改 Hadoop 的 httpfs-site.xml 文件中的值。 | 
| hadoop-kms-acls | 更改 Hadoop 的 kms-acls.xml 文件中的值。 | 
| hadoop-kms-env | 更改 Hadoop KMS 环境中的值。 | 
| hadoop-kms-log4j | 更改 Hadoop 的 kms-log4j.properties 文件中的值。 | 
| hadoop-kms-site | 更改 Hadoop 的 kms-site.xml 文件中的值。 | 
| mapred-env | 更改 MapReduce 应用程序环境中的值。 | 
| mapred-site | 更改 MapReduce 应用程序的 mapred-site.xml 文件中的值。 | 
| oozie-env | 更改 Oozie 的环境中的值。 | 
| oozie-log4j | 更改 Oozie 的 oozie-log4j.properties 文件中的值。 | 
| oozie-site | 更改 Oozie 的 oozie-site.xml 文件中的值。 | 
| phoenix-hbase-metrics | 更改 Phoenix 的 hadoop-metrics2-hbase.properties 文件中的值。 | 
| phoenix-hbase-site | 更改 Phoenix 的 hbase-site.xml 文件中的值。 | 
| phoenix-log4j | 更改 Phoenix 的 log4j.properties 文件中的值。 | 
| phoenix-metrics | 更改 Phoenix 的 hadoop-metrics2-phoenix.properties 文件中的值。 | 
| pig-properties | 更改 Pig 的 pig.properties 文件中的值。 | 
| pig-log4j | 更改 Pig 的 log4j.properties 文件中的值。 | 
| presto-log | 更改 Presto 的 log.properties 文件中的值。 | 
| presto-config | 更改 Presto 的 config.properties 文件中的值。 | 
| presto-connector-blackhole | 更改 Presto 的 blackhole.properties 文件中的值。 | 
| presto-connector-cassandra | 更改 Presto 的 cassandra.properties 文件中的值。 | 
| presto-connector-hive | 更改 Presto 的 hive.properties 文件中的值。 | 
| presto-connector-jmx | 更改 Presto 的 jmx.properties 文件中的值。 | 
| presto-connector-kafka | 更改 Presto 的 kafka.properties 文件中的值。 | 
| presto-connector-localfile | 更改 Presto 的 localfile.properties 文件中的值。 | 
| presto-connector-mongodb | 更改 Presto 的 mongodb.properties 文件中的值。 | 
| presto-connector-mysql | 更改 Presto 的 mysql.properties 文件中的值。 | 
| presto-connector-postgresql | 更改 Presto 的 postgresql.properties 文件中的值。 | 
| presto-connector-raptor | 更改 Presto 的 raptor.properties 文件中的值。 | 
| presto-connector-redis | 更改 Presto 的 redis.properties 文件中的值。 | 
| presto-connector-tpch | 更改 Presto 的 tpch.properties 文件中的值。 | 
| spark | 适用于 Apache Spark 的 Amazon EMR 辅助设置。 | 
| spark-defaults | 更改 Spark 的 spark-defaults.conf 文件中的值。 | 
| spark-env | 更改 Spark 环境中的值。 | 
| spark-log4j | 更改 Spark 的 log4j.properties 文件中的值。 | 
| spark-metrics | 更改 Spark 的 metrics.properties 文件中的值。 | 
| sqoop-env | 更改 Sqoop 的环境中的值。 | 
| sqoop-oraoop-site | 更改 Sqoop OraOop 的 oraoop-site.xml 文件中的值。 | 
| sqoop-site | 更改 Sqoop 的 sqoop-site.xml 文件中的值。 | 
| tez-site | 更改 Tez 的 tez-site.xml 文件中的值。 | 
| yarn-env | 更改 YARN 环境中的值。 | 
| yarn-site | 更改 YARN 的 yarn-site.xml 文件中的值。 | 
| zeppelin-env | 更改 Zeppelin 环境中的值。 | 
| zookeeper-config | 更改 ZooKeeper的 zoo.cfg 文件中的值。 | 
| zookeeper-log4j | 更改 ZooKeeper的 log4j.properties 文件中的值。 | 

# Amazon EMR 发行版 4.9.3
<a name="emr-493-release"></a>

## 4.9.3 应用程序版本
<a name="emr-493-app-versions"></a>

此版本包括以下应用程序：[http://ganglia.info](http://ganglia.info)、[http://hbase.apache.org/](http://hbase.apache.org/)、[https://cwiki.apache.org/confluence/display/Hive/HCatalog](https://cwiki.apache.org/confluence/display/Hive/HCatalog)、[http://hadoop.apache.org/docs/current/](http://hadoop.apache.org/docs/current/)、[http://hive.apache.org/](http://hive.apache.org/)、[http://gethue.com/](http://gethue.com/)、[http://mahout.apache.org/](http://mahout.apache.org/)、[http://oozie.apache.org/](http://oozie.apache.org/)、[https://phoenix.apache.org/](https://phoenix.apache.org/)、[http://pig.apache.org/](http://pig.apache.org/)、[https://prestodb.io/](https://prestodb.io/)、[https://spark.apache.org/docs/latest/](https://spark.apache.org/docs/latest/)、[http://sqoop.apache.org/](http://sqoop.apache.org/)、[https://tez.apache.org/](https://tez.apache.org/)、[https://zeppelin.incubator.apache.org/](https://zeppelin.incubator.apache.org/) 和 [https://zookeeper.apache.org](https://zookeeper.apache.org)。

下表列出了此版本的 Amazon EMR 中提供的应用程序版本以及前三个 Amazon EMR 发行版中的应用程序版本（若适用）。

有关每个发行版的 Amazon EMR 的应用程序版本的全面历史记录，请参见以下主题：
+ [Amazon EMR 7.x 发行版中的应用程序版本](emr-release-app-versions-7.x.md)
+ [Amazon EMR 6.x 发行版中的应用程序版本](emr-release-app-versions-6.x.md)
+ [Amazon EMR 5.x 发行版中的应用程序版本](emr-release-app-versions-5.x.md)
+ [Amazon EMR 4.x 发行版中的应用程序版本](emr-release-app-versions-4.x.md)


**应用程序版本信息**  

|  | emr-4.9.3 | emr-4.9.2 | emr-4.9.1 | emr-4.8.5 | 
| --- | --- | --- | --- | --- | 
| AWS 适用于 Java 的 SDK | 1.10.75 | 1.10.75 | 1.10.75 | 1.10.75 | 
| Python | 未跟踪 | 未跟踪 | 未跟踪 | 未跟踪 | 
| Scala | 未跟踪 | 未跟踪 | 未跟踪 | 未跟踪 | 
| AmazonCloudWatchAgent |  -  |  -  |  -  |  -  | 
| Delta |  -  |  -  |  -  |  -  | 
| Flink |  -  |  -  |  -  |  -  | 
| Ganglia | 3.7.2 | 3.7.2 | 3.7.2 | 3.7.2 | 
| HBase | 1.2.2 | 1.2.2 | 1.2.2 | 1.2.2 | 
| HCatalog | 1.0.0-amzn-9 | 1.0.0-amzn-9 | 1.0.0-amzn-9 | 1.0.0-amzn-8 | 
| Hadoop | 2.7.3-amzn-2 | 2.7.3-amzn-2 | 2.7.3-amzn-2 | 2.7.3-amzn-1 | 
| Hive | 1.0.0-amzn-9 | 1.0.0-amzn-9 | 1.0.0-amzn-9 | 1.0.0-amzn-8 | 
| Hudi |  -  |  -  |  -  |  -  | 
| Hue | 3.7.1-amzn-7 | 3.7.1-amzn-7 | 3.7.1-amzn-7 | 3.7.1-amzn-7 | 
| Iceberg |  -  |  -  |  -  |  -  | 
| JupyterEnterpriseGateway |  -  |  -  |  -  |  -  | 
| JupyterHub |  -  |  -  |  -  |  -  | 
| Livy |  -  |  -  |  -  |  -  | 
| MXNet |  -  |  -  |  -  |  -  | 
| Mahout | 0.12.2 | 0.12.2 | 0.12.2 | 0.12.2 | 
| Oozie |  -  |  -  |  -  |  -  | 
| Oozie-Sandbox | 4.2.0 | 4.2.0 | 4.2.0 | 4.2.0 | 
| Phoenix | 4.7.0--1.2 HBase | 4.7.0--1.2 HBase | 4.7.0--1.2 HBase | 4.7.0--1.2 HBase | 
| Pig | 0.14.0-amzn-0 | 0.14.0-amzn-0 | 0.14.0-amzn-0 | 0.14.0-amzn-0 | 
| Presto |  -  |  -  |  -  |  -  | 
| Presto-Sandbox | 0.157.1 | 0.157.1 | 0.157.1 | 0.157.1 | 
| Spark | 1.6.3 | 1.6.3 | 1.6.3 | 1.6.3 | 
| Sqoop |  -  |  -  |  -  |  -  | 
| Sqoop-Sandbox | 1.4.6 | 1.4.6 | 1.4.6 | 1.4.6 | 
| TensorFlow |  -  |  -  |  -  |  -  | 
| Tez | 0.8.4 | 0.8.4 | 0.8.4 | 0.8.4 | 
| Trino (PrestoSQL) |  -  |  -  |  -  |  -  | 
| Zeppelin |  -  |  -  |  -  |  -  | 
| Zeppelin-Sandbox | 0.6.1 | 0.6.1 | 0.6.1 | 0.6.1 | 
| ZooKeeper |  -  |  -  |  -  |  -  | 
| ZooKeeper-Sandbox | 3.4.9 | 3.4.9 | 3.4.9 | 3.4.9 | 

## 4.9.3 发布说明
<a name="emr-493-relnotes"></a>

以下发布说明包括有关 Amazon EMR 发行版 4.9.3 的信息。更改与 Amazon EMR 4.9.2 发行版有关。

首次发布日期：2018 年 1 月 22 日

**更改、增强功能和解决的问题**
+ 更新了 Amazon EMR 的默认 Amazon Linux AMI 的 Amazon Linux 内核，解决了与推测执行相关的漏洞（CVE-2017-5715、CVE-2017-5753 和 CVE-2017-5754）。有关更多信息，请参阅 [https://aws.amazon.com/security/security-bulletins/AWS-2018-013/](https://aws.amazon.com/security/security-bulletins/AWS-2018-013/)。

## 4.9.3 组件版本
<a name="emr-493-components"></a>

下面列出了 Amazon EMR 随此发行版一起安装的组件。一些组件作为大数据应用程序包的一部分安装。其它组件是 Amazon EMR 独有的，并且已为系统流程和功能安装这些组件。它们通常以 `emr` 或 `aws` 开头。最新的 Amazon EMR 发行版中的大数据应用程序包通常是在社区中找到的最新版本。我们会尽快在 Amazon EMR 中提供社区发行版。

Amazon EMR 中的某些组件与社区版本不同。这些组件具有以下形式的 `CommunityVersion-amzn-EmrVersion` 的发行版标注。`EmrVersion` 从 0 开始。例如，假设已对名为 `myapp-component` 的版本 2.2 的开源社区组件进行三次修改，以包含在不同的 Amazon EMR 发行版中，则其发行版将为 `2.2-amzn-2`。


| 组件 | 版本 | 说明 | 
| --- | --- | --- | 
| emr-ddb | 4.3.0 | 适用于 Hadoop 生态系统应用程序的 Amazon DynamoDB 连接器。 | 
| emr-goodies | 2.2.0 | 适用于 Hadoop 生态系统的方便易用的库。 | 
| emr-kinesis | 3.3.0 | 适用于 Hadoop 生态系统应用程序的 Amazon Kinesis 连接器。 | 
| emr-s3-dist-cp | 2.4.0 | 针对 Amazon S3 优化的分布式复制应用程序。 | 
| emrfs | 2.17.0 | 适用于 Hadoop 生态系统应用程序的 Amazon S3 连接器。 | 
| ganglia-monitor | 3.7.2 | 适用于 Hadoop 生态系统应用程序的嵌入式 Ganglia 代理以及 Ganglia 监控代理。 | 
| ganglia-metadata-collector | 3.7.2 | 用于从 Ganglia 监控代理中聚合指标的 Ganglia 元数据收集器。 | 
| ganglia-web | 3.7.1 | 用于查看由 Ganglia 元数据收集器收集的指标的 Web 应用程序。 | 
| hadoop-client | 2.7.3-amzn-2 | Hadoop 命令行客户端，如“hdfs”、“hadoop”或“yarn”。 | 
| hadoop-hdfs-datanode | 2.7.3-amzn-2 | 用于存储数据块的 HDFS 节点级服务。 | 
| hadoop-hdfs-library | 2.7.3-amzn-2 | HDFS 命令行客户端和库 | 
| hadoop-hdfs-namenode | 2.7.3-amzn-2 | 用于跟踪文件名和数据块位置的 HDFS 服务。 | 
| hadoop-httpfs-server | 2.7.3-amzn-2 | 用于 HDFS 操作的 HTTP 终端节点。 | 
| hadoop-kms-server | 2.7.3-amzn-2 | 基于 Hadoop 的 API 的加密密钥管理服务器。 KeyProvider  | 
| hadoop-mapred | 2.7.3-amzn-2 | MapReduce 用于运行 MapReduce 应用程序的执行引擎库。 | 
| hadoop-yarn-nodemanager | 2.7.3-amzn-2 | 用于管理单个节点上的容器的 YARN 服务。 | 
| hadoop-yarn-resourcemanager | 2.7.3-amzn-2 | 用于分配和管理集群资源与分布式应用程序的 YARN 服务。 | 
| hadoop-yarn-timeline-server | 2.7.3-amzn-2 | 用于检索 YARN 应用程序的当前信息和历史信息的服务。 | 
| hbase-hmaster | 1.2.2 | 为负责协调区域和执行管理命令的 HBase 集群提供服务。 | 
| hbase-region-server | 1.2.2 | 为一个或多个 HBase 地区提供服务的服务。 | 
| hbase-client | 1.2.2 | HBase 命令行客户端。 | 
| hbase-rest-server | 1.2.2 | 为提供 RESTful HTTP 端点的服务 HBase。 | 
| hbase-thrift-server | 1.2.2 | 为其提供 Thrift 端点的 HBase服务。 | 
| hcatalog-client | 1.0.0-amzn-9 | 用于操作 hcatalog-server 的“hcat”命令行客户端。 | 
| hcatalog-server | 1.0.0-amzn-9 | 提供服务 HCatalog，为分布式应用程序提供表和存储管理层。 | 
| hcatalog-webhcat-server | 1.0.0-amzn-9 | 为其提供 REST 接口的 HTTP 端点 HCatalog。 | 
| hive-client | 1.0.0-amzn-9 | Hive 命令行客户端。 | 
| hive-metastore-server | 1.0.0-amzn-9 | 用于访问 Hive 元存储 (一个用于存储 Hadoop 操作中的 SQL 的元数据的语义存储库) 的服务。 | 
| hive-server | 1.0.0-amzn-9 | 用于将 Hive 查询作为 Web 请求接受的服务。 | 
| hue-server | 3.7.1-amzn-7 | 用于使用 Hadoop 生态系统应用程序分析数据的 Web 应用程序 | 
| mahout-client | 0.12.2 | 用于机器学习的库。 | 
| mysql-server | 5.5.54\$1 | MySQL 数据库服务器。 | 
| oozie-client | 4.2.0 | Oozie 命令行客户端。 | 
| oozie-server | 4.2.0 | 用于接受 Oozie 工作流请求的服务。 | 
| phoenix-library | 4.7.0--1.2 HBase | 服务器和客户端的 phoenix 库 | 
| phoenix-query-server | 4.7.0--1.2 HBase | 向 Avatica API 提供 JDBC 访问权限以及协议缓冲区和 JSON 格式访问权限的轻量级服务器  | 
| presto-coordinator | 0.157.1 | 用于在 presto-worker 之中接受查询并管理查询的服务。 | 
| presto-worker | 0.157.1 | 用于执行查询的各个部分的服务。 | 
| pig-client | 0.14.0-amzn-0 | Pig 命令行客户端。 | 
| spark-client | 1.6.3 | Spark 命令行客户端。 | 
| spark-history-server | 1.6.3 | 用于查看完整的 Spark 应用程序的生命周期的已记录事件的 Web UI。 | 
| spark-on-yarn | 1.6.3 | 适用于 YARN 的内存中执行引擎。 | 
| spark-yarn-slave | 1.6.3 | YARN 从属项所需的 Apache Spark 库。 | 
| sqoop-client | 1.4.6 | Apache Sqoop 命令行客户端。 | 
| tez-on-yarn | 0.8.4 | tez YARN 应用程序和库。 | 
| webserver | 2.4.25\$1 | Apache HTTP 服务器。 | 
| zeppelin-server | 0.6.1 | 支持交互式数据分析的基于 Web 的 Notebook。 | 
| zookeeper-server | 3.4.9 | 用于维护配置信息、命名、提供分布式同步以及提供组服务的集中式服务。 | 
| zookeeper-client | 3.4.9 | ZooKeeper 命令行客户端。 | 

## 4.9.3 配置分类
<a name="emr-493-class"></a>

配置分类允许您自定义应用程序。这些通常与应用程序的配置 XML 文件（例如 `hive-site.xml`）相对应。有关更多信息，请参阅[配置应用程序](emr-configure-apps.md)。


**emr-4.9.3 分类**  

| 分类 | 说明 | 
| --- | --- | 
| capacity-scheduler | 更改 Hadoop 的 capacity-scheduler.xml 文件中的值。 | 
| core-site | 更改 Hadoop 的 core-site.xml 文件中的值。 | 
| emrfs-site | 更改 EMRFS 设置。 | 
| hadoop-env | 更改适用于所有 Hadoop 组件的 Hadoop 环境中的值。 | 
| hadoop-log4j | 更改 Hadoop 的 log4j.properties 文件中的值。 | 
| hadoop-ssl-server | 更改 hadoop ssl 服务器配置 | 
| hadoop-ssl-client | 更改 hadoop ssl 客户端配置 | 
| hbase-env | 更改环境 HBase中的值。 | 
| hbase-log4j | 更改 hbase- HBase log4j.properties 文件中的值。 | 
| hbase-metrics | 更改 hadoop-metrics2-hb HBase aase.properties 文件中的值。 | 
| hbase-policy | 更改 hbase-policy.xml 文件 HBase中的值。 | 
| hbase-site | 更改 HBase的 hbase-site.xml 文件中的值。 | 
| hdfs-encryption-zones | 配置 HDFS 加密区域。 | 
| hdfs-site | 更改 HDFS 的 hdfs-site.xml 中的值。 | 
| hcatalog-env | 更改环境 HCatalog中的值。 | 
| hcatalog-server-jndi | 更改 HCatalog的 jndi.properties 中的值。 | 
| hcatalog-server-proto-hive-site | 更改 proto-hive-site .x HCatalog ml 中的值。 | 
| hcatalog-webhcat-env | 更改 HCatalog Web 环境HCat中的值。 | 
| hcatalog-webhcat-log4j | 更改 HCatalog Web HCat 的 log4j.properties 中的值。 | 
| hcatalog-webhcat-site | 更改 HCatalog Web HCat 的 webhcat-site.xml 文件中的值。 | 
| hive-env | 更改 Hive 环境中的值。 | 
| hive-exec-log4j | 更改 Hive 的 hive-exec-log 4j.properties 文件中的值。 | 
| hive-log4j | 更改 Hive 的 hive-log4j.properties 文件中的值。 | 
| hive-site | 更改 Hive 的 hive-site.xml 文件中的值 | 
| hiveserver2-site | 更改 Hive Server2 的 hiveserver2-site.xml 文件中的值 | 
| hue-ini | 更改 Hue 的 ini 文件中的值 | 
| httpfs-env | 更改 HTTPFS 环境中的值。 | 
| httpfs-site | 更改 Hadoop 的 httpfs-site.xml 文件中的值。 | 
| hadoop-kms-acls | 更改 Hadoop 的 kms-acls.xml 文件中的值。 | 
| hadoop-kms-env | 更改 Hadoop KMS 环境中的值。 | 
| hadoop-kms-log4j | 更改 Hadoop 的 kms-log4j.properties 文件中的值。 | 
| hadoop-kms-site | 更改 Hadoop 的 kms-site.xml 文件中的值。 | 
| mapred-env | 更改 MapReduce 应用程序环境中的值。 | 
| mapred-site | 更改 MapReduce 应用程序的 mapred-site.xml 文件中的值。 | 
| oozie-env | 更改 Oozie 的环境中的值。 | 
| oozie-log4j | 更改 Oozie 的 oozie-log4j.properties 文件中的值。 | 
| oozie-site | 更改 Oozie 的 oozie-site.xml 文件中的值。 | 
| phoenix-hbase-metrics | 更改 Phoenix 的 hadoop-metrics2-hbase.properties 文件中的值。 | 
| phoenix-hbase-site | 更改 Phoenix 的 hbase-site.xml 文件中的值。 | 
| phoenix-log4j | 更改 Phoenix 的 log4j.properties 文件中的值。 | 
| phoenix-metrics | 更改 Phoenix 的 hadoop-metrics2-phoenix.properties 文件中的值。 | 
| pig-properties | 更改 Pig 的 pig.properties 文件中的值。 | 
| pig-log4j | 更改 Pig 的 log4j.properties 文件中的值。 | 
| presto-log | 更改 Presto 的 log.properties 文件中的值。 | 
| presto-config | 更改 Presto 的 config.properties 文件中的值。 | 
| presto-connector-blackhole | 更改 Presto 的 blackhole.properties 文件中的值。 | 
| presto-connector-cassandra | 更改 Presto 的 cassandra.properties 文件中的值。 | 
| presto-connector-hive | 更改 Presto 的 hive.properties 文件中的值。 | 
| presto-connector-jmx | 更改 Presto 的 jmx.properties 文件中的值。 | 
| presto-connector-kafka | 更改 Presto 的 kafka.properties 文件中的值。 | 
| presto-connector-localfile | 更改 Presto 的 localfile.properties 文件中的值。 | 
| presto-connector-mongodb | 更改 Presto 的 mongodb.properties 文件中的值。 | 
| presto-connector-mysql | 更改 Presto 的 mysql.properties 文件中的值。 | 
| presto-connector-postgresql | 更改 Presto 的 postgresql.properties 文件中的值。 | 
| presto-connector-raptor | 更改 Presto 的 raptor.properties 文件中的值。 | 
| presto-connector-redis | 更改 Presto 的 redis.properties 文件中的值。 | 
| presto-connector-tpch | 更改 Presto 的 tpch.properties 文件中的值。 | 
| spark | 适用于 Apache Spark 的 Amazon EMR 辅助设置。 | 
| spark-defaults | 更改 Spark 的 spark-defaults.conf 文件中的值。 | 
| spark-env | 更改 Spark 环境中的值。 | 
| spark-log4j | 更改 Spark 的 log4j.properties 文件中的值。 | 
| spark-metrics | 更改 Spark 的 metrics.properties 文件中的值。 | 
| sqoop-env | 更改 Sqoop 的环境中的值。 | 
| sqoop-oraoop-site | 更改 Sqoop OraOop 的 oraoop-site.xml 文件中的值。 | 
| sqoop-site | 更改 Sqoop 的 sqoop-site.xml 文件中的值。 | 
| tez-site | 更改 Tez 的 tez-site.xml 文件中的值。 | 
| yarn-env | 更改 YARN 环境中的值。 | 
| yarn-site | 更改 YARN 的 yarn-site.xml 文件中的值。 | 
| zeppelin-env | 更改 Zeppelin 环境中的值。 | 
| zookeeper-config | 更改 ZooKeeper的 zoo.cfg 文件中的值。 | 
| zookeeper-log4j | 更改 ZooKeeper的 log4j.properties 文件中的值。 | 

# Amazon EMR 发行版 4.9.2
<a name="emr-492-release"></a>

## 4.9.2 应用程序版本
<a name="emr-492-app-versions"></a>

此版本包括以下应用程序：[http://ganglia.info](http://ganglia.info)、[http://hbase.apache.org/](http://hbase.apache.org/)、[https://cwiki.apache.org/confluence/display/Hive/HCatalog](https://cwiki.apache.org/confluence/display/Hive/HCatalog)、[http://hadoop.apache.org/docs/current/](http://hadoop.apache.org/docs/current/)、[http://hive.apache.org/](http://hive.apache.org/)、[http://gethue.com/](http://gethue.com/)、[http://mahout.apache.org/](http://mahout.apache.org/)、[http://oozie.apache.org/](http://oozie.apache.org/)、[https://phoenix.apache.org/](https://phoenix.apache.org/)、[http://pig.apache.org/](http://pig.apache.org/)、[https://prestodb.io/](https://prestodb.io/)、[https://spark.apache.org/docs/latest/](https://spark.apache.org/docs/latest/)、[http://sqoop.apache.org/](http://sqoop.apache.org/)、[https://tez.apache.org/](https://tez.apache.org/)、[https://zeppelin.incubator.apache.org/](https://zeppelin.incubator.apache.org/) 和 [https://zookeeper.apache.org](https://zookeeper.apache.org)。

下表列出了此版本的 Amazon EMR 中提供的应用程序版本以及前三个 Amazon EMR 发行版中的应用程序版本（若适用）。

有关每个发行版的 Amazon EMR 的应用程序版本的全面历史记录，请参见以下主题：
+ [Amazon EMR 7.x 发行版中的应用程序版本](emr-release-app-versions-7.x.md)
+ [Amazon EMR 6.x 发行版中的应用程序版本](emr-release-app-versions-6.x.md)
+ [Amazon EMR 5.x 发行版中的应用程序版本](emr-release-app-versions-5.x.md)
+ [Amazon EMR 4.x 发行版中的应用程序版本](emr-release-app-versions-4.x.md)


**应用程序版本信息**  

|  | emr-4.9.2 | emr-4.9.1 | emr-4.8.5 | emr-4.8.4 | 
| --- | --- | --- | --- | --- | 
| AWS 适用于 Java 的 SDK | 1.10.75 | 1.10.75 | 1.10.75 | 1.10.75 | 
| Python | 未跟踪 | 未跟踪 | 未跟踪 | 未跟踪 | 
| Scala | 未跟踪 | 未跟踪 | 未跟踪 | 未跟踪 | 
| AmazonCloudWatchAgent |  -  |  -  |  -  |  -  | 
| Delta |  -  |  -  |  -  |  -  | 
| Flink |  -  |  -  |  -  |  -  | 
| Ganglia | 3.7.2 | 3.7.2 | 3.7.2 | 3.7.2 | 
| HBase | 1.2.2 | 1.2.2 | 1.2.2 | 1.2.2 | 
| HCatalog | 1.0.0-amzn-9 | 1.0.0-amzn-9 | 1.0.0-amzn-8 | 1.0.0-amzn-8 | 
| Hadoop | 2.7.3-amzn-2 | 2.7.3-amzn-2 | 2.7.3-amzn-1 | 2.7.3-amzn-1 | 
| Hive | 1.0.0-amzn-9 | 1.0.0-amzn-9 | 1.0.0-amzn-8 | 1.0.0-amzn-8 | 
| Hudi |  -  |  -  |  -  |  -  | 
| Hue | 3.7.1-amzn-7 | 3.7.1-amzn-7 | 3.7.1-amzn-7 | 3.7.1-amzn-7 | 
| Iceberg |  -  |  -  |  -  |  -  | 
| JupyterEnterpriseGateway |  -  |  -  |  -  |  -  | 
| JupyterHub |  -  |  -  |  -  |  -  | 
| Livy |  -  |  -  |  -  |  -  | 
| MXNet |  -  |  -  |  -  |  -  | 
| Mahout | 0.12.2 | 0.12.2 | 0.12.2 | 0.12.2 | 
| Oozie |  -  |  -  |  -  |  -  | 
| Oozie-Sandbox | 4.2.0 | 4.2.0 | 4.2.0 | 4.2.0 | 
| Phoenix | 4.7.0--1.2 HBase | 4.7.0--1.2 HBase | 4.7.0--1.2 HBase | 4.7.0--1.2 HBase | 
| Pig | 0.14.0-amzn-0 | 0.14.0-amzn-0 | 0.14.0-amzn-0 | 0.14.0-amzn-0 | 
| Presto |  -  |  -  |  -  |  -  | 
| Presto-Sandbox | 0.157.1 | 0.157.1 | 0.157.1 | 0.157.1 | 
| Spark | 1.6.3 | 1.6.3 | 1.6.3 | 1.6.3 | 
| Sqoop |  -  |  -  |  -  |  -  | 
| Sqoop-Sandbox | 1.4.6 | 1.4.6 | 1.4.6 | 1.4.6 | 
| TensorFlow |  -  |  -  |  -  |  -  | 
| Tez | 0.8.4 | 0.8.4 | 0.8.4 | 0.8.4 | 
| Trino (PrestoSQL) |  -  |  -  |  -  |  -  | 
| Zeppelin |  -  |  -  |  -  |  -  | 
| Zeppelin-Sandbox | 0.6.1 | 0.6.1 | 0.6.1 | 0.6.1 | 
| ZooKeeper |  -  |  -  |  -  |  -  | 
| ZooKeeper-Sandbox | 3.4.9 | 3.4.9 | 3.4.9 | 3.4.9 | 

## 4.9.2 发布说明
<a name="emr-492-relnotes"></a>

以下发布说明包括有关 Amazon EMR 发行版 4.9.2 的信息。更改与 Amazon EMR 4.9.1 发行版有关。

发布日期：2017 年 7 月 13 日

此版本略微进行了一些改动、错误修复和增强。

## 4.9.2 组件版本
<a name="emr-492-components"></a>

下面列出了 Amazon EMR 随此发行版一起安装的组件。一些组件作为大数据应用程序包的一部分安装。其它组件是 Amazon EMR 独有的，并且已为系统流程和功能安装这些组件。它们通常以 `emr` 或 `aws` 开头。最新的 Amazon EMR 发行版中的大数据应用程序包通常是在社区中找到的最新版本。我们会尽快在 Amazon EMR 中提供社区发行版。

Amazon EMR 中的某些组件与社区版本不同。这些组件具有以下形式的 `CommunityVersion-amzn-EmrVersion` 的发行版标注。`EmrVersion` 从 0 开始。例如，假设已对名为 `myapp-component` 的版本 2.2 的开源社区组件进行三次修改，以包含在不同的 Amazon EMR 发行版中，则其发行版将为 `2.2-amzn-2`。


| 组件 | 版本 | 说明 | 
| --- | --- | --- | 
| emr-ddb | 4.3.0 | 适用于 Hadoop 生态系统应用程序的 Amazon DynamoDB 连接器。 | 
| emr-goodies | 2.2.0 | 适用于 Hadoop 生态系统的方便易用的库。 | 
| emr-kinesis | 3.3.0 | 适用于 Hadoop 生态系统应用程序的 Amazon Kinesis 连接器。 | 
| emr-s3-dist-cp | 2.4.0 | 针对 Amazon S3 优化的分布式复制应用程序。 | 
| emrfs | 2.17.0 | 适用于 Hadoop 生态系统应用程序的 Amazon S3 连接器。 | 
| ganglia-monitor | 3.7.2 | 适用于 Hadoop 生态系统应用程序的嵌入式 Ganglia 代理以及 Ganglia 监控代理。 | 
| ganglia-metadata-collector | 3.7.2 | 用于从 Ganglia 监控代理中聚合指标的 Ganglia 元数据收集器。 | 
| ganglia-web | 3.7.1 | 用于查看由 Ganglia 元数据收集器收集的指标的 Web 应用程序。 | 
| hadoop-client | 2.7.3-amzn-2 | Hadoop 命令行客户端，如“hdfs”、“hadoop”或“yarn”。 | 
| hadoop-hdfs-datanode | 2.7.3-amzn-2 | 用于存储数据块的 HDFS 节点级服务。 | 
| hadoop-hdfs-library | 2.7.3-amzn-2 | HDFS 命令行客户端和库 | 
| hadoop-hdfs-namenode | 2.7.3-amzn-2 | 用于跟踪文件名和数据块位置的 HDFS 服务。 | 
| hadoop-httpfs-server | 2.7.3-amzn-2 | 用于 HDFS 操作的 HTTP 终端节点。 | 
| hadoop-kms-server | 2.7.3-amzn-2 | 基于 Hadoop 的 API 的加密密钥管理服务器。 KeyProvider  | 
| hadoop-mapred | 2.7.3-amzn-2 | MapReduce 用于运行 MapReduce 应用程序的执行引擎库。 | 
| hadoop-yarn-nodemanager | 2.7.3-amzn-2 | 用于管理单个节点上的容器的 YARN 服务。 | 
| hadoop-yarn-resourcemanager | 2.7.3-amzn-2 | 用于分配和管理集群资源与分布式应用程序的 YARN 服务。 | 
| hadoop-yarn-timeline-server | 2.7.3-amzn-2 | 用于检索 YARN 应用程序的当前信息和历史信息的服务。 | 
| hbase-hmaster | 1.2.2 | 为负责协调区域和执行管理命令的 HBase 集群提供服务。 | 
| hbase-region-server | 1.2.2 | 为一个或多个 HBase 地区提供服务的服务。 | 
| hbase-client | 1.2.2 | HBase 命令行客户端。 | 
| hbase-rest-server | 1.2.2 | 为提供 RESTful HTTP 端点的服务 HBase。 | 
| hbase-thrift-server | 1.2.2 | 为其提供 Thrift 端点的 HBase服务。 | 
| hcatalog-client | 1.0.0-amzn-9 | 用于操作 hcatalog-server 的“hcat”命令行客户端。 | 
| hcatalog-server | 1.0.0-amzn-9 | 提供服务 HCatalog，为分布式应用程序提供表和存储管理层。 | 
| hcatalog-webhcat-server | 1.0.0-amzn-9 | 为其提供 REST 接口的 HTTP 端点 HCatalog。 | 
| hive-client | 1.0.0-amzn-9 | Hive 命令行客户端。 | 
| hive-metastore-server | 1.0.0-amzn-9 | 用于访问 Hive 元存储 (一个用于存储 Hadoop 操作中的 SQL 的元数据的语义存储库) 的服务。 | 
| hive-server | 1.0.0-amzn-9 | 用于将 Hive 查询作为 Web 请求接受的服务。 | 
| hue-server | 3.7.1-amzn-7 | 用于使用 Hadoop 生态系统应用程序分析数据的 Web 应用程序 | 
| mahout-client | 0.12.2 | 用于机器学习的库。 | 
| mysql-server | 5.5.54\$1 | MySQL 数据库服务器。 | 
| oozie-client | 4.2.0 | Oozie 命令行客户端。 | 
| oozie-server | 4.2.0 | 用于接受 Oozie 工作流请求的服务。 | 
| phoenix-library | 4.7.0--1.2 HBase | 服务器和客户端的 phoenix 库 | 
| phoenix-query-server | 4.7.0--1.2 HBase | 向 Avatica API 提供 JDBC 访问权限以及协议缓冲区和 JSON 格式访问权限的轻量级服务器  | 
| presto-coordinator | 0.157.1 | 用于在 presto-worker 之中接受查询并管理查询的服务。 | 
| presto-worker | 0.157.1 | 用于执行查询的各个部分的服务。 | 
| pig-client | 0.14.0-amzn-0 | Pig 命令行客户端。 | 
| spark-client | 1.6.3 | Spark 命令行客户端。 | 
| spark-history-server | 1.6.3 | 用于查看完整的 Spark 应用程序的生命周期的已记录事件的 Web UI。 | 
| spark-on-yarn | 1.6.3 | 适用于 YARN 的内存中执行引擎。 | 
| spark-yarn-slave | 1.6.3 | YARN 从属项所需的 Apache Spark 库。 | 
| sqoop-client | 1.4.6 | Apache Sqoop 命令行客户端。 | 
| tez-on-yarn | 0.8.4 | tez YARN 应用程序和库。 | 
| webserver | 2.4.25\$1 | Apache HTTP 服务器。 | 
| zeppelin-server | 0.6.1 | 支持交互式数据分析的基于 Web 的 Notebook。 | 
| zookeeper-server | 3.4.9 | 用于维护配置信息、命名、提供分布式同步以及提供组服务的集中式服务。 | 
| zookeeper-client | 3.4.9 | ZooKeeper 命令行客户端。 | 

## 4.9.2 配置分类
<a name="emr-492-class"></a>

配置分类允许您自定义应用程序。这些通常与应用程序的配置 XML 文件（例如 `hive-site.xml`）相对应。有关更多信息，请参阅[配置应用程序](emr-configure-apps.md)。


**emr-4.9.2 分类**  

| 分类 | 说明 | 
| --- | --- | 
| capacity-scheduler | 更改 Hadoop 的 capacity-scheduler.xml 文件中的值。 | 
| core-site | 更改 Hadoop 的 core-site.xml 文件中的值。 | 
| emrfs-site | 更改 EMRFS 设置。 | 
| hadoop-env | 更改适用于所有 Hadoop 组件的 Hadoop 环境中的值。 | 
| hadoop-log4j | 更改 Hadoop 的 log4j.properties 文件中的值。 | 
| hadoop-ssl-server | 更改 hadoop ssl 服务器配置 | 
| hadoop-ssl-client | 更改 hadoop ssl 客户端配置 | 
| hbase-env | 更改环境 HBase中的值。 | 
| hbase-log4j | 更改 hbase- HBase log4j.properties 文件中的值。 | 
| hbase-metrics | 更改 hadoop-metrics2-hb HBase aase.properties 文件中的值。 | 
| hbase-policy | 更改 hbase-policy.xml 文件 HBase中的值。 | 
| hbase-site | 更改 HBase的 hbase-site.xml 文件中的值。 | 
| hdfs-encryption-zones | 配置 HDFS 加密区域。 | 
| hdfs-site | 更改 HDFS 的 hdfs-site.xml 中的值。 | 
| hcatalog-env | 更改环境 HCatalog中的值。 | 
| hcatalog-server-jndi | 更改 HCatalog的 jndi.properties 中的值。 | 
| hcatalog-server-proto-hive-site | 更改 proto-hive-site .x HCatalog ml 中的值。 | 
| hcatalog-webhcat-env | 更改 HCatalog Web 环境HCat中的值。 | 
| hcatalog-webhcat-log4j | 更改 HCatalog Web HCat 的 log4j.properties 中的值。 | 
| hcatalog-webhcat-site | 更改 HCatalog Web HCat 的 webhcat-site.xml 文件中的值。 | 
| hive-env | 更改 Hive 环境中的值。 | 
| hive-exec-log4j | 更改 Hive 的 hive-exec-log 4j.properties 文件中的值。 | 
| hive-log4j | 更改 Hive 的 hive-log4j.properties 文件中的值。 | 
| hive-site | 更改 Hive 的 hive-site.xml 文件中的值 | 
| hiveserver2-site | 更改 Hive Server2 的 hiveserver2-site.xml 文件中的值 | 
| hue-ini | 更改 Hue 的 ini 文件中的值 | 
| httpfs-env | 更改 HTTPFS 环境中的值。 | 
| httpfs-site | 更改 Hadoop 的 httpfs-site.xml 文件中的值。 | 
| hadoop-kms-acls | 更改 Hadoop 的 kms-acls.xml 文件中的值。 | 
| hadoop-kms-env | 更改 Hadoop KMS 环境中的值。 | 
| hadoop-kms-log4j | 更改 Hadoop 的 kms-log4j.properties 文件中的值。 | 
| hadoop-kms-site | 更改 Hadoop 的 kms-site.xml 文件中的值。 | 
| mapred-env | 更改 MapReduce 应用程序环境中的值。 | 
| mapred-site | 更改 MapReduce 应用程序的 mapred-site.xml 文件中的值。 | 
| oozie-env | 更改 Oozie 的环境中的值。 | 
| oozie-log4j | 更改 Oozie 的 oozie-log4j.properties 文件中的值。 | 
| oozie-site | 更改 Oozie 的 oozie-site.xml 文件中的值。 | 
| phoenix-hbase-metrics | 更改 Phoenix 的 hadoop-metrics2-hbase.properties 文件中的值。 | 
| phoenix-hbase-site | 更改 Phoenix 的 hbase-site.xml 文件中的值。 | 
| phoenix-log4j | 更改 Phoenix 的 log4j.properties 文件中的值。 | 
| phoenix-metrics | 更改 Phoenix 的 hadoop-metrics2-phoenix.properties 文件中的值。 | 
| pig-properties | 更改 Pig 的 pig.properties 文件中的值。 | 
| pig-log4j | 更改 Pig 的 log4j.properties 文件中的值。 | 
| presto-log | 更改 Presto 的 log.properties 文件中的值。 | 
| presto-config | 更改 Presto 的 config.properties 文件中的值。 | 
| presto-connector-blackhole | 更改 Presto 的 blackhole.properties 文件中的值。 | 
| presto-connector-cassandra | 更改 Presto 的 cassandra.properties 文件中的值。 | 
| presto-connector-hive | 更改 Presto 的 hive.properties 文件中的值。 | 
| presto-connector-jmx | 更改 Presto 的 jmx.properties 文件中的值。 | 
| presto-connector-kafka | 更改 Presto 的 kafka.properties 文件中的值。 | 
| presto-connector-localfile | 更改 Presto 的 localfile.properties 文件中的值。 | 
| presto-connector-mongodb | 更改 Presto 的 mongodb.properties 文件中的值。 | 
| presto-connector-mysql | 更改 Presto 的 mysql.properties 文件中的值。 | 
| presto-connector-postgresql | 更改 Presto 的 postgresql.properties 文件中的值。 | 
| presto-connector-raptor | 更改 Presto 的 raptor.properties 文件中的值。 | 
| presto-connector-redis | 更改 Presto 的 redis.properties 文件中的值。 | 
| presto-connector-tpch | 更改 Presto 的 tpch.properties 文件中的值。 | 
| spark | 适用于 Apache Spark 的 Amazon EMR 辅助设置。 | 
| spark-defaults | 更改 Spark 的 spark-defaults.conf 文件中的值。 | 
| spark-env | 更改 Spark 环境中的值。 | 
| spark-log4j | 更改 Spark 的 log4j.properties 文件中的值。 | 
| spark-metrics | 更改 Spark 的 metrics.properties 文件中的值。 | 
| sqoop-env | 更改 Sqoop 的环境中的值。 | 
| sqoop-oraoop-site | 更改 Sqoop OraOop 的 oraoop-site.xml 文件中的值。 | 
| sqoop-site | 更改 Sqoop 的 sqoop-site.xml 文件中的值。 | 
| tez-site | 更改 Tez 的 tez-site.xml 文件中的值。 | 
| yarn-env | 更改 YARN 环境中的值。 | 
| yarn-site | 更改 YARN 的 yarn-site.xml 文件中的值。 | 
| zeppelin-env | 更改 Zeppelin 环境中的值。 | 
| zookeeper-config | 更改 ZooKeeper的 zoo.cfg 文件中的值。 | 
| zookeeper-log4j | 更改 ZooKeeper的 log4j.properties 文件中的值。 | 

# Amazon EMR 发行版 4.9.1
<a name="emr-491-release"></a>

## 4.9.1 应用程序版本
<a name="emr-491-app-versions"></a>

此版本包括以下应用程序：[http://ganglia.info](http://ganglia.info)、[http://hbase.apache.org/](http://hbase.apache.org/)、[https://cwiki.apache.org/confluence/display/Hive/HCatalog](https://cwiki.apache.org/confluence/display/Hive/HCatalog)、[http://hadoop.apache.org/docs/current/](http://hadoop.apache.org/docs/current/)、[http://hive.apache.org/](http://hive.apache.org/)、[http://gethue.com/](http://gethue.com/)、[http://mahout.apache.org/](http://mahout.apache.org/)、[http://oozie.apache.org/](http://oozie.apache.org/)、[https://phoenix.apache.org/](https://phoenix.apache.org/)、[http://pig.apache.org/](http://pig.apache.org/)、[https://prestodb.io/](https://prestodb.io/)、[https://spark.apache.org/docs/latest/](https://spark.apache.org/docs/latest/)、[http://sqoop.apache.org/](http://sqoop.apache.org/)、[https://tez.apache.org/](https://tez.apache.org/)、[https://zeppelin.incubator.apache.org/](https://zeppelin.incubator.apache.org/) 和 [https://zookeeper.apache.org](https://zookeeper.apache.org)。

下表列出了此版本的 Amazon EMR 中提供的应用程序版本以及前三个 Amazon EMR 发行版中的应用程序版本（若适用）。

有关每个发行版的 Amazon EMR 的应用程序版本的全面历史记录，请参见以下主题：
+ [Amazon EMR 7.x 发行版中的应用程序版本](emr-release-app-versions-7.x.md)
+ [Amazon EMR 6.x 发行版中的应用程序版本](emr-release-app-versions-6.x.md)
+ [Amazon EMR 5.x 发行版中的应用程序版本](emr-release-app-versions-5.x.md)
+ [Amazon EMR 4.x 发行版中的应用程序版本](emr-release-app-versions-4.x.md)


**应用程序版本信息**  

|  | emr-4.9.1 | emr-4.8.5 | emr-4.8.4 | emr-4.8.3 | 
| --- | --- | --- | --- | --- | 
| AWS 适用于 Java 的 SDK | 1.10.75 | 1.10.75 | 1.10.75 | 1.10.75 | 
| Python | 未跟踪 | 未跟踪 | 未跟踪 | 未跟踪 | 
| Scala | 未跟踪 | 未跟踪 | 未跟踪 | 未跟踪 | 
| AmazonCloudWatchAgent |  -  |  -  |  -  |  -  | 
| Delta |  -  |  -  |  -  |  -  | 
| Flink |  -  |  -  |  -  |  -  | 
| Ganglia | 3.7.2 | 3.7.2 | 3.7.2 | 3.7.2 | 
| HBase | 1.2.2 | 1.2.2 | 1.2.2 | 1.2.2 | 
| HCatalog | 1.0.0-amzn-9 | 1.0.0-amzn-8 | 1.0.0-amzn-8 | 1.0.0-amzn-8 | 
| Hadoop | 2.7.3-amzn-2 | 2.7.3-amzn-1 | 2.7.3-amzn-1 | 2.7.3-amzn-1 | 
| Hive | 1.0.0-amzn-9 | 1.0.0-amzn-8 | 1.0.0-amzn-8 | 1.0.0-amzn-8 | 
| Hudi |  -  |  -  |  -  |  -  | 
| Hue | 3.7.1-amzn-7 | 3.7.1-amzn-7 | 3.7.1-amzn-7 | 3.7.1-amzn-7 | 
| Iceberg |  -  |  -  |  -  |  -  | 
| JupyterEnterpriseGateway |  -  |  -  |  -  |  -  | 
| JupyterHub |  -  |  -  |  -  |  -  | 
| Livy |  -  |  -  |  -  |  -  | 
| MXNet |  -  |  -  |  -  |  -  | 
| Mahout | 0.12.2 | 0.12.2 | 0.12.2 | 0.12.2 | 
| Oozie |  -  |  -  |  -  |  -  | 
| Oozie-Sandbox | 4.2.0 | 4.2.0 | 4.2.0 | 4.2.0 | 
| Phoenix | 4.7.0--1.2 HBase | 4.7.0--1.2 HBase | 4.7.0--1.2 HBase | 4.7.0--1.2 HBase | 
| Pig | 0.14.0-amzn-0 | 0.14.0-amzn-0 | 0.14.0-amzn-0 | 0.14.0-amzn-0 | 
| Presto |  -  |  -  |  -  |  -  | 
| Presto-Sandbox | 0.157.1 | 0.157.1 | 0.157.1 | 0.157.1 | 
| Spark | 1.6.3 | 1.6.3 | 1.6.3 | 1.6.3 | 
| Sqoop |  -  |  -  |  -  |  -  | 
| Sqoop-Sandbox | 1.4.6 | 1.4.6 | 1.4.6 | 1.4.6 | 
| TensorFlow |  -  |  -  |  -  |  -  | 
| Tez | 0.8.4 | 0.8.4 | 0.8.4 | 0.8.4 | 
| Trino (PrestoSQL) |  -  |  -  |  -  |  -  | 
| Zeppelin |  -  |  -  |  -  |  -  | 
| Zeppelin-Sandbox | 0.6.1 | 0.6.1 | 0.6.1 | 0.6.1 | 
| ZooKeeper |  -  |  -  |  -  |  -  | 
| ZooKeeper-Sandbox | 3.4.9 | 3.4.9 | 3.4.9 | 3.4.9 | 

## 4.9.1 发布说明
<a name="emr-491-relnotes"></a>

以下发布说明包括有关 Amazon EMR 发行版 4.9.1 的信息。更改与 Amazon EMR 4.8.4 发行版有关。

发布日期：2017 年 4 月 10 日

**早期版本中已解决的已知问题**
+ 已逆向移植 [HIVE-9976](https://issues.apache.org/jira/browse/HIVE-9976) 和 [HIVE-10106](https://issues.apache.org/jira/browse/HIVE-10106)
+ 修复了 YARN 中大量节点（大于 2,000）和容器（大于 5,000）会导致 out-of-memory错误的问题，例如：`"Exception in thread main java.lang.OutOfMemoryError"`。

**更改和增强功能**
+ Amazon EMR 发行版现在基于 Amazon Linux 2017.03。有关更多信息，请参阅[https://aws.amazon.com/amazon-linux-ami/2017.03-release-notes/](https://aws.amazon.com/amazon-linux-ami/2017.03-release-notes/)。
+ 从 Amazon EMR 基本 Linux 映像中删除了 Python 2.6。如果需要，您可以手动安装 Python 2.6。

## 4.9.1 组件版本
<a name="emr-491-components"></a>

下面列出了 Amazon EMR 随此发行版一起安装的组件。一些组件作为大数据应用程序包的一部分安装。其它组件是 Amazon EMR 独有的，并且已为系统流程和功能安装这些组件。它们通常以 `emr` 或 `aws` 开头。最新的 Amazon EMR 发行版中的大数据应用程序包通常是在社区中找到的最新版本。我们会尽快在 Amazon EMR 中提供社区发行版。

Amazon EMR 中的某些组件与社区版本不同。这些组件具有以下形式的 `CommunityVersion-amzn-EmrVersion` 的发行版标注。`EmrVersion` 从 0 开始。例如，假设已对名为 `myapp-component` 的版本 2.2 的开源社区组件进行三次修改，以包含在不同的 Amazon EMR 发行版中，则其发行版将为 `2.2-amzn-2`。


| 组件 | 版本 | 说明 | 
| --- | --- | --- | 
| emr-ddb | 4.2.0 | 适用于 Hadoop 生态系统应用程序的 Amazon DynamoDB 连接器。 | 
| emr-goodies | 2.2.0 | 适用于 Hadoop 生态系统的方便易用的库。 | 
| emr-kinesis | 3.3.0 | 适用于 Hadoop 生态系统应用程序的 Amazon Kinesis 连接器。 | 
| emr-s3-dist-cp | 2.4.0 | 针对 Amazon S3 优化的分布式复制应用程序。 | 
| emrfs | 2.15.0 | 适用于 Hadoop 生态系统应用程序的 Amazon S3 连接器。 | 
| ganglia-monitor | 3.7.2 | 适用于 Hadoop 生态系统应用程序的嵌入式 Ganglia 代理以及 Ganglia 监控代理。 | 
| ganglia-metadata-collector | 3.7.2 | 用于从 Ganglia 监控代理中聚合指标的 Ganglia 元数据收集器。 | 
| ganglia-web | 3.7.1 | 用于查看由 Ganglia 元数据收集器收集的指标的 Web 应用程序。 | 
| hadoop-client | 2.7.3-amzn-2 | Hadoop 命令行客户端，如“hdfs”、“hadoop”或“yarn”。 | 
| hadoop-hdfs-datanode | 2.7.3-amzn-2 | 用于存储数据块的 HDFS 节点级服务。 | 
| hadoop-hdfs-library | 2.7.3-amzn-2 | HDFS 命令行客户端和库 | 
| hadoop-hdfs-namenode | 2.7.3-amzn-2 | 用于跟踪文件名和数据块位置的 HDFS 服务。 | 
| hadoop-httpfs-server | 2.7.3-amzn-2 | 用于 HDFS 操作的 HTTP 终端节点。 | 
| hadoop-kms-server | 2.7.3-amzn-2 | 基于 Hadoop 的 API 的加密密钥管理服务器。 KeyProvider  | 
| hadoop-mapred | 2.7.3-amzn-2 | MapReduce 用于运行 MapReduce 应用程序的执行引擎库。 | 
| hadoop-yarn-nodemanager | 2.7.3-amzn-2 | 用于管理单个节点上的容器的 YARN 服务。 | 
| hadoop-yarn-resourcemanager | 2.7.3-amzn-2 | 用于分配和管理集群资源与分布式应用程序的 YARN 服务。 | 
| hadoop-yarn-timeline-server | 2.7.3-amzn-2 | 用于检索 YARN 应用程序的当前信息和历史信息的服务。 | 
| hbase-hmaster | 1.2.2 | 为负责协调区域和执行管理命令的 HBase 集群提供服务。 | 
| hbase-region-server | 1.2.2 | 为一个或多个 HBase 地区提供服务的服务。 | 
| hbase-client | 1.2.2 | HBase 命令行客户端。 | 
| hbase-rest-server | 1.2.2 | 为提供 RESTful HTTP 端点的服务 HBase。 | 
| hbase-thrift-server | 1.2.2 | 为其提供 Thrift 端点的 HBase服务。 | 
| hcatalog-client | 1.0.0-amzn-9 | 用于操作 hcatalog-server 的“hcat”命令行客户端。 | 
| hcatalog-server | 1.0.0-amzn-9 | 提供服务 HCatalog，为分布式应用程序提供表和存储管理层。 | 
| hcatalog-webhcat-server | 1.0.0-amzn-9 | 为其提供 REST 接口的 HTTP 端点 HCatalog。 | 
| hive-client | 1.0.0-amzn-9 | Hive 命令行客户端。 | 
| hive-metastore-server | 1.0.0-amzn-9 | 用于访问 Hive 元存储 (一个用于存储 Hadoop 操作中的 SQL 的元数据的语义存储库) 的服务。 | 
| hive-server | 1.0.0-amzn-9 | 用于将 Hive 查询作为 Web 请求接受的服务。 | 
| hue-server | 3.7.1-amzn-7 | 用于使用 Hadoop 生态系统应用程序分析数据的 Web 应用程序 | 
| mahout-client | 0.12.2 | 用于机器学习的库。 | 
| mysql-server | 5.5.54\$1 | MySQL 数据库服务器。 | 
| oozie-client | 4.2.0 | Oozie 命令行客户端。 | 
| oozie-server | 4.2.0 | 用于接受 Oozie 工作流请求的服务。 | 
| phoenix-library | 4.7.0--1.2 HBase | 服务器和客户端的 phoenix 库 | 
| phoenix-query-server | 4.7.0--1.2 HBase | 向 Avatica API 提供 JDBC 访问权限以及协议缓冲区和 JSON 格式访问权限的轻量级服务器  | 
| presto-coordinator | 0.157.1 | 用于在 presto-worker 之中接受查询并管理查询的服务。 | 
| presto-worker | 0.157.1 | 用于执行查询的各个部分的服务。 | 
| pig-client | 0.14.0-amzn-0 | Pig 命令行客户端。 | 
| spark-client | 1.6.3 | Spark 命令行客户端。 | 
| spark-history-server | 1.6.3 | 用于查看完整的 Spark 应用程序的生命周期的已记录事件的 Web UI。 | 
| spark-on-yarn | 1.6.3 | 适用于 YARN 的内存中执行引擎。 | 
| spark-yarn-slave | 1.6.3 | YARN 从属项所需的 Apache Spark 库。 | 
| sqoop-client | 1.4.6 | Apache Sqoop 命令行客户端。 | 
| tez-on-yarn | 0.8.4 | tez YARN 应用程序和库。 | 
| webserver | 2.4.25\$1 | Apache HTTP 服务器。 | 
| zeppelin-server | 0.6.1 | 支持交互式数据分析的基于 Web 的 Notebook。 | 
| zookeeper-server | 3.4.9 | 用于维护配置信息、命名、提供分布式同步以及提供组服务的集中式服务。 | 
| zookeeper-client | 3.4.9 | ZooKeeper 命令行客户端。 | 

## 4.9.1 配置分类
<a name="emr-491-class"></a>

配置分类允许您自定义应用程序。这些通常与应用程序的配置 XML 文件（例如 `hive-site.xml`）相对应。有关更多信息，请参阅[配置应用程序](emr-configure-apps.md)。


**emr-4.9.1 分类**  

| 分类 | 说明 | 
| --- | --- | 
| capacity-scheduler | 更改 Hadoop 的 capacity-scheduler.xml 文件中的值。 | 
| core-site | 更改 Hadoop 的 core-site.xml 文件中的值。 | 
| emrfs-site | 更改 EMRFS 设置。 | 
| hadoop-env | 更改适用于所有 Hadoop 组件的 Hadoop 环境中的值。 | 
| hadoop-log4j | 更改 Hadoop 的 log4j.properties 文件中的值。 | 
| hadoop-ssl-server | 更改 hadoop ssl 服务器配置 | 
| hadoop-ssl-client | 更改 hadoop ssl 客户端配置 | 
| hbase-env | 更改环境 HBase中的值。 | 
| hbase-log4j | 更改 hbase- HBase log4j.properties 文件中的值。 | 
| hbase-metrics | 更改 hadoop-metrics2-hb HBase aase.properties 文件中的值。 | 
| hbase-policy | 更改 hbase-policy.xml 文件 HBase中的值。 | 
| hbase-site | 更改 HBase的 hbase-site.xml 文件中的值。 | 
| hdfs-encryption-zones | 配置 HDFS 加密区域。 | 
| hdfs-site | 更改 HDFS 的 hdfs-site.xml 中的值。 | 
| hcatalog-env | 更改环境 HCatalog中的值。 | 
| hcatalog-server-jndi | 更改 HCatalog的 jndi.properties 中的值。 | 
| hcatalog-server-proto-hive-site | 更改 proto-hive-site .x HCatalog ml 中的值。 | 
| hcatalog-webhcat-env | 更改 HCatalog Web 环境HCat中的值。 | 
| hcatalog-webhcat-log4j | 更改 HCatalog Web HCat 的 log4j.properties 中的值。 | 
| hcatalog-webhcat-site | 更改 HCatalog Web HCat 的 webhcat-site.xml 文件中的值。 | 
| hive-env | 更改 Hive 环境中的值。 | 
| hive-exec-log4j | 更改 Hive 的 hive-exec-log 4j.properties 文件中的值。 | 
| hive-log4j | 更改 Hive 的 hive-log4j.properties 文件中的值。 | 
| hive-site | 更改 Hive 的 hive-site.xml 文件中的值 | 
| hiveserver2-site | 更改 Hive Server2 的 hiveserver2-site.xml 文件中的值 | 
| hue-ini | 更改 Hue 的 ini 文件中的值 | 
| httpfs-env | 更改 HTTPFS 环境中的值。 | 
| httpfs-site | 更改 Hadoop 的 httpfs-site.xml 文件中的值。 | 
| hadoop-kms-acls | 更改 Hadoop 的 kms-acls.xml 文件中的值。 | 
| hadoop-kms-env | 更改 Hadoop KMS 环境中的值。 | 
| hadoop-kms-log4j | 更改 Hadoop 的 kms-log4j.properties 文件中的值。 | 
| hadoop-kms-site | 更改 Hadoop 的 kms-site.xml 文件中的值。 | 
| mapred-env | 更改 MapReduce 应用程序环境中的值。 | 
| mapred-site | 更改 MapReduce 应用程序的 mapred-site.xml 文件中的值。 | 
| oozie-env | 更改 Oozie 的环境中的值。 | 
| oozie-log4j | 更改 Oozie 的 oozie-log4j.properties 文件中的值。 | 
| oozie-site | 更改 Oozie 的 oozie-site.xml 文件中的值。 | 
| phoenix-hbase-metrics | 更改 Phoenix 的 hadoop-metrics2-hbase.properties 文件中的值。 | 
| phoenix-hbase-site | 更改 Phoenix 的 hbase-site.xml 文件中的值。 | 
| phoenix-log4j | 更改 Phoenix 的 log4j.properties 文件中的值。 | 
| phoenix-metrics | 更改 Phoenix 的 hadoop-metrics2-phoenix.properties 文件中的值。 | 
| pig-properties | 更改 Pig 的 pig.properties 文件中的值。 | 
| pig-log4j | 更改 Pig 的 log4j.properties 文件中的值。 | 
| presto-log | 更改 Presto 的 log.properties 文件中的值。 | 
| presto-config | 更改 Presto 的 config.properties 文件中的值。 | 
| presto-connector-blackhole | 更改 Presto 的 blackhole.properties 文件中的值。 | 
| presto-connector-cassandra | 更改 Presto 的 cassandra.properties 文件中的值。 | 
| presto-connector-hive | 更改 Presto 的 hive.properties 文件中的值。 | 
| presto-connector-jmx | 更改 Presto 的 jmx.properties 文件中的值。 | 
| presto-connector-kafka | 更改 Presto 的 kafka.properties 文件中的值。 | 
| presto-connector-localfile | 更改 Presto 的 localfile.properties 文件中的值。 | 
| presto-connector-mongodb | 更改 Presto 的 mongodb.properties 文件中的值。 | 
| presto-connector-mysql | 更改 Presto 的 mysql.properties 文件中的值。 | 
| presto-connector-postgresql | 更改 Presto 的 postgresql.properties 文件中的值。 | 
| presto-connector-raptor | 更改 Presto 的 raptor.properties 文件中的值。 | 
| presto-connector-redis | 更改 Presto 的 redis.properties 文件中的值。 | 
| presto-connector-tpch | 更改 Presto 的 tpch.properties 文件中的值。 | 
| spark | 适用于 Apache Spark 的 Amazon EMR 辅助设置。 | 
| spark-defaults | 更改 Spark 的 spark-defaults.conf 文件中的值。 | 
| spark-env | 更改 Spark 环境中的值。 | 
| spark-log4j | 更改 Spark 的 log4j.properties 文件中的值。 | 
| spark-metrics | 更改 Spark 的 metrics.properties 文件中的值。 | 
| sqoop-env | 更改 Sqoop 的环境中的值。 | 
| sqoop-oraoop-site | 更改 Sqoop OraOop 的 oraoop-site.xml 文件中的值。 | 
| sqoop-site | 更改 Sqoop 的 sqoop-site.xml 文件中的值。 | 
| tez-site | 更改 Tez 的 tez-site.xml 文件中的值。 | 
| yarn-env | 更改 YARN 环境中的值。 | 
| yarn-site | 更改 YARN 的 yarn-site.xml 文件中的值。 | 
| zeppelin-env | 更改 Zeppelin 环境中的值。 | 
| zookeeper-config | 更改 ZooKeeper的 zoo.cfg 文件中的值。 | 
| zookeeper-log4j | 更改 ZooKeeper的 log4j.properties 文件中的值。 | 

# Amazon EMR 发行版 4.8.5
<a name="emr-485-release"></a>

## 4.8.5 应用程序版本
<a name="emr-485-app-versions"></a>

此版本包括以下应用程序：[http://ganglia.info](http://ganglia.info)、[http://hbase.apache.org/](http://hbase.apache.org/)、[https://cwiki.apache.org/confluence/display/Hive/HCatalog](https://cwiki.apache.org/confluence/display/Hive/HCatalog)、[http://hadoop.apache.org/docs/current/](http://hadoop.apache.org/docs/current/)、[http://hive.apache.org/](http://hive.apache.org/)、[http://gethue.com/](http://gethue.com/)、[http://mahout.apache.org/](http://mahout.apache.org/)、[http://oozie.apache.org/](http://oozie.apache.org/)、[https://phoenix.apache.org/](https://phoenix.apache.org/)、[http://pig.apache.org/](http://pig.apache.org/)、[https://prestodb.io/](https://prestodb.io/)、[https://spark.apache.org/docs/latest/](https://spark.apache.org/docs/latest/)、[http://sqoop.apache.org/](http://sqoop.apache.org/)、[https://tez.apache.org/](https://tez.apache.org/)、[https://zeppelin.incubator.apache.org/](https://zeppelin.incubator.apache.org/) 和 [https://zookeeper.apache.org](https://zookeeper.apache.org)。

下表列出了此版本的 Amazon EMR 中提供的应用程序版本以及前三个 Amazon EMR 发行版中的应用程序版本（若适用）。

有关每个发行版的 Amazon EMR 的应用程序版本的全面历史记录，请参见以下主题：
+ [Amazon EMR 7.x 发行版中的应用程序版本](emr-release-app-versions-7.x.md)
+ [Amazon EMR 6.x 发行版中的应用程序版本](emr-release-app-versions-6.x.md)
+ [Amazon EMR 5.x 发行版中的应用程序版本](emr-release-app-versions-5.x.md)
+ [Amazon EMR 4.x 发行版中的应用程序版本](emr-release-app-versions-4.x.md)


**应用程序版本信息**  

|  | emr-4.8.5 | emr-4.8.4 | emr-4.8.3 | emr-4.8.2 | 
| --- | --- | --- | --- | --- | 
| AWS 适用于 Java 的 SDK | 1.10.75 | 1.10.75 | 1.10.75 | 1.10.75 | 
| Python | 未跟踪 | 未跟踪 | 未跟踪 | 未跟踪 | 
| Scala | 未跟踪 | 未跟踪 | 未跟踪 | 未跟踪 | 
| AmazonCloudWatchAgent |  -  |  -  |  -  |  -  | 
| Delta |  -  |  -  |  -  |  -  | 
| Flink |  -  |  -  |  -  |  -  | 
| Ganglia | 3.7.2 | 3.7.2 | 3.7.2 | 3.7.2 | 
| HBase | 1.2.2 | 1.2.2 | 1.2.2 | 1.2.2 | 
| HCatalog | 1.0.0-amzn-8 | 1.0.0-amzn-8 | 1.0.0-amzn-8 | 1.0.0-amzn-7 | 
| Hadoop | 2.7.3-amzn-1 | 2.7.3-amzn-1 | 2.7.3-amzn-1 | 2.7.3-amzn-0 | 
| Hive | 1.0.0-amzn-8 | 1.0.0-amzn-8 | 1.0.0-amzn-8 | 1.0.0-amzn-7 | 
| Hudi |  -  |  -  |  -  |  -  | 
| Hue | 3.7.1-amzn-7 | 3.7.1-amzn-7 | 3.7.1-amzn-7 | 3.7.1-amzn-7 | 
| Iceberg |  -  |  -  |  -  |  -  | 
| JupyterEnterpriseGateway |  -  |  -  |  -  |  -  | 
| JupyterHub |  -  |  -  |  -  |  -  | 
| Livy |  -  |  -  |  -  |  -  | 
| MXNet |  -  |  -  |  -  |  -  | 
| Mahout | 0.12.2 | 0.12.2 | 0.12.2 | 0.12.2 | 
| Oozie |  -  |  -  |  -  |  -  | 
| Oozie-Sandbox | 4.2.0 | 4.2.0 | 4.2.0 | 4.2.0 | 
| Phoenix | 4.7.0--1.2 HBase | 4.7.0--1.2 HBase | 4.7.0--1.2 HBase | 4.7.0--1.2 HBase | 
| Pig | 0.14.0-amzn-0 | 0.14.0-amzn-0 | 0.14.0-amzn-0 | 0.14.0-amzn-0 | 
| Presto |  -  |  -  |  -  |  -  | 
| Presto-Sandbox | 0.157.1 | 0.157.1 | 0.157.1 | 0.152.3 | 
| Spark | 1.6.3 | 1.6.3 | 1.6.3 | 1.6.2 | 
| Sqoop |  -  |  -  |  -  |  -  | 
| Sqoop-Sandbox | 1.4.6 | 1.4.6 | 1.4.6 | 1.4.6 | 
| TensorFlow |  -  |  -  |  -  |  -  | 
| Tez | 0.8.4 | 0.8.4 | 0.8.4 | 0.8.4 | 
| Trino (PrestoSQL) |  -  |  -  |  -  |  -  | 
| Zeppelin |  -  |  -  |  -  |  -  | 
| Zeppelin-Sandbox | 0.6.1 | 0.6.1 | 0.6.1 | 0.6.1 | 
| ZooKeeper |  -  |  -  |  -  |  -  | 
| ZooKeeper-Sandbox | 3.4.9 | 3.4.9 | 3.4.9 | 3.4.8 | 

## 4.8.5 发布说明
<a name="emr-485-relnotes"></a>

这是一个补丁版本，用于为向 Amazon S3 发出的请求添加 AWS 签名版本 4 身份验证。所有应用程序和组件都与之前的 Amazon EMR 发行版相同。

**重要**  
在此版本中，Amazon EMR 仅使用 AWS 签名版本 4 来验证向 Amazon S3 发出的请求。有关更多信息，请参阅[新功能](https://docs.aws.amazon.com/emr/latest/ReleaseGuide/emr-whatsnew.html)。

## 4.8.5 组件版本
<a name="emr-485-components"></a>

下面列出了 Amazon EMR 随此发行版一起安装的组件。一些组件作为大数据应用程序包的一部分安装。其它组件是 Amazon EMR 独有的，并且已为系统流程和功能安装这些组件。它们通常以 `emr` 或 `aws` 开头。最新的 Amazon EMR 发行版中的大数据应用程序包通常是在社区中找到的最新版本。我们会尽快在 Amazon EMR 中提供社区发行版。

Amazon EMR 中的某些组件与社区版本不同。这些组件具有以下形式的 `CommunityVersion-amzn-EmrVersion` 的发行版标注。`EmrVersion` 从 0 开始。例如，假设已对名为 `myapp-component` 的版本 2.2 的开源社区组件进行三次修改，以包含在不同的 Amazon EMR 发行版中，则其发行版将为 `2.2-amzn-2`。


| 组件 | 版本 | 说明 | 
| --- | --- | --- | 
| emr-ddb | 4.2.0 | 适用于 Hadoop 生态系统应用程序的 Amazon DynamoDB 连接器。 | 
| emr-goodies | 2.2.0 | 适用于 Hadoop 生态系统的方便易用的库。 | 
| emr-kinesis | 3.2.0 | 适用于 Hadoop 生态系统应用程序的 Amazon Kinesis 连接器。 | 
| emr-s3-dist-cp | 2.4.0 | 针对 Amazon S3 优化的分布式复制应用程序。 | 
| emrfs | emrfs | 适用于 Hadoop 生态系统应用程序的 Amazon S3 连接器。 | 
| ganglia-monitor | 3.7.2 | 适用于 Hadoop 生态系统应用程序的嵌入式 Ganglia 代理以及 Ganglia 监控代理。 | 
| ganglia-metadata-collector | 3.7.2 | 用于从 Ganglia 监控代理中聚合指标的 Ganglia 元数据收集器。 | 
| ganglia-web | 3.7.1 | 用于查看由 Ganglia 元数据收集器收集的指标的 Web 应用程序。 | 
| hadoop-client | 2.7.3-amzn-1 | Hadoop 命令行客户端，如“hdfs”、“hadoop”或“yarn”。 | 
| hadoop-hdfs-datanode | 2.7.3-amzn-1 | 用于存储数据块的 HDFS 节点级服务。 | 
| hadoop-hdfs-library | 2.7.3-amzn-1 | HDFS 命令行客户端和库 | 
| hadoop-hdfs-namenode | 2.7.3-amzn-1 | 用于跟踪文件名和数据块位置的 HDFS 服务。 | 
| hadoop-httpfs-server | 2.7.3-amzn-1 | 用于 HDFS 操作的 HTTP 终端节点。 | 
| hadoop-kms-server | 2.7.3-amzn-1 | 基于 Hadoop 的 API 的加密密钥管理服务器。 KeyProvider  | 
| hadoop-mapred | 2.7.3-amzn-1 | MapReduce 用于运行 MapReduce 应用程序的执行引擎库。 | 
| hadoop-yarn-nodemanager | 2.7.3-amzn-1 | 用于管理单个节点上的容器的 YARN 服务。 | 
| hadoop-yarn-resourcemanager | 2.7.3-amzn-1 | 用于分配和管理集群资源与分布式应用程序的 YARN 服务。 | 
| hadoop-yarn-timeline-server | 2.7.3-amzn-1 | 用于检索 YARN 应用程序的当前信息和历史信息的服务。 | 
| hbase-hmaster | 1.2.2 | 为负责协调区域和执行管理命令的 HBase 集群提供服务。 | 
| hbase-region-server | 1.2.2 | 为一个或多个 HBase 地区提供服务的服务。 | 
| hbase-client | 1.2.2 | HBase 命令行客户端。 | 
| hbase-rest-server | 1.2.2 | 为提供 RESTful HTTP 端点的服务 HBase。 | 
| hbase-thrift-server | 1.2.2 | 为其提供 Thrift 端点的 HBase服务。 | 
| hcatalog-client | 1.0.0-amzn-8 | 用于操作 hcatalog-server 的“hcat”命令行客户端。 | 
| hcatalog-server | 1.0.0-amzn-8 | 提供服务 HCatalog，为分布式应用程序提供表和存储管理层。 | 
| hcatalog-webhcat-server | 1.0.0-amzn-8 | 为其提供 REST 接口的 HTTP 端点 HCatalog。 | 
| hive-client | 1.0.0-amzn-8 | Hive 命令行客户端。 | 
| hive-metastore-server | 1.0.0-amzn-8 | 用于访问 Hive 元存储 (一个用于存储 Hadoop 操作中的 SQL 的元数据的语义存储库) 的服务。 | 
| hive-server | 1.0.0-amzn-8 | 用于将 Hive 查询作为 Web 请求接受的服务。 | 
| hue-server | 3.7.1-amzn-7 | 用于使用 Hadoop 生态系统应用程序分析数据的 Web 应用程序 | 
| mahout-client | 0.12.2 | 用于机器学习的库。 | 
| mysql-server | 5.5.54\$1 | MySQL 数据库服务器。 | 
| oozie-client | 4.2.0 | Oozie 命令行客户端。 | 
| oozie-server | 4.2.0 | 用于接受 Oozie 工作流请求的服务。 | 
| phoenix-library | 4.7.0--1.2 HBase | 服务器和客户端的 phoenix 库 | 
| phoenix-query-server | 4.7.0--1.2 HBase | 向 Avatica API 提供 JDBC 访问权限以及协议缓冲区和 JSON 格式访问权限的轻量级服务器  | 
| presto-coordinator | 0.157.1 | 用于在 presto-worker 之中接受查询并管理查询的服务。 | 
| presto-worker | 0.157.1 | 用于执行查询的各个部分的服务。 | 
| pig-client | 0.14.0-amzn-0 | Pig 命令行客户端。 | 
| spark-client | 1.6.3 | Spark 命令行客户端。 | 
| spark-history-server | 1.6.3 | 用于查看完整的 Spark 应用程序的生命周期的已记录事件的 Web UI。 | 
| spark-on-yarn | 1.6.3 | 适用于 YARN 的内存中执行引擎。 | 
| spark-yarn-slave | 1.6.3 | YARN 从属项所需的 Apache Spark 库。 | 
| sqoop-client | 1.4.6 | Apache Sqoop 命令行客户端。 | 
| tez-on-yarn | 0.8.4 | tez YARN 应用程序和库。 | 
| webserver | 2.4.25\$1 | Apache HTTP 服务器。 | 
| zeppelin-server | 0.6.1 | 支持交互式数据分析的基于 Web 的 Notebook。 | 
| zookeeper-server | 3.4.9 | 用于维护配置信息、命名、提供分布式同步以及提供组服务的集中式服务。 | 
| zookeeper-client | 3.4.9 | ZooKeeper 命令行客户端。 | 

## 4.8.5 配置分类
<a name="emr-485-class"></a>

配置分类允许您自定义应用程序。这些通常与应用程序的配置 XML 文件（例如 `hive-site.xml`）相对应。有关更多信息，请参阅[配置应用程序](emr-configure-apps.md)。


**emr-4.8.5 分类**  

| 分类 | 说明 | 
| --- | --- | 
| capacity-scheduler | 更改 Hadoop 的 capacity-scheduler.xml 文件中的值。 | 
| core-site | 更改 Hadoop 的 core-site.xml 文件中的值。 | 
| emrfs-site | 更改 EMRFS 设置。 | 
| hadoop-env | 更改适用于所有 Hadoop 组件的 Hadoop 环境中的值。 | 
| hadoop-log4j | 更改 Hadoop 的 log4j.properties 文件中的值。 | 
| hadoop-ssl-server | 更改 hadoop ssl 服务器配置 | 
| hadoop-ssl-client | 更改 hadoop ssl 客户端配置 | 
| hbase-env | 更改环境 HBase中的值。 | 
| hbase-log4j | 更改 hbase- HBase log4j.properties 文件中的值。 | 
| hbase-metrics | 更改 hadoop-metrics2-hb HBase aase.properties 文件中的值。 | 
| hbase-policy | 更改 hbase-policy.xml 文件 HBase中的值。 | 
| hbase-site | 更改 HBase的 hbase-site.xml 文件中的值。 | 
| hdfs-encryption-zones | 配置 HDFS 加密区域。 | 
| hdfs-site | 更改 HDFS 的 hdfs-site.xml 中的值。 | 
| hcatalog-env | 更改环境 HCatalog中的值。 | 
| hcatalog-server-jndi | 更改 HCatalog的 jndi.properties 中的值。 | 
| hcatalog-server-proto-hive-site | 更改 proto-hive-site .x HCatalog ml 中的值。 | 
| hcatalog-webhcat-env | 更改 HCatalog Web 环境HCat中的值。 | 
| hcatalog-webhcat-log4j | 更改 HCatalog Web HCat 的 log4j.properties 中的值。 | 
| hcatalog-webhcat-site | 更改 HCatalog Web HCat 的 webhcat-site.xml 文件中的值。 | 
| hive-env | 更改 Hive 环境中的值。 | 
| hive-exec-log4j | 更改 Hive 的 hive-exec-log 4j.properties 文件中的值。 | 
| hive-log4j | 更改 Hive 的 hive-log4j.properties 文件中的值。 | 
| hive-site | 更改 Hive 的 hive-site.xml 文件中的值 | 
| hiveserver2-site | 更改 Hive Server2 的 hiveserver2-site.xml 文件中的值 | 
| hue-ini | 更改 Hue 的 ini 文件中的值 | 
| httpfs-env | 更改 HTTPFS 环境中的值。 | 
| httpfs-site | 更改 Hadoop 的 httpfs-site.xml 文件中的值。 | 
| hadoop-kms-acls | 更改 Hadoop 的 kms-acls.xml 文件中的值。 | 
| hadoop-kms-env | 更改 Hadoop KMS 环境中的值。 | 
| hadoop-kms-log4j | 更改 Hadoop 的 kms-log4j.properties 文件中的值。 | 
| hadoop-kms-site | 更改 Hadoop 的 kms-site.xml 文件中的值。 | 
| mapred-env | 更改 MapReduce 应用程序环境中的值。 | 
| mapred-site | 更改 MapReduce 应用程序的 mapred-site.xml 文件中的值。 | 
| oozie-env | 更改 Oozie 的环境中的值。 | 
| oozie-log4j | 更改 Oozie 的 oozie-log4j.properties 文件中的值。 | 
| oozie-site | 更改 Oozie 的 oozie-site.xml 文件中的值。 | 
| phoenix-hbase-metrics | 更改 Phoenix 的 hadoop-metrics2-hbase.properties 文件中的值。 | 
| phoenix-hbase-site | 更改 Phoenix 的 hbase-site.xml 文件中的值。 | 
| phoenix-log4j | 更改 Phoenix 的 log4j.properties 文件中的值。 | 
| phoenix-metrics | 更改 Phoenix 的 hadoop-metrics2-phoenix.properties 文件中的值。 | 
| pig-properties | 更改 Pig 的 pig.properties 文件中的值。 | 
| pig-log4j | 更改 Pig 的 log4j.properties 文件中的值。 | 
| presto-log | 更改 Presto 的 log.properties 文件中的值。 | 
| presto-config | 更改 Presto 的 config.properties 文件中的值。 | 
| presto-connector-blackhole | 更改 Presto 的 blackhole.properties 文件中的值。 | 
| presto-connector-cassandra | 更改 Presto 的 cassandra.properties 文件中的值。 | 
| presto-connector-hive | 更改 Presto 的 hive.properties 文件中的值。 | 
| presto-connector-jmx | 更改 Presto 的 jmx.properties 文件中的值。 | 
| presto-connector-kafka | 更改 Presto 的 kafka.properties 文件中的值。 | 
| presto-connector-localfile | 更改 Presto 的 localfile.properties 文件中的值。 | 
| presto-connector-mongodb | 更改 Presto 的 mongodb.properties 文件中的值。 | 
| presto-connector-mysql | 更改 Presto 的 mysql.properties 文件中的值。 | 
| presto-connector-postgresql | 更改 Presto 的 postgresql.properties 文件中的值。 | 
| presto-connector-raptor | 更改 Presto 的 raptor.properties 文件中的值。 | 
| presto-connector-redis | 更改 Presto 的 redis.properties 文件中的值。 | 
| presto-connector-tpch | 更改 Presto 的 tpch.properties 文件中的值。 | 
| spark | 适用于 Apache Spark 的 Amazon EMR 辅助设置。 | 
| spark-defaults | 更改 Spark 的 spark-defaults.conf 文件中的值。 | 
| spark-env | 更改 Spark 环境中的值。 | 
| spark-log4j | 更改 Spark 的 log4j.properties 文件中的值。 | 
| spark-metrics | 更改 Spark 的 metrics.properties 文件中的值。 | 
| sqoop-env | 更改 Sqoop 的环境中的值。 | 
| sqoop-oraoop-site | 更改 Sqoop OraOop 的 oraoop-site.xml 文件中的值。 | 
| sqoop-site | 更改 Sqoop 的 sqoop-site.xml 文件中的值。 | 
| tez-site | 更改 Tez 的 tez-site.xml 文件中的值。 | 
| yarn-env | 更改 YARN 环境中的值。 | 
| yarn-site | 更改 YARN 的 yarn-site.xml 文件中的值。 | 
| zeppelin-env | 更改 Zeppelin 环境中的值。 | 
| zookeeper-config | 更改 ZooKeeper的 zoo.cfg 文件中的值。 | 
| zookeeper-log4j | 更改 ZooKeeper的 log4j.properties 文件中的值。 | 

# Amazon EMR 发行版 4.8.4
<a name="emr-484-release"></a>

## 4.8.4 应用程序版本
<a name="emr-484-app-versions"></a>

此版本包括以下应用程序：[http://ganglia.info](http://ganglia.info)、[http://hbase.apache.org/](http://hbase.apache.org/)、[https://cwiki.apache.org/confluence/display/Hive/HCatalog](https://cwiki.apache.org/confluence/display/Hive/HCatalog)、[http://hadoop.apache.org/docs/current/](http://hadoop.apache.org/docs/current/)、[http://hive.apache.org/](http://hive.apache.org/)、[http://gethue.com/](http://gethue.com/)、[http://mahout.apache.org/](http://mahout.apache.org/)、[http://oozie.apache.org/](http://oozie.apache.org/)、[https://phoenix.apache.org/](https://phoenix.apache.org/)、[http://pig.apache.org/](http://pig.apache.org/)、[https://prestodb.io/](https://prestodb.io/)、[https://spark.apache.org/docs/latest/](https://spark.apache.org/docs/latest/)、[http://sqoop.apache.org/](http://sqoop.apache.org/)、[https://tez.apache.org/](https://tez.apache.org/)、[https://zeppelin.incubator.apache.org/](https://zeppelin.incubator.apache.org/) 和 [https://zookeeper.apache.org](https://zookeeper.apache.org)。

下表列出了此版本的 Amazon EMR 中提供的应用程序版本以及前三个 Amazon EMR 发行版中的应用程序版本（若适用）。

有关每个发行版的 Amazon EMR 的应用程序版本的全面历史记录，请参见以下主题：
+ [Amazon EMR 7.x 发行版中的应用程序版本](emr-release-app-versions-7.x.md)
+ [Amazon EMR 6.x 发行版中的应用程序版本](emr-release-app-versions-6.x.md)
+ [Amazon EMR 5.x 发行版中的应用程序版本](emr-release-app-versions-5.x.md)
+ [Amazon EMR 4.x 发行版中的应用程序版本](emr-release-app-versions-4.x.md)


**应用程序版本信息**  

|  | emr-4.8.4 | emr-4.8.3 | emr-4.8.2 | emr-4.8.1 | 
| --- | --- | --- | --- | --- | 
| AWS 适用于 Java 的 SDK | 1.10.75 | 1.10.75 | 1.10.75 | 1.10.75 | 
| Python | 未跟踪 | 未跟踪 | 未跟踪 | 未跟踪 | 
| Scala | 未跟踪 | 未跟踪 | 未跟踪 | 未跟踪 | 
| AmazonCloudWatchAgent |  -  |  -  |  -  |  -  | 
| Delta |  -  |  -  |  -  |  -  | 
| Flink |  -  |  -  |  -  |  -  | 
| Ganglia | 3.7.2 | 3.7.2 | 3.7.2 | 3.7.2 | 
| HBase | 1.2.2 | 1.2.2 | 1.2.2 | 1.2.2 | 
| HCatalog | 1.0.0-amzn-8 | 1.0.0-amzn-8 | 1.0.0-amzn-7 | 1.0.0-amzn-7 | 
| Hadoop | 2.7.3-amzn-1 | 2.7.3-amzn-1 | 2.7.3-amzn-0 | 2.7.2-amzn-4 | 
| Hive | 1.0.0-amzn-8 | 1.0.0-amzn-8 | 1.0.0-amzn-7 | 1.0.0-amzn-7 | 
| Hudi |  -  |  -  |  -  |  -  | 
| Hue | 3.7.1-amzn-7 | 3.7.1-amzn-7 | 3.7.1-amzn-7 | 3.7.1-amzn-7 | 
| Iceberg |  -  |  -  |  -  |  -  | 
| JupyterEnterpriseGateway |  -  |  -  |  -  |  -  | 
| JupyterHub |  -  |  -  |  -  |  -  | 
| Livy |  -  |  -  |  -  |  -  | 
| MXNet |  -  |  -  |  -  |  -  | 
| Mahout | 0.12.2 | 0.12.2 | 0.12.2 | 0.12.2 | 
| Oozie |  -  |  -  |  -  |  -  | 
| Oozie-Sandbox | 4.2.0 | 4.2.0 | 4.2.0 | 4.2.0 | 
| Phoenix | 4.7.0--1.2 HBase | 4.7.0--1.2 HBase | 4.7.0--1.2 HBase | 4.7.0--1.2 HBase | 
| Pig | 0.14.0-amzn-0 | 0.14.0-amzn-0 | 0.14.0-amzn-0 | 0.14.0-amzn-0 | 
| Presto |  -  |  -  |  -  |  -  | 
| Presto-Sandbox | 0.157.1 | 0.157.1 | 0.152.3 | 0.151 | 
| Spark | 1.6.3 | 1.6.3 | 1.6.2 | 1.6.2 | 
| Sqoop |  -  |  -  |  -  |  -  | 
| Sqoop-Sandbox | 1.4.6 | 1.4.6 | 1.4.6 | 1.4.6 | 
| TensorFlow |  -  |  -  |  -  |  -  | 
| Tez | 0.8.4 | 0.8.4 | 0.8.4 | 0.8.4 | 
| Trino (PrestoSQL) |  -  |  -  |  -  |  -  | 
| Zeppelin |  -  |  -  |  -  |  -  | 
| Zeppelin-Sandbox | 0.6.1 | 0.6.1 | 0.6.1 | 0.6.1 | 
| ZooKeeper |  -  |  -  |  -  |  -  | 
| ZooKeeper-Sandbox | 3.4.9 | 3.4.9 | 3.4.8 | 3.4.8 | 

## 4.8.4 发布说明
<a name="emr-484-relnotes"></a>

以下发布说明包括有关 Amazon EMR 发行版 4.8.4 的信息。更改与 Amazon EMR 4.8.3 发行版有关。

发布日期：2017 年 2 月 7 日

此版本略微进行了一些改动、错误修复和增强。

## 4.8.4 组件版本
<a name="emr-484-components"></a>

下面列出了 Amazon EMR 随此发行版一起安装的组件。一些组件作为大数据应用程序包的一部分安装。其它组件是 Amazon EMR 独有的，并且已为系统流程和功能安装这些组件。它们通常以 `emr` 或 `aws` 开头。最新的 Amazon EMR 发行版中的大数据应用程序包通常是在社区中找到的最新版本。我们会尽快在 Amazon EMR 中提供社区发行版。

Amazon EMR 中的某些组件与社区版本不同。这些组件具有以下形式的 `CommunityVersion-amzn-EmrVersion` 的发行版标注。`EmrVersion` 从 0 开始。例如，假设已对名为 `myapp-component` 的版本 2.2 的开源社区组件进行三次修改，以包含在不同的 Amazon EMR 发行版中，则其发行版将为 `2.2-amzn-2`。


| 组件 | 版本 | 说明 | 
| --- | --- | --- | 
| emr-ddb | 4.2.0 | 适用于 Hadoop 生态系统应用程序的 Amazon DynamoDB 连接器。 | 
| emr-goodies | 2.2.0 | 适用于 Hadoop 生态系统的方便易用的库。 | 
| emr-kinesis | 3.2.0 | 适用于 Hadoop 生态系统应用程序的 Amazon Kinesis 连接器。 | 
| emr-s3-dist-cp | 2.4.0 | 针对 Amazon S3 优化的分布式复制应用程序。 | 
| emrfs | emrfs | 适用于 Hadoop 生态系统应用程序的 Amazon S3 连接器。 | 
| ganglia-monitor | 3.7.2 | 适用于 Hadoop 生态系统应用程序的嵌入式 Ganglia 代理以及 Ganglia 监控代理。 | 
| ganglia-metadata-collector | 3.7.2 | 用于从 Ganglia 监控代理中聚合指标的 Ganglia 元数据收集器。 | 
| ganglia-web | 3.7.1 | 用于查看由 Ganglia 元数据收集器收集的指标的 Web 应用程序。 | 
| hadoop-client | 2.7.3-amzn-1 | Hadoop 命令行客户端，如“hdfs”、“hadoop”或“yarn”。 | 
| hadoop-hdfs-datanode | 2.7.3-amzn-1 | 用于存储数据块的 HDFS 节点级服务。 | 
| hadoop-hdfs-library | 2.7.3-amzn-1 | HDFS 命令行客户端和库 | 
| hadoop-hdfs-namenode | 2.7.3-amzn-1 | 用于跟踪文件名和数据块位置的 HDFS 服务。 | 
| hadoop-httpfs-server | 2.7.3-amzn-1 | 用于 HDFS 操作的 HTTP 终端节点。 | 
| hadoop-kms-server | 2.7.3-amzn-1 | 基于 Hadoop 的 API 的加密密钥管理服务器。 KeyProvider  | 
| hadoop-mapred | 2.7.3-amzn-1 | MapReduce 用于运行 MapReduce 应用程序的执行引擎库。 | 
| hadoop-yarn-nodemanager | 2.7.3-amzn-1 | 用于管理单个节点上的容器的 YARN 服务。 | 
| hadoop-yarn-resourcemanager | 2.7.3-amzn-1 | 用于分配和管理集群资源与分布式应用程序的 YARN 服务。 | 
| hadoop-yarn-timeline-server | 2.7.3-amzn-1 | 用于检索 YARN 应用程序的当前信息和历史信息的服务。 | 
| hbase-hmaster | 1.2.2 | 为负责协调区域和执行管理命令的 HBase 集群提供服务。 | 
| hbase-region-server | 1.2.2 | 为一个或多个 HBase 地区提供服务的服务。 | 
| hbase-client | 1.2.2 | HBase 命令行客户端。 | 
| hbase-rest-server | 1.2.2 | 为提供 RESTful HTTP 端点的服务 HBase。 | 
| hbase-thrift-server | 1.2.2 | 为其提供 Thrift 端点的 HBase服务。 | 
| hcatalog-client | 1.0.0-amzn-8 | 用于操作 hcatalog-server 的“hcat”命令行客户端。 | 
| hcatalog-server | 1.0.0-amzn-8 | 提供服务 HCatalog，为分布式应用程序提供表和存储管理层。 | 
| hcatalog-webhcat-server | 1.0.0-amzn-8 | 为其提供 REST 接口的 HTTP 端点 HCatalog。 | 
| hive-client | 1.0.0-amzn-8 | Hive 命令行客户端。 | 
| hive-metastore-server | 1.0.0-amzn-8 | 用于访问 Hive 元存储 (一个用于存储 Hadoop 操作中的 SQL 的元数据的语义存储库) 的服务。 | 
| hive-server | 1.0.0-amzn-8 | 用于将 Hive 查询作为 Web 请求接受的服务。 | 
| hue-server | 3.7.1-amzn-7 | 用于使用 Hadoop 生态系统应用程序分析数据的 Web 应用程序 | 
| mahout-client | 0.12.2 | 用于机器学习的库。 | 
| mysql-server | 5.5.54\$1 | MySQL 数据库服务器。 | 
| oozie-client | 4.2.0 | Oozie 命令行客户端。 | 
| oozie-server | 4.2.0 | 用于接受 Oozie 工作流请求的服务。 | 
| phoenix-library | 4.7.0--1.2 HBase | 服务器和客户端的 phoenix 库 | 
| phoenix-query-server | 4.7.0--1.2 HBase | 向 Avatica API 提供 JDBC 访问权限以及协议缓冲区和 JSON 格式访问权限的轻量级服务器  | 
| presto-coordinator | 0.157.1 | 用于在 presto-worker 之中接受查询并管理查询的服务。 | 
| presto-worker | 0.157.1 | 用于执行查询的各个部分的服务。 | 
| pig-client | 0.14.0-amzn-0 | Pig 命令行客户端。 | 
| spark-client | 1.6.3 | Spark 命令行客户端。 | 
| spark-history-server | 1.6.3 | 用于查看完整的 Spark 应用程序的生命周期的已记录事件的 Web UI。 | 
| spark-on-yarn | 1.6.3 | 适用于 YARN 的内存中执行引擎。 | 
| spark-yarn-slave | 1.6.3 | YARN 从属项所需的 Apache Spark 库。 | 
| sqoop-client | 1.4.6 | Apache Sqoop 命令行客户端。 | 
| tez-on-yarn | 0.8.4 | tez YARN 应用程序和库。 | 
| webserver | 2.4.25\$1 | Apache HTTP 服务器。 | 
| zeppelin-server | 0.6.1 | 支持交互式数据分析的基于 Web 的 Notebook。 | 
| zookeeper-server | 3.4.9 | 用于维护配置信息、命名、提供分布式同步以及提供组服务的集中式服务。 | 
| zookeeper-client | 3.4.9 | ZooKeeper 命令行客户端。 | 

## 4.8.4 配置分类
<a name="emr-484-class"></a>

配置分类允许您自定义应用程序。这些通常与应用程序的配置 XML 文件（例如 `hive-site.xml`）相对应。有关更多信息，请参阅[配置应用程序](emr-configure-apps.md)。


**emr-4.8.4 分类**  

| 分类 | 说明 | 
| --- | --- | 
| capacity-scheduler | 更改 Hadoop 的 capacity-scheduler.xml 文件中的值。 | 
| core-site | 更改 Hadoop 的 core-site.xml 文件中的值。 | 
| emrfs-site | 更改 EMRFS 设置。 | 
| hadoop-env | 更改适用于所有 Hadoop 组件的 Hadoop 环境中的值。 | 
| hadoop-log4j | 更改 Hadoop 的 log4j.properties 文件中的值。 | 
| hadoop-ssl-server | 更改 hadoop ssl 服务器配置 | 
| hadoop-ssl-client | 更改 hadoop ssl 客户端配置 | 
| hbase-env | 更改环境 HBase中的值。 | 
| hbase-log4j | 更改 hbase- HBase log4j.properties 文件中的值。 | 
| hbase-metrics | 更改 hadoop-metrics2-hb HBase aase.properties 文件中的值。 | 
| hbase-policy | 更改 hbase-policy.xml 文件 HBase中的值。 | 
| hbase-site | 更改 HBase的 hbase-site.xml 文件中的值。 | 
| hdfs-encryption-zones | 配置 HDFS 加密区域。 | 
| hdfs-site | 更改 HDFS 的 hdfs-site.xml 中的值。 | 
| hcatalog-env | 更改环境 HCatalog中的值。 | 
| hcatalog-server-jndi | 更改 HCatalog的 jndi.properties 中的值。 | 
| hcatalog-server-proto-hive-site | 更改 proto-hive-site .x HCatalog ml 中的值。 | 
| hcatalog-webhcat-env | 更改 HCatalog Web 环境HCat中的值。 | 
| hcatalog-webhcat-log4j | 更改 HCatalog Web HCat 的 log4j.properties 中的值。 | 
| hcatalog-webhcat-site | 更改 HCatalog Web HCat 的 webhcat-site.xml 文件中的值。 | 
| hive-env | 更改 Hive 环境中的值。 | 
| hive-exec-log4j | 更改 Hive 的 hive-exec-log 4j.properties 文件中的值。 | 
| hive-log4j | 更改 Hive 的 hive-log4j.properties 文件中的值。 | 
| hive-site | 更改 Hive 的 hive-site.xml 文件中的值 | 
| hiveserver2-site | 更改 Hive Server2 的 hiveserver2-site.xml 文件中的值 | 
| hue-ini | 更改 Hue 的 ini 文件中的值 | 
| httpfs-env | 更改 HTTPFS 环境中的值。 | 
| httpfs-site | 更改 Hadoop 的 httpfs-site.xml 文件中的值。 | 
| hadoop-kms-acls | 更改 Hadoop 的 kms-acls.xml 文件中的值。 | 
| hadoop-kms-env | 更改 Hadoop KMS 环境中的值。 | 
| hadoop-kms-log4j | 更改 Hadoop 的 kms-log4j.properties 文件中的值。 | 
| hadoop-kms-site | 更改 Hadoop 的 kms-site.xml 文件中的值。 | 
| mapred-env | 更改 MapReduce 应用程序环境中的值。 | 
| mapred-site | 更改 MapReduce 应用程序的 mapred-site.xml 文件中的值。 | 
| oozie-env | 更改 Oozie 的环境中的值。 | 
| oozie-log4j | 更改 Oozie 的 oozie-log4j.properties 文件中的值。 | 
| oozie-site | 更改 Oozie 的 oozie-site.xml 文件中的值。 | 
| phoenix-hbase-metrics | 更改 Phoenix 的 hadoop-metrics2-hbase.properties 文件中的值。 | 
| phoenix-hbase-site | 更改 Phoenix 的 hbase-site.xml 文件中的值。 | 
| phoenix-log4j | 更改 Phoenix 的 log4j.properties 文件中的值。 | 
| phoenix-metrics | 更改 Phoenix 的 hadoop-metrics2-phoenix.properties 文件中的值。 | 
| pig-properties | 更改 Pig 的 pig.properties 文件中的值。 | 
| pig-log4j | 更改 Pig 的 log4j.properties 文件中的值。 | 
| presto-log | 更改 Presto 的 log.properties 文件中的值。 | 
| presto-config | 更改 Presto 的 config.properties 文件中的值。 | 
| presto-connector-blackhole | 更改 Presto 的 blackhole.properties 文件中的值。 | 
| presto-connector-cassandra | 更改 Presto 的 cassandra.properties 文件中的值。 | 
| presto-connector-hive | 更改 Presto 的 hive.properties 文件中的值。 | 
| presto-connector-jmx | 更改 Presto 的 jmx.properties 文件中的值。 | 
| presto-connector-kafka | 更改 Presto 的 kafka.properties 文件中的值。 | 
| presto-connector-localfile | 更改 Presto 的 localfile.properties 文件中的值。 | 
| presto-connector-mongodb | 更改 Presto 的 mongodb.properties 文件中的值。 | 
| presto-connector-mysql | 更改 Presto 的 mysql.properties 文件中的值。 | 
| presto-connector-postgresql | 更改 Presto 的 postgresql.properties 文件中的值。 | 
| presto-connector-raptor | 更改 Presto 的 raptor.properties 文件中的值。 | 
| presto-connector-redis | 更改 Presto 的 redis.properties 文件中的值。 | 
| presto-connector-tpch | 更改 Presto 的 tpch.properties 文件中的值。 | 
| spark | 适用于 Apache Spark 的 Amazon EMR 辅助设置。 | 
| spark-defaults | 更改 Spark 的 spark-defaults.conf 文件中的值。 | 
| spark-env | 更改 Spark 环境中的值。 | 
| spark-log4j | 更改 Spark 的 log4j.properties 文件中的值。 | 
| spark-metrics | 更改 Spark 的 metrics.properties 文件中的值。 | 
| sqoop-env | 更改 Sqoop 的环境中的值。 | 
| sqoop-oraoop-site | 更改 Sqoop OraOop 的 oraoop-site.xml 文件中的值。 | 
| sqoop-site | 更改 Sqoop 的 sqoop-site.xml 文件中的值。 | 
| tez-site | 更改 Tez 的 tez-site.xml 文件中的值。 | 
| yarn-env | 更改 YARN 环境中的值。 | 
| yarn-site | 更改 YARN 的 yarn-site.xml 文件中的值。 | 
| zeppelin-env | 更改 Zeppelin 环境中的值。 | 
| zookeeper-config | 更改 ZooKeeper的 zoo.cfg 文件中的值。 | 
| zookeeper-log4j | 更改 ZooKeeper的 log4j.properties 文件中的值。 | 

# Amazon EMR 发行版 4.8.3
<a name="emr-483-release"></a>

## 4.8.3 应用程序版本
<a name="emr-483-app-versions"></a>

此版本包括以下应用程序：[http://ganglia.info](http://ganglia.info)、[http://hbase.apache.org/](http://hbase.apache.org/)、[https://cwiki.apache.org/confluence/display/Hive/HCatalog](https://cwiki.apache.org/confluence/display/Hive/HCatalog)、[http://hadoop.apache.org/docs/current/](http://hadoop.apache.org/docs/current/)、[http://hive.apache.org/](http://hive.apache.org/)、[http://gethue.com/](http://gethue.com/)、[http://mahout.apache.org/](http://mahout.apache.org/)、[http://oozie.apache.org/](http://oozie.apache.org/)、[https://phoenix.apache.org/](https://phoenix.apache.org/)、[http://pig.apache.org/](http://pig.apache.org/)、[https://prestodb.io/](https://prestodb.io/)、[https://spark.apache.org/docs/latest/](https://spark.apache.org/docs/latest/)、[http://sqoop.apache.org/](http://sqoop.apache.org/)、[https://tez.apache.org/](https://tez.apache.org/)、[https://zeppelin.incubator.apache.org/](https://zeppelin.incubator.apache.org/) 和 [https://zookeeper.apache.org](https://zookeeper.apache.org)。

下表列出了此版本的 Amazon EMR 中提供的应用程序版本以及前三个 Amazon EMR 发行版中的应用程序版本（若适用）。

有关每个发行版的 Amazon EMR 的应用程序版本的全面历史记录，请参见以下主题：
+ [Amazon EMR 7.x 发行版中的应用程序版本](emr-release-app-versions-7.x.md)
+ [Amazon EMR 6.x 发行版中的应用程序版本](emr-release-app-versions-6.x.md)
+ [Amazon EMR 5.x 发行版中的应用程序版本](emr-release-app-versions-5.x.md)
+ [Amazon EMR 4.x 发行版中的应用程序版本](emr-release-app-versions-4.x.md)


**应用程序版本信息**  

|  | emr-4.8.3 | emr-4.8.2 | emr-4.8.1 | emr-4.8.0 | 
| --- | --- | --- | --- | --- | 
| AWS 适用于 Java 的 SDK | 1.10.75 | 1.10.75 | 1.10.75 | 1.10.75 | 
| Python | 未跟踪 | 未跟踪 | 未跟踪 | 未跟踪 | 
| Scala | 未跟踪 | 未跟踪 | 未跟踪 | 未跟踪 | 
| AmazonCloudWatchAgent |  -  |  -  |  -  |  -  | 
| Delta |  -  |  -  |  -  |  -  | 
| Flink |  -  |  -  |  -  |  -  | 
| Ganglia | 3.7.2 | 3.7.2 | 3.7.2 | 3.7.2 | 
| HBase | 1.2.2 | 1.2.2 | 1.2.2 | 1.2.2 | 
| HCatalog | 1.0.0-amzn-8 | 1.0.0-amzn-7 | 1.0.0-amzn-7 | 1.0.0-amzn-7 | 
| Hadoop | 2.7.3-amzn-1 | 2.7.3-amzn-0 | 2.7.2-amzn-4 | 2.7.2-amzn-4 | 
| Hive | 1.0.0-amzn-8 | 1.0.0-amzn-7 | 1.0.0-amzn-7 | 1.0.0-amzn-7 | 
| Hudi |  -  |  -  |  -  |  -  | 
| Hue | 3.7.1-amzn-7 | 3.7.1-amzn-7 | 3.7.1-amzn-7 | 3.7.1-amzn-7 | 
| Iceberg |  -  |  -  |  -  |  -  | 
| JupyterEnterpriseGateway |  -  |  -  |  -  |  -  | 
| JupyterHub |  -  |  -  |  -  |  -  | 
| Livy |  -  |  -  |  -  |  -  | 
| MXNet |  -  |  -  |  -  |  -  | 
| Mahout | 0.12.2 | 0.12.2 | 0.12.2 | 0.12.2 | 
| Oozie |  -  |  -  |  -  |  -  | 
| Oozie-Sandbox | 4.2.0 | 4.2.0 | 4.2.0 | 4.2.0 | 
| Phoenix | 4.7.0--1.2 HBase | 4.7.0--1.2 HBase | 4.7.0--1.2 HBase | 4.7.0--1.2 HBase | 
| Pig | 0.14.0-amzn-0 | 0.14.0-amzn-0 | 0.14.0-amzn-0 | 0.14.0-amzn-0 | 
| Presto |  -  |  -  |  -  |  -  | 
| Presto-Sandbox | 0.157.1 | 0.152.3 | 0.151 | 0.151 | 
| Spark | 1.6.3 | 1.6.2 | 1.6.2 | 1.6.2 | 
| Sqoop |  -  |  -  |  -  |  -  | 
| Sqoop-Sandbox | 1.4.6 | 1.4.6 | 1.4.6 | 1.4.6 | 
| TensorFlow |  -  |  -  |  -  |  -  | 
| Tez | 0.8.4 | 0.8.4 | 0.8.4 | 0.8.4 | 
| Trino (PrestoSQL) |  -  |  -  |  -  |  -  | 
| Zeppelin |  -  |  -  |  -  |  -  | 
| Zeppelin-Sandbox | 0.6.1 | 0.6.1 | 0.6.1 | 0.6.1 | 
| ZooKeeper |  -  |  -  |  -  |  -  | 
| ZooKeeper-Sandbox | 3.4.9 | 3.4.8 | 3.4.8 | 3.4.8 | 

## 4.8.3 发布说明
<a name="emr-483-relnotes"></a>

以下发布说明包括有关 Amazon EMR 发行版 4.8.3 的信息。更改与 Amazon EMR 4.8.2 发行版有关。

发布日期：2016 年 12 月 29 日

**升级**
+ 已升级到 Presto 0.157.1。有关更多信息，请参阅 Presto 文档中的 [Presto 发布说明](https://prestodb.io/docs/current/release/release-0.157.1.html)。
+ 已升级到 Spark 1.6.3。有关更多信息，请参阅 Apache Spark 文档中的 [Spark 发布说明](http://spark.apache.org/releases/spark-release-1-6-3.html)。
+ 已升级到 ZooKeeper 3.4.9。有关更多信息，请参阅 Apache ZooKeeper 文档中的[ZooKeeper发行说明](https://zookeeper.apache.org/doc/r3.4.9/releasenotes.html)。

**更改和增强功能**
+ 在亚马逊 EMR 版本 EC2 4.8.3 及更高版本中增加了对亚马逊 m4.16xlarge 实例类型的支持，不包括 5.0.0、5.0.3 和 5.2.0。
+ Amazon EMR 发行版现在基于 Amazon Linux 2016.09。有关更多信息，请参阅[https://aws.amazon.com/amazon-linux-ami/2016.09-release-notes/](https://aws.amazon.com/amazon-linux-ami/2016.09-release-notes/)。

**早期版本中已解决的已知问题**
+ 修复了 Hadoop 中的一个问题，即由于在大型集群中复制和删除同一文件之间存在竞争， ReplicationMonitor 线程可能会长时间卡住。
+ 修复了任务状态未成功更新时 ControlledJob \$1toString 因空指针异常 (NPE) 而失败的问题。

## 4.8.3 组件版本
<a name="emr-483-components"></a>

下面列出了 Amazon EMR 随此发行版一起安装的组件。一些组件作为大数据应用程序包的一部分安装。其它组件是 Amazon EMR 独有的，并且已为系统流程和功能安装这些组件。它们通常以 `emr` 或 `aws` 开头。最新的 Amazon EMR 发行版中的大数据应用程序包通常是在社区中找到的最新版本。我们会尽快在 Amazon EMR 中提供社区发行版。

Amazon EMR 中的某些组件与社区版本不同。这些组件具有以下形式的 `CommunityVersion-amzn-EmrVersion` 的发行版标注。`EmrVersion` 从 0 开始。例如，假设已对名为 `myapp-component` 的版本 2.2 的开源社区组件进行三次修改，以包含在不同的 Amazon EMR 发行版中，则其发行版将为 `2.2-amzn-2`。


| 组件 | 版本 | 说明 | 
| --- | --- | --- | 
| emr-ddb | 4.2.0 | 适用于 Hadoop 生态系统应用程序的 Amazon DynamoDB 连接器。 | 
| emr-goodies | 2.2.0 | 适用于 Hadoop 生态系统的方便易用的库。 | 
| emr-kinesis | 3.2.0 | 适用于 Hadoop 生态系统应用程序的 Amazon Kinesis 连接器。 | 
| emr-s3-dist-cp | 2.4.0 | 针对 Amazon S3 优化的分布式复制应用程序。 | 
| emrfs | 2.13.0 | 适用于 Hadoop 生态系统应用程序的 Amazon S3 连接器。 | 
| ganglia-monitor | 3.7.2 | 适用于 Hadoop 生态系统应用程序的嵌入式 Ganglia 代理以及 Ganglia 监控代理。 | 
| ganglia-metadata-collector | 3.7.2 | 用于从 Ganglia 监控代理中聚合指标的 Ganglia 元数据收集器。 | 
| ganglia-web | 3.7.1 | 用于查看由 Ganglia 元数据收集器收集的指标的 Web 应用程序。 | 
| hadoop-client | 2.7.3-amzn-1 | Hadoop 命令行客户端，如“hdfs”、“hadoop”或“yarn”。 | 
| hadoop-hdfs-datanode | 2.7.3-amzn-1 | 用于存储数据块的 HDFS 节点级服务。 | 
| hadoop-hdfs-library | 2.7.3-amzn-1 | HDFS 命令行客户端和库 | 
| hadoop-hdfs-namenode | 2.7.3-amzn-1 | 用于跟踪文件名和数据块位置的 HDFS 服务。 | 
| hadoop-httpfs-server | 2.7.3-amzn-1 | 用于 HDFS 操作的 HTTP 终端节点。 | 
| hadoop-kms-server | 2.7.3-amzn-1 | 基于 Hadoop 的 API 的加密密钥管理服务器。 KeyProvider  | 
| hadoop-mapred | 2.7.3-amzn-1 | MapReduce 用于运行 MapReduce 应用程序的执行引擎库。 | 
| hadoop-yarn-nodemanager | 2.7.3-amzn-1 | 用于管理单个节点上的容器的 YARN 服务。 | 
| hadoop-yarn-resourcemanager | 2.7.3-amzn-1 | 用于分配和管理集群资源与分布式应用程序的 YARN 服务。 | 
| hadoop-yarn-timeline-server | 2.7.3-amzn-1 | 用于检索 YARN 应用程序的当前信息和历史信息的服务。 | 
| hbase-hmaster | 1.2.2 | 为负责协调区域和执行管理命令的 HBase 集群提供服务。 | 
| hbase-region-server | 1.2.2 | 为一个或多个 HBase 地区提供服务的服务。 | 
| hbase-client | 1.2.2 | HBase 命令行客户端。 | 
| hbase-rest-server | 1.2.2 | 为提供 RESTful HTTP 端点的服务 HBase。 | 
| hbase-thrift-server | 1.2.2 | 为其提供 Thrift 端点的 HBase服务。 | 
| hcatalog-client | 1.0.0-amzn-8 | 用于操作 hcatalog-server 的“hcat”命令行客户端。 | 
| hcatalog-server | 1.0.0-amzn-8 | 提供服务 HCatalog，为分布式应用程序提供表和存储管理层。 | 
| hcatalog-webhcat-server | 1.0.0-amzn-8 | 为其提供 REST 接口的 HTTP 端点 HCatalog。 | 
| hive-client | 1.0.0-amzn-8 | Hive 命令行客户端。 | 
| hive-metastore-server | 1.0.0-amzn-8 | 用于访问 Hive 元存储 (一个用于存储 Hadoop 操作中的 SQL 的元数据的语义存储库) 的服务。 | 
| hive-server | 1.0.0-amzn-8 | 用于将 Hive 查询作为 Web 请求接受的服务。 | 
| hue-server | 3.7.1-amzn-7 | 用于使用 Hadoop 生态系统应用程序分析数据的 Web 应用程序 | 
| mahout-client | 0.12.2 | 用于机器学习的库。 | 
| mysql-server | 5.5.52 | MySQL 数据库服务器。 | 
| oozie-client | 4.2.0 | Oozie 命令行客户端。 | 
| oozie-server | 4.2.0 | 用于接受 Oozie 工作流请求的服务。 | 
| phoenix-library | 4.7.0--1.2 HBase | 服务器和客户端的 phoenix 库 | 
| phoenix-query-server | 4.7.0--1.2 HBase | 向 Avatica API 提供 JDBC 访问权限以及协议缓冲区和 JSON 格式访问权限的轻量级服务器  | 
| presto-coordinator | 0.157.1 | 用于在 presto-worker 之中接受查询并管理查询的服务。 | 
| presto-worker | 0.157.1 | 用于执行查询的各个部分的服务。 | 
| pig-client | 0.14.0-amzn-0 | Pig 命令行客户端。 | 
| spark-client | 1.6.3 | Spark 命令行客户端。 | 
| spark-history-server | 1.6.3 | 用于查看完整的 Spark 应用程序的生命周期的已记录事件的 Web UI。 | 
| spark-on-yarn | 1.6.3 | 适用于 YARN 的内存中执行引擎。 | 
| spark-yarn-slave | 1.6.3 | YARN 从属项所需的 Apache Spark 库。 | 
| sqoop-client | 1.4.6 | Apache Sqoop 命令行客户端。 | 
| tez-on-yarn | 0.8.4 | tez YARN 应用程序和库。 | 
| webserver | 2.4.23 | Apache HTTP 服务器。 | 
| zeppelin-server | 0.6.1 | 支持交互式数据分析的基于 Web 的 Notebook。 | 
| zookeeper-server | 3.4.9 | 用于维护配置信息、命名、提供分布式同步以及提供组服务的集中式服务。 | 
| zookeeper-client | 3.4.9 | ZooKeeper 命令行客户端。 | 

## 4.8.3 配置分类
<a name="emr-483-class"></a>

配置分类允许您自定义应用程序。这些通常与应用程序的配置 XML 文件（例如 `hive-site.xml`）相对应。有关更多信息，请参阅[配置应用程序](emr-configure-apps.md)。


**emr-4.8.3 分类**  

| 分类 | 说明 | 
| --- | --- | 
| capacity-scheduler | 更改 Hadoop 的 capacity-scheduler.xml 文件中的值。 | 
| core-site | 更改 Hadoop 的 core-site.xml 文件中的值。 | 
| emrfs-site | 更改 EMRFS 设置。 | 
| hadoop-env | 更改适用于所有 Hadoop 组件的 Hadoop 环境中的值。 | 
| hadoop-log4j | 更改 Hadoop 的 log4j.properties 文件中的值。 | 
| hadoop-ssl-server | 更改 hadoop ssl 服务器配置 | 
| hadoop-ssl-client | 更改 hadoop ssl 客户端配置 | 
| hbase-env | 更改环境 HBase中的值。 | 
| hbase-log4j | 更改 hbase- HBase log4j.properties 文件中的值。 | 
| hbase-metrics | 更改 hadoop-metrics2-hb HBase aase.properties 文件中的值。 | 
| hbase-policy | 更改 hbase-policy.xml 文件 HBase中的值。 | 
| hbase-site | 更改 hbase-site.xml 文件 HBase中的值。 | 
| hdfs-encryption-zones | 配置 HDFS 加密区域。 | 
| hdfs-site | 更改 HDFS 的 hdfs-site.xml 中的值。 | 
| hcatalog-env | 更改环境 HCatalog中的值。 | 
| hcatalog-server-jndi | 更改 HCatalog的 jndi.properties 中的值。 | 
| hcatalog-server-proto-hive-site | 更改 proto-hive-site .x HCatalog ml 中的值。 | 
| hcatalog-webhcat-env | 更改 HCatalog Web 环境HCat中的值。 | 
| hcatalog-webhcat-log4j | 更改 HCatalog Web HCat 的 log4j.properties 中的值。 | 
| hcatalog-webhcat-site | 更改 HCatalog Web HCat 的 webhcat-site.xml 文件中的值。 | 
| hive-env | 更改 Hive 环境中的值。 | 
| hive-exec-log4j | 更改 Hive 的 hive-exec-log 4j.properties 文件中的值。 | 
| hive-log4j | 更改 Hive 的 hive-log4j.properties 文件中的值。 | 
| hive-site | 更改 Hive 的 hive-site.xml 文件中的值 | 
| hiveserver2-site | 更改 Hive Server2 的 hiveserver2-site.xml 文件中的值 | 
| hue-ini | 更改 Hue 的 ini 文件中的值 | 
| httpfs-env | 更改 HTTPFS 环境中的值。 | 
| httpfs-site | 更改 Hadoop 的 httpfs-site.xml 文件中的值。 | 
| hadoop-kms-acls | 更改 Hadoop 的 kms-acls.xml 文件中的值。 | 
| hadoop-kms-env | 更改 Hadoop KMS 环境中的值。 | 
| hadoop-kms-log4j | 更改 Hadoop 的 kms-log4j.properties 文件中的值。 | 
| hadoop-kms-site | 更改 Hadoop 的 kms-site.xml 文件中的值。 | 
| mapred-env | 更改 MapReduce 应用程序环境中的值。 | 
| mapred-site | 更改 MapReduce 应用程序的 mapred-site.xml 文件中的值。 | 
| oozie-env | 更改 Oozie 的环境中的值。 | 
| oozie-log4j | 更改 Oozie 的 oozie-log4j.properties 文件中的值。 | 
| oozie-site | 更改 Oozie 的 oozie-site.xml 文件中的值。 | 
| phoenix-hbase-metrics | 更改 Phoenix 的 hadoop-metrics2-hbase.properties 文件中的值。 | 
| phoenix-hbase-site | 更改 Phoenix 的 hbase-site.xml 文件中的值。 | 
| phoenix-log4j | 更改 Phoenix 的 log4j.properties 文件中的值。 | 
| phoenix-metrics | 更改 Phoenix 的 hadoop-metrics2-phoenix.properties 文件中的值。 | 
| pig-properties | 更改 Pig 的 pig.properties 文件中的值。 | 
| pig-log4j | 更改 Pig 的 log4j.properties 文件中的值。 | 
| presto-log | 更改 Presto 的 log.properties 文件中的值。 | 
| presto-config | 更改 Presto 的 config.properties 文件中的值。 | 
| presto-connector-blackhole | 更改 Presto 的 blackhole.properties 文件中的值。 | 
| presto-connector-cassandra | 更改 Presto 的 cassandra.properties 文件中的值。 | 
| presto-connector-hive | 更改 Presto 的 hive.properties 文件中的值。 | 
| presto-connector-jmx | 更改 Presto 的 jmx.properties 文件中的值。 | 
| presto-connector-kafka | 更改 Presto 的 kafka.properties 文件中的值。 | 
| presto-connector-localfile | 更改 Presto 的 localfile.properties 文件中的值。 | 
| presto-connector-mongodb | 更改 Presto 的 mongodb.properties 文件中的值。 | 
| presto-connector-mysql | 更改 Presto 的 mysql.properties 文件中的值。 | 
| presto-connector-postgresql | 更改 Presto 的 postgresql.properties 文件中的值。 | 
| presto-connector-raptor | 更改 Presto 的 raptor.properties 文件中的值。 | 
| presto-connector-redis | 更改 Presto 的 redis.properties 文件中的值。 | 
| presto-connector-tpch | 更改 Presto 的 tpch.properties 文件中的值。 | 
| spark | 适用于 Apache Spark 的 Amazon EMR 辅助设置。 | 
| spark-defaults | 更改 Spark 的 spark-defaults.conf 文件中的值。 | 
| spark-env | 更改 Spark 环境中的值。 | 
| spark-log4j | 更改 Spark 的 log4j.properties 文件中的值。 | 
| spark-metrics | 更改 Spark 的 metrics.properties 文件中的值。 | 
| sqoop-env | 更改 Sqoop 的环境中的值。 | 
| sqoop-oraoop-site | 更改 Sqoop OraOop 的 oraoop-site.xml 文件中的值。 | 
| sqoop-site | 更改 Sqoop 的 sqoop-site.xml 文件中的值。 | 
| tez-site | 更改 Tez 的 tez-site.xml 文件中的值。 | 
| yarn-env | 更改 YARN 环境中的值。 | 
| yarn-site | 更改 YARN 的 yarn-site.xml 文件中的值。 | 
| zeppelin-env | 更改 Zeppelin 环境中的值。 | 
| zookeeper-config | 更改 ZooKeeper的 zoo.cfg 文件中的值。 | 
| zookeeper-log4j | 更改 ZooKeeper的 log4j.properties 文件中的值。 | 

# Amazon EMR 发行版 4.8.2
<a name="emr-482-release"></a>

## 4.8.2 应用程序版本
<a name="emr-482-app-versions"></a>

此版本包括以下应用程序：[http://ganglia.info](http://ganglia.info)、[http://hbase.apache.org/](http://hbase.apache.org/)、[https://cwiki.apache.org/confluence/display/Hive/HCatalog](https://cwiki.apache.org/confluence/display/Hive/HCatalog)、[http://hadoop.apache.org/docs/current/](http://hadoop.apache.org/docs/current/)、[http://hive.apache.org/](http://hive.apache.org/)、[http://gethue.com/](http://gethue.com/)、[http://mahout.apache.org/](http://mahout.apache.org/)、[http://oozie.apache.org/](http://oozie.apache.org/)、[https://phoenix.apache.org/](https://phoenix.apache.org/)、[http://pig.apache.org/](http://pig.apache.org/)、[https://prestodb.io/](https://prestodb.io/)、[https://spark.apache.org/docs/latest/](https://spark.apache.org/docs/latest/)、[http://sqoop.apache.org/](http://sqoop.apache.org/)、[https://tez.apache.org/](https://tez.apache.org/)、[https://zeppelin.incubator.apache.org/](https://zeppelin.incubator.apache.org/) 和 [https://zookeeper.apache.org](https://zookeeper.apache.org)。

下表列出了此版本的 Amazon EMR 中提供的应用程序版本以及前三个 Amazon EMR 发行版中的应用程序版本（若适用）。

有关每个发行版的 Amazon EMR 的应用程序版本的全面历史记录，请参见以下主题：
+ [Amazon EMR 7.x 发行版中的应用程序版本](emr-release-app-versions-7.x.md)
+ [Amazon EMR 6.x 发行版中的应用程序版本](emr-release-app-versions-6.x.md)
+ [Amazon EMR 5.x 发行版中的应用程序版本](emr-release-app-versions-5.x.md)
+ [Amazon EMR 4.x 发行版中的应用程序版本](emr-release-app-versions-4.x.md)


**应用程序版本信息**  

|  | emr-4.8.2 | emr-4.8.1 | emr-4.8.0 | emr-4.7.4 | 
| --- | --- | --- | --- | --- | 
| AWS 适用于 Java 的 SDK | 1.10.75 | 1.10.75 | 1.10.75 | 1.10.75 | 
| Python | 未跟踪 | 未跟踪 | 未跟踪 | 未跟踪 | 
| Scala | 未跟踪 | 未跟踪 | 未跟踪 | 未跟踪 | 
| AmazonCloudWatchAgent |  -  |  -  |  -  |  -  | 
| Delta |  -  |  -  |  -  |  -  | 
| Flink |  -  |  -  |  -  |  -  | 
| Ganglia | 3.7.2 | 3.7.2 | 3.7.2 | 3.7.2 | 
| HBase | 1.2.2 | 1.2.2 | 1.2.2 | 1.2.1 | 
| HCatalog | 1.0.0-amzn-7 | 1.0.0-amzn-7 | 1.0.0-amzn-7 | 1.0.0-amzn-6 | 
| Hadoop | 2.7.3-amzn-0 | 2.7.2-amzn-4 | 2.7.2-amzn-4 | 2.7.2-amzn-3 | 
| Hive | 1.0.0-amzn-7 | 1.0.0-amzn-7 | 1.0.0-amzn-7 | 1.0.0-amzn-6 | 
| Hudi |  -  |  -  |  -  |  -  | 
| Hue | 3.7.1-amzn-7 | 3.7.1-amzn-7 | 3.7.1-amzn-7 | 3.7.1-amzn-7 | 
| Iceberg |  -  |  -  |  -  |  -  | 
| JupyterEnterpriseGateway |  -  |  -  |  -  |  -  | 
| JupyterHub |  -  |  -  |  -  |  -  | 
| Livy |  -  |  -  |  -  |  -  | 
| MXNet |  -  |  -  |  -  |  -  | 
| Mahout | 0.12.2 | 0.12.2 | 0.12.2 | 0.12.2 | 
| Oozie |  -  |  -  |  -  |  -  | 
| Oozie-Sandbox | 4.2.0 | 4.2.0 | 4.2.0 | 4.2.0 | 
| Phoenix | 4.7.0--1.2 HBase | 4.7.0--1.2 HBase | 4.7.0--1.2 HBase | 4.7.0--1.2 HBase | 
| Pig | 0.14.0-amzn-0 | 0.14.0-amzn-0 | 0.14.0-amzn-0 | 0.14.0-amzn-0 | 
| Presto |  -  |  -  |  -  |  -  | 
| Presto-Sandbox | 0.152.3 | 0.151 | 0.151 | 0.148 | 
| Spark | 1.6.2 | 1.6.2 | 1.6.2 | 1.6.2 | 
| Sqoop |  -  |  -  |  -  |  -  | 
| Sqoop-Sandbox | 1.4.6 | 1.4.6 | 1.4.6 | 1.4.6 | 
| TensorFlow |  -  |  -  |  -  |  -  | 
| Tez | 0.8.4 | 0.8.4 | 0.8.4 | 0.8.3 | 
| Trino (PrestoSQL) |  -  |  -  |  -  |  -  | 
| Zeppelin |  -  |  -  |  -  |  -  | 
| Zeppelin-Sandbox | 0.6.1 | 0.6.1 | 0.6.1 | 0.5.6-incubating | 
| ZooKeeper |  -  |  -  |  -  |  -  | 
| ZooKeeper-Sandbox | 3.4.8 | 3.4.8 | 3.4.8 | 3.4.8 | 

## 4.8.2 发布说明
<a name="emr-482-relnotes"></a>

以下发布说明包括有关 Amazon EMR 发行版 4.8.2 的信息。更改与 Amazon EMR 4.8.0 发行版有关。

发布日期：2016 年 10 月 24 日

**升级**
+ 已升级到 Hadoop 2.7.3
+ 已升级到 Presto 0.152.3，它包括对 Presto Web 界面的支持。可使用端口 8889 访问 Presto 协调器上的 Presto Web 界面。有关 Presto Web 界面的更多信息，请参阅 Presto 文档中的 [Web 界面](https://prestodb.io/docs/current/admin/web-interface.html)。
+ Amazon EMR 发行版现在基于 Amazon Linux 2016.09。有关更多信息，请参阅 [https://aws.amazon.com/amazon-linux-ami/2016.09-release-notes/](https://aws.amazon.com/amazon-linux-ami/2016.09-release-notes/)。

## 4.8.2 组件版本
<a name="emr-482-components"></a>

下面列出了 Amazon EMR 随此发行版一起安装的组件。一些组件作为大数据应用程序包的一部分安装。其它组件是 Amazon EMR 独有的，并且已为系统流程和功能安装这些组件。它们通常以 `emr` 或 `aws` 开头。最新的 Amazon EMR 发行版中的大数据应用程序包通常是在社区中找到的最新版本。我们会尽快在 Amazon EMR 中提供社区发行版。

Amazon EMR 中的某些组件与社区版本不同。这些组件具有以下形式的 `CommunityVersion-amzn-EmrVersion` 的发行版标注。`EmrVersion` 从 0 开始。例如，假设已对名为 `myapp-component` 的版本 2.2 的开源社区组件进行三次修改，以包含在不同的 Amazon EMR 发行版中，则其发行版将为 `2.2-amzn-2`。


| 组件 | 版本 | 说明 | 
| --- | --- | --- | 
| emr-ddb | 4.1.0 | 适用于 Hadoop 生态系统应用程序的 Amazon DynamoDB 连接器。 | 
| emr-goodies | 2.1.0 | 适用于 Hadoop 生态系统的方便易用的库。 | 
| emr-kinesis | 3.2.0 | 适用于 Hadoop 生态系统应用程序的 Amazon Kinesis 连接器。 | 
| emr-s3-dist-cp | 2.4.0 | 针对 Amazon S3 优化的分布式复制应用程序。 | 
| emrfs | 2.10.0 | 适用于 Hadoop 生态系统应用程序的 Amazon S3 连接器。 | 
| ganglia-monitor | 3.7.2 | 适用于 Hadoop 生态系统应用程序的嵌入式 Ganglia 代理以及 Ganglia 监控代理。 | 
| ganglia-metadata-collector | 3.7.2 | 用于从 Ganglia 监控代理中聚合指标的 Ganglia 元数据收集器。 | 
| ganglia-web | 3.7.1 | 用于查看由 Ganglia 元数据收集器收集的指标的 Web 应用程序。 | 
| hadoop-client | 2.7.3-amzn-0 | Hadoop 命令行客户端，如“hdfs”、“hadoop”或“yarn”。 | 
| hadoop-hdfs-datanode | 2.7.3-amzn-0 | 用于存储数据块的 HDFS 节点级服务。 | 
| hadoop-hdfs-library | 2.7.3-amzn-0 | HDFS 命令行客户端和库 | 
| hadoop-hdfs-namenode | 2.7.3-amzn-0 | 用于跟踪文件名和数据块位置的 HDFS 服务。 | 
| hadoop-httpfs-server | 2.7.3-amzn-0 | 用于 HDFS 操作的 HTTP 终端节点。 | 
| hadoop-kms-server | 2.7.3-amzn-0 | 基于 Hadoop 的 API 的加密密钥管理服务器。 KeyProvider  | 
| hadoop-mapred | 2.7.3-amzn-0 | MapReduce 用于运行 MapReduce 应用程序的执行引擎库。 | 
| hadoop-yarn-nodemanager | 2.7.3-amzn-0 | 用于管理单个节点上的容器的 YARN 服务。 | 
| hadoop-yarn-resourcemanager | 2.7.3-amzn-0 | 用于分配和管理集群资源与分布式应用程序的 YARN 服务。 | 
| hadoop-yarn-timeline-server | 2.7.3-amzn-0 | 用于检索 YARN 应用程序的当前信息和历史信息的服务。 | 
| hbase-hmaster | 1.2.2 | 为负责协调区域和执行管理命令的 HBase 集群提供服务。 | 
| hbase-region-server | 1.2.2 | 为一个或多个 HBase 地区提供服务的服务。 | 
| hbase-client | 1.2.2 | HBase 命令行客户端。 | 
| hbase-rest-server | 1.2.2 | 为提供 RESTful HTTP 端点的服务 HBase。 | 
| hbase-thrift-server | 1.2.2 | 为其提供 Thrift 端点的 HBase服务。 | 
| hcatalog-client | 1.0.0-amzn-7 | 用于操作 hcatalog-server 的“hcat”命令行客户端。 | 
| hcatalog-server | 1.0.0-amzn-7 | 提供服务 HCatalog，为分布式应用程序提供表和存储管理层。 | 
| hcatalog-webhcat-server | 1.0.0-amzn-7 | 为其提供 REST 接口的 HTTP 端点 HCatalog。 | 
| hive-client | 1.0.0-amzn-7 | Hive 命令行客户端。 | 
| hive-metastore-server | 1.0.0-amzn-7 | 用于访问 Hive 元存储 (一个用于存储 Hadoop 操作中的 SQL 的元数据的语义存储库) 的服务。 | 
| hive-server | 1.0.0-amzn-7 | 用于将 Hive 查询作为 Web 请求接受的服务。 | 
| hue-server | 3.7.1-amzn-7 | 用于使用 Hadoop 生态系统应用程序分析数据的 Web 应用程序 | 
| mahout-client | 0.12.2 | 用于机器学习的库。 | 
| mysql-server | 5.5.52 | MySQL 数据库服务器。 | 
| oozie-client | 4.2.0 | Oozie 命令行客户端。 | 
| oozie-server | 4.2.0 | 用于接受 Oozie 工作流请求的服务。 | 
| phoenix-library | 4.7.0--1.2 HBase | 服务器和客户端的 phoenix 库 | 
| phoenix-query-server | 4.7.0--1.2 HBase | 向 Avatica API 提供 JDBC 访问权限以及协议缓冲区和 JSON 格式访问权限的轻量级服务器  | 
| presto-coordinator | 0.152.3 | 用于在 presto-worker 之中接受查询并管理查询的服务。 | 
| presto-worker | 0.152.3 | 用于执行查询的各个部分的服务。 | 
| pig-client | 0.14.0-amzn-0 | Pig 命令行客户端。 | 
| spark-client | 1.6.2 | Spark 命令行客户端。 | 
| spark-history-server | 1.6.2 | 用于查看完整的 Spark 应用程序的生命周期的已记录事件的 Web UI。 | 
| spark-on-yarn | 1.6.2 | 适用于 YARN 的内存中执行引擎。 | 
| spark-yarn-slave | 1.6.2 | YARN 从属项所需的 Apache Spark 库。 | 
| sqoop-client | 1.4.6 | Apache Sqoop 命令行客户端。 | 
| tez-on-yarn | 0.8.4 | tez YARN 应用程序和库。 | 
| webserver | 2.4.23 | Apache HTTP 服务器。 | 
| zeppelin-server | 0.6.1 | 支持交互式数据分析的基于 Web 的 Notebook。 | 
| zookeeper-server | 3.4.8 | 用于维护配置信息、命名、提供分布式同步以及提供组服务的集中式服务。 | 
| zookeeper-client | 3.4.8 | ZooKeeper 命令行客户端。 | 

## 4.8.2 配置分类
<a name="emr-482-class"></a>

配置分类允许您自定义应用程序。这些通常与应用程序的配置 XML 文件（例如 `hive-site.xml`）相对应。有关更多信息，请参阅[配置应用程序](emr-configure-apps.md)。


**emr-4.8.2 分类**  

| 分类 | 说明 | 
| --- | --- | 
| capacity-scheduler | 更改 Hadoop 的 capacity-scheduler.xml 文件中的值。 | 
| core-site | 更改 Hadoop 的 core-site.xml 文件中的值。 | 
| emrfs-site | 更改 EMRFS 设置。 | 
| hadoop-env | 更改适用于所有 Hadoop 组件的 Hadoop 环境中的值。 | 
| hadoop-log4j | 更改 Hadoop 的 log4j.properties 文件中的值。 | 
| hadoop-ssl-server | 更改 hadoop ssl 服务器配置 | 
| hadoop-ssl-client | 更改 hadoop ssl 客户端配置 | 
| hbase-env | 更改环境 HBase中的值。 | 
| hbase-log4j | 更改 hbase- HBase log4j.properties 文件中的值。 | 
| hbase-metrics | 更改 hadoop-metrics2-hb HBase aase.properties 文件中的值。 | 
| hbase-policy | 更改 hbase-policy.xml 文件 HBase中的值。 | 
| hbase-site | 更改 hbase-site.xml 文件 HBase中的值。 | 
| hdfs-encryption-zones | 配置 HDFS 加密区域。 | 
| hdfs-site | 更改 HDFS 的 hdfs-site.xml 中的值。 | 
| hcatalog-env | 更改环境 HCatalog中的值。 | 
| hcatalog-server-jndi | 更改 HCatalog的 jndi.properties 中的值。 | 
| hcatalog-server-proto-hive-site | 更改 proto-hive-site .x HCatalog ml 中的值。 | 
| hcatalog-webhcat-env | 更改 HCatalog Web 环境HCat中的值。 | 
| hcatalog-webhcat-log4j | 更改 HCatalog Web HCat 的 log4j.properties 中的值。 | 
| hcatalog-webhcat-site | 更改 HCatalog Web HCat 的 webhcat-site.xml 文件中的值。 | 
| hive-env | 更改 Hive 环境中的值。 | 
| hive-exec-log4j | 更改 Hive 的 hive-exec-log 4j.properties 文件中的值。 | 
| hive-log4j | 更改 Hive 的 hive-log4j.properties 文件中的值。 | 
| hive-site | 更改 Hive 的 hive-site.xml 文件中的值 | 
| hiveserver2-site | 更改 Hive Server2 的 hiveserver2-site.xml 文件中的值 | 
| hue-ini | 更改 Hue 的 ini 文件中的值 | 
| httpfs-env | 更改 HTTPFS 环境中的值。 | 
| httpfs-site | 更改 Hadoop 的 httpfs-site.xml 文件中的值。 | 
| hadoop-kms-acls | 更改 Hadoop 的 kms-acls.xml 文件中的值。 | 
| hadoop-kms-env | 更改 Hadoop KMS 环境中的值。 | 
| hadoop-kms-log4j | 更改 Hadoop 的 kms-log4j.properties 文件中的值。 | 
| hadoop-kms-site | 更改 Hadoop 的 kms-site.xml 文件中的值。 | 
| mapred-env | 更改 MapReduce 应用程序环境中的值。 | 
| mapred-site | 更改 MapReduce 应用程序的 mapred-site.xml 文件中的值。 | 
| oozie-env | 更改 Oozie 的环境中的值。 | 
| oozie-log4j | 更改 Oozie 的 oozie-log4j.properties 文件中的值。 | 
| oozie-site | 更改 Oozie 的 oozie-site.xml 文件中的值。 | 
| phoenix-hbase-metrics | 更改 Phoenix 的 hadoop-metrics2-hbase.properties 文件中的值。 | 
| phoenix-hbase-site | 更改 Phoenix 的 hbase-site.xml 文件中的值。 | 
| phoenix-log4j | 更改 Phoenix 的 log4j.properties 文件中的值。 | 
| phoenix-metrics | 更改 Phoenix 的 hadoop-metrics2-phoenix.properties 文件中的值。 | 
| pig-properties | 更改 Pig 的 pig.properties 文件中的值。 | 
| pig-log4j | 更改 Pig 的 log4j.properties 文件中的值。 | 
| presto-log | 更改 Presto 的 log.properties 文件中的值。 | 
| presto-config | 更改 Presto 的 config.properties 文件中的值。 | 
| presto-connector-blackhole | 更改 Presto 的 blackhole.properties 文件中的值。 | 
| presto-connector-cassandra | 更改 Presto 的 cassandra.properties 文件中的值。 | 
| presto-connector-hive | 更改 Presto 的 hive.properties 文件中的值。 | 
| presto-connector-jmx | 更改 Presto 的 jmx.properties 文件中的值。 | 
| presto-connector-kafka | 更改 Presto 的 kafka.properties 文件中的值。 | 
| presto-connector-localfile | 更改 Presto 的 localfile.properties 文件中的值。 | 
| presto-connector-mongodb | 更改 Presto 的 mongodb.properties 文件中的值。 | 
| presto-connector-mysql | 更改 Presto 的 mysql.properties 文件中的值。 | 
| presto-connector-postgresql | 更改 Presto 的 postgresql.properties 文件中的值。 | 
| presto-connector-raptor | 更改 Presto 的 raptor.properties 文件中的值。 | 
| presto-connector-redis | 更改 Presto 的 redis.properties 文件中的值。 | 
| presto-connector-tpch | 更改 Presto 的 tpch.properties 文件中的值。 | 
| spark | 适用于 Apache Spark 的 Amazon EMR 辅助设置。 | 
| spark-defaults | 更改 Spark 的 spark-defaults.conf 文件中的值。 | 
| spark-env | 更改 Spark 环境中的值。 | 
| spark-log4j | 更改 Spark 的 log4j.properties 文件中的值。 | 
| spark-metrics | 更改 Spark 的 metrics.properties 文件中的值。 | 
| sqoop-env | 更改 Sqoop 的环境中的值。 | 
| sqoop-oraoop-site | 更改 Sqoop OraOop 的 oraoop-site.xml 文件中的值。 | 
| sqoop-site | 更改 Sqoop 的 sqoop-site.xml 文件中的值。 | 
| tez-site | 更改 Tez 的 tez-site.xml 文件中的值。 | 
| yarn-env | 更改 YARN 环境中的值。 | 
| yarn-site | 更改 YARN 的 yarn-site.xml 文件中的值。 | 
| zeppelin-env | 更改 Zeppelin 环境中的值。 | 
| zookeeper-config | 更改 ZooKeeper的 zoo.cfg 文件中的值。 | 
| zookeeper-log4j | 更改 ZooKeeper的 log4j.properties 文件中的值。 | 

# Amazon EMR 发行版 4.8.1
<a name="emr-481-release"></a>

## 4.8.1 应用程序版本
<a name="emr-481-app-versions"></a>

此版本包括以下应用程序：[http://ganglia.info](http://ganglia.info)、[http://hbase.apache.org/](http://hbase.apache.org/)、[https://cwiki.apache.org/confluence/display/Hive/HCatalog](https://cwiki.apache.org/confluence/display/Hive/HCatalog)、[http://hadoop.apache.org/docs/current/](http://hadoop.apache.org/docs/current/)、[http://hive.apache.org/](http://hive.apache.org/)、[http://gethue.com/](http://gethue.com/)、[http://mahout.apache.org/](http://mahout.apache.org/)、[http://oozie.apache.org/](http://oozie.apache.org/)、[https://phoenix.apache.org/](https://phoenix.apache.org/)、[http://pig.apache.org/](http://pig.apache.org/)、[https://prestodb.io/](https://prestodb.io/)、[https://spark.apache.org/docs/latest/](https://spark.apache.org/docs/latest/)、[http://sqoop.apache.org/](http://sqoop.apache.org/)、[https://tez.apache.org/](https://tez.apache.org/)、[https://zeppelin.incubator.apache.org/](https://zeppelin.incubator.apache.org/) 和 [https://zookeeper.apache.org](https://zookeeper.apache.org)。

下表列出了此版本的 Amazon EMR 中提供的应用程序版本以及前三个 Amazon EMR 发行版中的应用程序版本（若适用）。

有关每个发行版的 Amazon EMR 的应用程序版本的全面历史记录，请参见以下主题：
+ [Amazon EMR 7.x 发行版中的应用程序版本](emr-release-app-versions-7.x.md)
+ [Amazon EMR 6.x 发行版中的应用程序版本](emr-release-app-versions-6.x.md)
+ [Amazon EMR 5.x 发行版中的应用程序版本](emr-release-app-versions-5.x.md)
+ [Amazon EMR 4.x 发行版中的应用程序版本](emr-release-app-versions-4.x.md)


**应用程序版本信息**  

|  | emr-4.8.1 | emr-4.8.0 | emr-4.7.4 | emr-4.7.3 | 
| --- | --- | --- | --- | --- | 
| AWS 适用于 Java 的 SDK | 1.10.75 | 1.10.75 | 1.10.75 | 1.10.75 | 
| Python | 未跟踪 | 未跟踪 | 未跟踪 | 未跟踪 | 
| Scala | 未跟踪 | 未跟踪 | 未跟踪 | 未跟踪 | 
| AmazonCloudWatchAgent |  -  |  -  |  -  |  -  | 
| Delta |  -  |  -  |  -  |  -  | 
| Flink |  -  |  -  |  -  |  -  | 
| Ganglia | 3.7.2 | 3.7.2 | 3.7.2 | 3.7.2 | 
| HBase | 1.2.2 | 1.2.2 | 1.2.1 | 1.2.1 | 
| HCatalog | 1.0.0-amzn-7 | 1.0.0-amzn-7 | 1.0.0-amzn-6 | 1.0.0-amzn-6 | 
| Hadoop | 2.7.2-amzn-4 | 2.7.2-amzn-4 | 2.7.2-amzn-3 | 2.7.2-amzn-3 | 
| Hive | 1.0.0-amzn-7 | 1.0.0-amzn-7 | 1.0.0-amzn-6 | 1.0.0-amzn-6 | 
| Hudi |  -  |  -  |  -  |  -  | 
| Hue | 3.7.1-amzn-7 | 3.7.1-amzn-7 | 3.7.1-amzn-7 | 3.7.1-amzn-7 | 
| Iceberg |  -  |  -  |  -  |  -  | 
| JupyterEnterpriseGateway |  -  |  -  |  -  |  -  | 
| JupyterHub |  -  |  -  |  -  |  -  | 
| Livy |  -  |  -  |  -  |  -  | 
| MXNet |  -  |  -  |  -  |  -  | 
| Mahout | 0.12.2 | 0.12.2 | 0.12.2 | 0.12.2 | 
| Oozie |  -  |  -  |  -  |  -  | 
| Oozie-Sandbox | 4.2.0 | 4.2.0 | 4.2.0 | 4.2.0 | 
| Phoenix | 4.7.0--1.2 HBase | 4.7.0--1.2 HBase | 4.7.0--1.2 HBase | 4.7.0--1.2 HBase | 
| Pig | 0.14.0-amzn-0 | 0.14.0-amzn-0 | 0.14.0-amzn-0 | 0.14.0-amzn-0 | 
| Presto |  -  |  -  |  -  |  -  | 
| Presto-Sandbox | 0.151 | 0.151 | 0.148 | 0.148 | 
| Spark | 1.6.2 | 1.6.2 | 1.6.2 | 1.6.2 | 
| Sqoop |  -  |  -  |  -  |  -  | 
| Sqoop-Sandbox | 1.4.6 | 1.4.6 | 1.4.6 | 1.4.6 | 
| TensorFlow |  -  |  -  |  -  |  -  | 
| Tez | 0.8.4 | 0.8.4 | 0.8.3 | 0.8.3 | 
| Trino (PrestoSQL) |  -  |  -  |  -  |  -  | 
| Zeppelin |  -  |  -  |  -  |  -  | 
| Zeppelin-Sandbox | 0.6.1 | 0.6.1 | 0.5.6-incubating | 0.5.6-incubating | 
| ZooKeeper |  -  |  -  |  -  |  -  | 
| ZooKeeper-Sandbox | 3.4.8 | 3.4.8 | 3.4.8 | 3.4.8 | 

## 4.8.1 发布说明
<a name="emr-481-relnotes"></a>

## 4.8.1 组件版本
<a name="emr-481-components"></a>

下面列出了 Amazon EMR 随此发行版一起安装的组件。一些组件作为大数据应用程序包的一部分安装。其它组件是 Amazon EMR 独有的，并且已为系统流程和功能安装这些组件。它们通常以 `emr` 或 `aws` 开头。最新的 Amazon EMR 发行版中的大数据应用程序包通常是在社区中找到的最新版本。我们会尽快在 Amazon EMR 中提供社区发行版。

Amazon EMR 中的某些组件与社区版本不同。这些组件具有以下形式的 `CommunityVersion-amzn-EmrVersion` 的发行版标注。`EmrVersion` 从 0 开始。例如，假设已对名为 `myapp-component` 的版本 2.2 的开源社区组件进行三次修改，以包含在不同的 Amazon EMR 发行版中，则其发行版将为 `2.2-amzn-2`。


| 组件 | 版本 | 说明 | 
| --- | --- | --- | 
| emr-ddb | 3.2.0 | 适用于 Hadoop 生态系统应用程序的 Amazon DynamoDB 连接器。 | 
| emr-goodies | 2.1.0 | 适用于 Hadoop 生态系统的方便易用的库。 | 
| emr-kinesis | 3.2.0 | 适用于 Hadoop 生态系统应用程序的 Amazon Kinesis 连接器。 | 
| emr-s3-dist-cp | 2.4.0 | 针对 Amazon S3 优化的分布式复制应用程序。 | 
| emrfs | 2.9.0 | 适用于 Hadoop 生态系统应用程序的 Amazon S3 连接器。 | 
| ganglia-monitor | 3.7.2 | 适用于 Hadoop 生态系统应用程序的嵌入式 Ganglia 代理以及 Ganglia 监控代理。 | 
| ganglia-metadata-collector | 3.7.2 | 用于从 Ganglia 监控代理中聚合指标的 Ganglia 元数据收集器。 | 
| ganglia-web | 3.7.1 | 用于查看由 Ganglia 元数据收集器收集的指标的 Web 应用程序。 | 
| hadoop-client | 2.7.2-amzn-4 | Hadoop 命令行客户端，如“hdfs”、“hadoop”或“yarn”。 | 
| hadoop-hdfs-datanode | 2.7.2-amzn-4 | 用于存储数据块的 HDFS 节点级服务。 | 
| hadoop-hdfs-library | 2.7.2-amzn-4 | HDFS 命令行客户端和库 | 
| hadoop-hdfs-namenode | 2.7.2-amzn-4 | 用于跟踪文件名和数据块位置的 HDFS 服务。 | 
| hadoop-httpfs-server | 2.7.2-amzn-4 | 用于 HDFS 操作的 HTTP 终端节点。 | 
| hadoop-kms-server | 2.7.2-amzn-4 | 基于 Hadoop 的 API 的加密密钥管理服务器。 KeyProvider  | 
| hadoop-mapred | 2.7.2-amzn-4 | MapReduce 用于运行 MapReduce 应用程序的执行引擎库。 | 
| hadoop-yarn-nodemanager | 2.7.2-amzn-4 | 用于管理单个节点上的容器的 YARN 服务。 | 
| hadoop-yarn-resourcemanager | 2.7.2-amzn-4 | 用于分配和管理集群资源与分布式应用程序的 YARN 服务。 | 
| hadoop-yarn-timeline-server | 2.7.2-amzn-4 | 用于检索 YARN 应用程序的当前信息和历史信息的服务。 | 
| hbase-hmaster | 1.2.2 | 为负责协调区域和执行管理命令的 HBase 集群提供服务。 | 
| hbase-region-server | 1.2.2 | 为一个或多个 HBase 地区提供服务的服务。 | 
| hbase-client | 1.2.2 | HBase 命令行客户端。 | 
| hbase-rest-server | 1.2.2 | 为提供 RESTful HTTP 端点的服务 HBase。 | 
| hbase-thrift-server | 1.2.2 | 为其提供 Thrift 端点的 HBase服务。 | 
| hcatalog-client | 1.0.0-amzn-7 | 用于操作 hcatalog-server 的“hcat”命令行客户端。 | 
| hcatalog-server | 1.0.0-amzn-7 | 提供服务 HCatalog，为分布式应用程序提供表和存储管理层。 | 
| hcatalog-webhcat-server | 1.0.0-amzn-7 | 为其提供 REST 接口的 HTTP 端点 HCatalog。 | 
| hive-client | 1.0.0-amzn-7 | Hive 命令行客户端。 | 
| hive-metastore-server | 1.0.0-amzn-7 | 用于访问 Hive 元存储 (一个用于存储 Hadoop 操作中的 SQL 的元数据的语义存储库) 的服务。 | 
| hive-server | 1.0.0-amzn-7 | 用于将 Hive 查询作为 Web 请求接受的服务。 | 
| hue-server | 3.7.1-amzn-7 | 用于使用 Hadoop 生态系统应用程序分析数据的 Web 应用程序 | 
| mahout-client | 0.12.2 | 用于机器学习的库。 | 
| mysql-server | 5.5.51 | MySQL 数据库服务器。 | 
| oozie-client | 4.2.0 | Oozie 命令行客户端。 | 
| oozie-server | 4.2.0 | 用于接受 Oozie 工作流请求的服务。 | 
| phoenix-library | 4.7.0--1.2 HBase | 服务器和客户端的 phoenix 库 | 
| phoenix-query-server | 4.7.0--1.2 HBase | 向 Avatica API 提供 JDBC 访问权限以及协议缓冲区和 JSON 格式访问权限的轻量级服务器  | 
| presto-coordinator | 0.151 | 用于在 presto-worker 之中接受查询并管理查询的服务。 | 
| presto-worker | 0.151 | 用于执行查询的各个部分的服务。 | 
| pig-client | 0.14.0-amzn-0 | Pig 命令行客户端。 | 
| spark-client | 1.6.2 | Spark 命令行客户端。 | 
| spark-history-server | 1.6.2 | 用于查看完整的 Spark 应用程序的生命周期的已记录事件的 Web UI。 | 
| spark-on-yarn | 1.6.2 | 适用于 YARN 的内存中执行引擎。 | 
| spark-yarn-slave | 1.6.2 | YARN 从属项所需的 Apache Spark 库。 | 
| sqoop-client | 1.4.6 | Apache Sqoop 命令行客户端。 | 
| tez-on-yarn | 0.8.4 | tez YARN 应用程序和库。 | 
| webserver | 2.4.23 | Apache HTTP 服务器。 | 
| zeppelin-server | 0.6.1 | 支持交互式数据分析的基于 Web 的 Notebook。 | 
| zookeeper-server | 3.4.8 | 用于维护配置信息、命名、提供分布式同步以及提供组服务的集中式服务。 | 
| zookeeper-client | 3.4.8 | ZooKeeper 命令行客户端。 | 

## 4.8.1 配置分类
<a name="emr-481-class"></a>

配置分类允许您自定义应用程序。这些通常与应用程序的配置 XML 文件（例如 `hive-site.xml`）相对应。有关更多信息，请参阅 [配置应用程序](emr-configure-apps.md)。


**emr-4.8.1 分类**  

| 分类 | 说明 | 
| --- | --- | 
| capacity-scheduler | 更改 Hadoop 的 capacity-scheduler.xml 文件中的值。 | 
| core-site | 更改 Hadoop 的 core-site.xml 文件中的值。 | 
| emrfs-site | 更改 EMRFS 设置。 | 
| hadoop-env | 更改适用于所有 Hadoop 组件的 Hadoop 环境中的值。 | 
| hadoop-log4j | 更改 Hadoop 的 log4j.properties 文件中的值。 | 
| hadoop-ssl-server | 更改 hadoop ssl 服务器配置 | 
| hadoop-ssl-client | 更改 hadoop ssl 客户端配置 | 
| hbase-env | 更改环境 HBase中的值。 | 
| hbase-log4j | 更改 hbase- HBase log4j.properties 文件中的值。 | 
| hbase-metrics | 更改 hadoop-metrics2-hb HBase aase.properties 文件中的值。 | 
| hbase-policy | 更改 hbase-policy.xml 文件 HBase中的值。 | 
| hbase-site | 更改 hbase-site.xml 文件 HBase中的值。 | 
| hdfs-encryption-zones | 配置 HDFS 加密区域。 | 
| hdfs-site | 更改 HDFS 的 hdfs-site.xml 中的值。 | 
| hcatalog-env | 更改环境 HCatalog中的值。 | 
| hcatalog-server-jndi | 更改 HCatalog的 jndi.properties 中的值。 | 
| hcatalog-server-proto-hive-site | 更改 proto-hive-site .x HCatalog ml 中的值。 | 
| hcatalog-webhcat-env | 更改 HCatalog Web 环境HCat中的值。 | 
| hcatalog-webhcat-log4j | 更改 HCatalog Web HCat 的 log4j.properties 中的值。 | 
| hcatalog-webhcat-site | 更改 HCatalog Web HCat 的 webhcat-site.xml 文件中的值。 | 
| hive-env | 更改 Hive 环境中的值。 | 
| hive-exec-log4j | 更改 Hive 的 hive-exec-log 4j.properties 文件中的值。 | 
| hive-log4j | 更改 Hive 的 hive-log4j.properties 文件中的值。 | 
| hive-site | 更改 Hive 的 hive-site.xml 文件中的值 | 
| hiveserver2-site | 更改 Hive Server2 的 hiveserver2-site.xml 文件中的值 | 
| hue-ini | 更改 Hue 的 ini 文件中的值 | 
| httpfs-env | 更改 HTTPFS 环境中的值。 | 
| httpfs-site | 更改 Hadoop 的 httpfs-site.xml 文件中的值。 | 
| hadoop-kms-acls | 更改 Hadoop 的 kms-acls.xml 文件中的值。 | 
| hadoop-kms-env | 更改 Hadoop KMS 环境中的值。 | 
| hadoop-kms-log4j | 更改 Hadoop 的 kms-log4j.properties 文件中的值。 | 
| hadoop-kms-site | 更改 Hadoop 的 kms-site.xml 文件中的值。 | 
| mapred-env | 更改 MapReduce 应用程序环境中的值。 | 
| mapred-site | 更改 MapReduce 应用程序的 mapred-site.xml 文件中的值。 | 
| oozie-env | 更改 Oozie 的环境中的值。 | 
| oozie-log4j | 更改 Oozie 的 oozie-log4j.properties 文件中的值。 | 
| oozie-site | 更改 Oozie 的 oozie-site.xml 文件中的值。 | 
| phoenix-hbase-metrics | 更改 Phoenix 的 hadoop-metrics2-hbase.properties 文件中的值。 | 
| phoenix-hbase-site | 更改 Phoenix 的 hbase-site.xml 文件中的值。 | 
| phoenix-log4j | 更改 Phoenix 的 log4j.properties 文件中的值。 | 
| phoenix-metrics | 更改 Phoenix 的 hadoop-metrics2-phoenix.properties 文件中的值。 | 
| pig-properties | 更改 Pig 的 pig.properties 文件中的值。 | 
| pig-log4j | 更改 Pig 的 log4j.properties 文件中的值。 | 
| presto-log | 更改 Presto 的 log.properties 文件中的值。 | 
| presto-config | 更改 Presto 的 config.properties 文件中的值。 | 
| presto-connector-blackhole | 更改 Presto 的 blackhole.properties 文件中的值。 | 
| presto-connector-cassandra | 更改 Presto 的 cassandra.properties 文件中的值。 | 
| presto-connector-hive | 更改 Presto 的 hive.properties 文件中的值。 | 
| presto-connector-jmx | 更改 Presto 的 jmx.properties 文件中的值。 | 
| presto-connector-kafka | 更改 Presto 的 kafka.properties 文件中的值。 | 
| presto-connector-localfile | 更改 Presto 的 localfile.properties 文件中的值。 | 
| presto-connector-mongodb | 更改 Presto 的 mongodb.properties 文件中的值。 | 
| presto-connector-mysql | 更改 Presto 的 mysql.properties 文件中的值。 | 
| presto-connector-postgresql | 更改 Presto 的 postgresql.properties 文件中的值。 | 
| presto-connector-raptor | 更改 Presto 的 raptor.properties 文件中的值。 | 
| presto-connector-redis | 更改 Presto 的 redis.properties 文件中的值。 | 
| presto-connector-tpch | 更改 Presto 的 tpch.properties 文件中的值。 | 
| spark | 适用于 Apache Spark 的 Amazon EMR 辅助设置。 | 
| spark-defaults | 更改 Spark 的 spark-defaults.conf 文件中的值。 | 
| spark-env | 更改 Spark 环境中的值。 | 
| spark-log4j | 更改 Spark 的 log4j.properties 文件中的值。 | 
| spark-metrics | 更改 Spark 的 metrics.properties 文件中的值。 | 
| sqoop-env | 更改 Sqoop 的环境中的值。 | 
| sqoop-oraoop-site | 更改 Sqoop OraOop 的 oraoop-site.xml 文件中的值。 | 
| sqoop-site | 更改 Sqoop 的 sqoop-site.xml 文件中的值。 | 
| tez-site | 更改 Tez 的 tez-site.xml 文件中的值。 | 
| yarn-env | 更改 YARN 环境中的值。 | 
| yarn-site | 更改 YARN 的 yarn-site.xml 文件中的值。 | 
| zeppelin-env | 更改 Zeppelin 环境中的值。 | 
| zookeeper-config | 更改 ZooKeeper的 zoo.cfg 文件中的值。 | 
| zookeeper-log4j | 更改 ZooKeeper的 log4j.properties 文件中的值。 | 

# Amazon EMR 发行版 4.8.0
<a name="emr-480-release"></a>

## 4.8.0 应用程序版本
<a name="emr-480-app-versions"></a>

此版本包括以下应用程序：[http://ganglia.info](http://ganglia.info)、[http://hbase.apache.org/](http://hbase.apache.org/)、[https://cwiki.apache.org/confluence/display/Hive/HCatalog](https://cwiki.apache.org/confluence/display/Hive/HCatalog)、[http://hadoop.apache.org/docs/current/](http://hadoop.apache.org/docs/current/)、[http://hive.apache.org/](http://hive.apache.org/)、[http://gethue.com/](http://gethue.com/)、[http://mahout.apache.org/](http://mahout.apache.org/)、[http://oozie.apache.org/](http://oozie.apache.org/)、[https://phoenix.apache.org/](https://phoenix.apache.org/)、[http://pig.apache.org/](http://pig.apache.org/)、[https://prestodb.io/](https://prestodb.io/)、[https://spark.apache.org/docs/latest/](https://spark.apache.org/docs/latest/)、[http://sqoop.apache.org/](http://sqoop.apache.org/)、[https://tez.apache.org/](https://tez.apache.org/)、[https://zeppelin.incubator.apache.org/](https://zeppelin.incubator.apache.org/) 和 [https://zookeeper.apache.org](https://zookeeper.apache.org)。

下表列出了此版本的 Amazon EMR 中提供的应用程序版本以及前三个 Amazon EMR 发行版中的应用程序版本（若适用）。

有关每个发行版的 Amazon EMR 的应用程序版本的全面历史记录，请参见以下主题：
+ [Amazon EMR 7.x 发行版中的应用程序版本](emr-release-app-versions-7.x.md)
+ [Amazon EMR 6.x 发行版中的应用程序版本](emr-release-app-versions-6.x.md)
+ [Amazon EMR 5.x 发行版中的应用程序版本](emr-release-app-versions-5.x.md)
+ [Amazon EMR 4.x 发行版中的应用程序版本](emr-release-app-versions-4.x.md)


**应用程序版本信息**  

|  | emr-4.8.0 | emr-4.7.4 | emr-4.7.3 | emr-4.7.2 | 
| --- | --- | --- | --- | --- | 
| AWS 适用于 Java 的 SDK | 1.10.75 | 1.10.75 | 1.10.75 | 1.10.75 | 
| Python | 未跟踪 | 未跟踪 | 未跟踪 | 未跟踪 | 
| Scala | 未跟踪 | 未跟踪 | 未跟踪 | 未跟踪 | 
| AmazonCloudWatchAgent |  -  |  -  |  -  |  -  | 
| Delta |  -  |  -  |  -  |  -  | 
| Flink |  -  |  -  |  -  |  -  | 
| Ganglia | 3.7.2 | 3.7.2 | 3.7.2 | 3.7.2 | 
| HBase | 1.2.2 | 1.2.1 | 1.2.1 | 1.2.1 | 
| HCatalog | 1.0.0-amzn-7 | 1.0.0-amzn-6 | 1.0.0-amzn-6 | 1.0.0-amzn-6 | 
| Hadoop | 2.7.2-amzn-4 | 2.7.2-amzn-3 | 2.7.2-amzn-3 | 2.7.2-amzn-3 | 
| Hive | 1.0.0-amzn-7 | 1.0.0-amzn-6 | 1.0.0-amzn-6 | 1.0.0-amzn-6 | 
| Hudi |  -  |  -  |  -  |  -  | 
| Hue | 3.7.1-amzn-7 | 3.7.1-amzn-7 | 3.7.1-amzn-7 | 3.7.1-amzn-7 | 
| Iceberg |  -  |  -  |  -  |  -  | 
| JupyterEnterpriseGateway |  -  |  -  |  -  |  -  | 
| JupyterHub |  -  |  -  |  -  |  -  | 
| Livy |  -  |  -  |  -  |  -  | 
| MXNet |  -  |  -  |  -  |  -  | 
| Mahout | 0.12.2 | 0.12.2 | 0.12.2 | 0.12.2 | 
| Oozie |  -  |  -  |  -  |  -  | 
| Oozie-Sandbox | 4.2.0 | 4.2.0 | 4.2.0 | 4.2.0 | 
| Phoenix | 4.7.0--1.2 HBase | 4.7.0--1.2 HBase | 4.7.0--1.2 HBase | 4.7.0--1.2 HBase | 
| Pig | 0.14.0-amzn-0 | 0.14.0-amzn-0 | 0.14.0-amzn-0 | 0.14.0-amzn-0 | 
| Presto |  -  |  -  |  -  |  -  | 
| Presto-Sandbox | 0.151 | 0.148 | 0.148 | 0.148 | 
| Spark | 1.6.2 | 1.6.2 | 1.6.2 | 1.6.2 | 
| Sqoop |  -  |  -  |  -  |  -  | 
| Sqoop-Sandbox | 1.4.6 | 1.4.6 | 1.4.6 | 1.4.6 | 
| TensorFlow |  -  |  -  |  -  |  -  | 
| Tez | 0.8.4 | 0.8.3 | 0.8.3 | 0.8.3 | 
| Trino (PrestoSQL) |  -  |  -  |  -  |  -  | 
| Zeppelin |  -  |  -  |  -  |  -  | 
| Zeppelin-Sandbox | 0.6.1 | 0.5.6-incubating | 0.5.6-incubating | 0.5.6-incubating | 
| ZooKeeper |  -  |  -  |  -  |  -  | 
| ZooKeeper-Sandbox | 3.4.8 | 3.4.8 | 3.4.8 | 3.4.8 | 

## 4.8.0 发布说明
<a name="emr-480-relnotes"></a>

以下发布说明包括有关 Amazon EMR 发行版 4.8.0 的信息。更改与 Amazon EMR 4.7.2 发行版有关。

发布日期：2016 年 9 月 7 日

**升级**
+ 已升级到 HBase 1.2.2
+ 已升级到 Presto-Sandbox 0.151
+ 已升级到 Tez 0.8.4
+ 已升级到 Zeppelin-Sandbox 0.6.1

**更改和增强功能**
+ 修复了 YARN 中的一个问题， ApplicationMaster 即尝试清理因实例已终止而不再存在的容器。
+ 更正了 Oozie 示例中 Hive2 操作的 hive-server2 URL。
+ 添加了对其它 Presto 目录的支持。
+ 已逆向移植修补程序：[HIVE-8948](https://issues.apache.org/jira/browse/HIVE-8948)、[HIVE-12679](https://issues.apache.org/jira/browse/HIVE-12679)、[HIVE-13405](https://issues.apache.org/jira/browse/HIVE-13405)、[PHOENIX-3116](https://issues.apache.org/jira/browse/PHOENIX-3116)、[HADOOP-12689](https://issues.apache.org/jira/browse/HADOOP-12689)
+ 添加了对安全配置的支持，这使您可以更轻松地创建和应用加密选项。有关更多信息，请参阅[数据加密](https://docs.aws.amazon.com/emr/latest/ReleaseGuide/emr-data-encryption.html)。

## 4.8.0 组件版本
<a name="emr-480-components"></a>

下面列出了 Amazon EMR 随此发行版一起安装的组件。一些组件作为大数据应用程序包的一部分安装。其它组件是 Amazon EMR 独有的，并且已为系统流程和功能安装这些组件。它们通常以 `emr` 或 `aws` 开头。最新的 Amazon EMR 发行版中的大数据应用程序包通常是在社区中找到的最新版本。我们会尽快在 Amazon EMR 中提供社区发行版。

Amazon EMR 中的某些组件与社区版本不同。这些组件具有以下形式的 `CommunityVersion-amzn-EmrVersion` 的发行版标注。`EmrVersion` 从 0 开始。例如，假设已对名为 `myapp-component` 的版本 2.2 的开源社区组件进行三次修改，以包含在不同的 Amazon EMR 发行版中，则其发行版将为 `2.2-amzn-2`。


| 组件 | 版本 | 说明 | 
| --- | --- | --- | 
| emr-ddb | 3.2.0 | 适用于 Hadoop 生态系统应用程序的 Amazon DynamoDB 连接器。 | 
| emr-goodies | 2.1.0 | 适用于 Hadoop 生态系统的方便易用的库。 | 
| emr-kinesis | 3.2.0 | 适用于 Hadoop 生态系统应用程序的 Amazon Kinesis 连接器。 | 
| emr-s3-dist-cp | 2.4.0 | 针对 Amazon S3 优化的分布式复制应用程序。 | 
| emrfs | 2.9.0 | 适用于 Hadoop 生态系统应用程序的 Amazon S3 连接器。 | 
| ganglia-monitor | 3.7.2 | 适用于 Hadoop 生态系统应用程序的嵌入式 Ganglia 代理以及 Ganglia 监控代理。 | 
| ganglia-metadata-collector | 3.7.2 | 用于从 Ganglia 监控代理中聚合指标的 Ganglia 元数据收集器。 | 
| ganglia-web | 3.7.1 | 用于查看由 Ganglia 元数据收集器收集的指标的 Web 应用程序。 | 
| hadoop-client | 2.7.2-amzn-4 | Hadoop 命令行客户端，如“hdfs”、“hadoop”或“yarn”。 | 
| hadoop-hdfs-datanode | 2.7.2-amzn-4 | 用于存储数据块的 HDFS 节点级服务。 | 
| hadoop-hdfs-library | 2.7.2-amzn-4 | HDFS 命令行客户端和库 | 
| hadoop-hdfs-namenode | 2.7.2-amzn-4 | 用于跟踪文件名和数据块位置的 HDFS 服务。 | 
| hadoop-httpfs-server | 2.7.2-amzn-4 | 用于 HDFS 操作的 HTTP 终端节点。 | 
| hadoop-kms-server | 2.7.2-amzn-4 | 基于 Hadoop 的 API 的加密密钥管理服务器。 KeyProvider  | 
| hadoop-mapred | 2.7.2-amzn-4 | MapReduce 用于运行 MapReduce 应用程序的执行引擎库。 | 
| hadoop-yarn-nodemanager | 2.7.2-amzn-4 | 用于管理单个节点上的容器的 YARN 服务。 | 
| hadoop-yarn-resourcemanager | 2.7.2-amzn-4 | 用于分配和管理集群资源与分布式应用程序的 YARN 服务。 | 
| hadoop-yarn-timeline-server | 2.7.2-amzn-4 | 用于检索 YARN 应用程序的当前信息和历史信息的服务。 | 
| hbase-hmaster | 1.2.2 | 为负责协调区域和执行管理命令的 HBase 集群提供服务。 | 
| hbase-region-server | 1.2.2 | 为一个或多个 HBase 地区提供服务的服务。 | 
| hbase-client | 1.2.2 | HBase 命令行客户端。 | 
| hbase-rest-server | 1.2.2 | 为提供 RESTful HTTP 端点的服务 HBase。 | 
| hbase-thrift-server | 1.2.2 | 为其提供 Thrift 端点的 HBase服务。 | 
| hcatalog-client | 1.0.0-amzn-7 | 用于操作 hcatalog-server 的“hcat”命令行客户端。 | 
| hcatalog-server | 1.0.0-amzn-7 | 提供服务 HCatalog，为分布式应用程序提供表和存储管理层。 | 
| hcatalog-webhcat-server | 1.0.0-amzn-7 | 为其提供 REST 接口的 HTTP 端点 HCatalog。 | 
| hive-client | 1.0.0-amzn-7 | Hive 命令行客户端。 | 
| hive-metastore-server | 1.0.0-amzn-7 | 用于访问 Hive 元存储 (一个用于存储 Hadoop 操作中的 SQL 的元数据的语义存储库) 的服务。 | 
| hive-server | 1.0.0-amzn-7 | 用于将 Hive 查询作为 Web 请求接受的服务。 | 
| hue-server | 3.7.1-amzn-7 | 用于使用 Hadoop 生态系统应用程序分析数据的 Web 应用程序 | 
| mahout-client | 0.12.2 | 用于机器学习的库。 | 
| mysql-server | 5.5.51 | MySQL 数据库服务器。 | 
| oozie-client | 4.2.0 | Oozie 命令行客户端。 | 
| oozie-server | 4.2.0 | 用于接受 Oozie 工作流请求的服务。 | 
| phoenix-library | 4.7.0--1.2 HBase | 服务器和客户端的 phoenix 库 | 
| phoenix-query-server | 4.7.0--1.2 HBase | 向 Avatica API 提供 JDBC 访问权限以及协议缓冲区和 JSON 格式访问权限的轻量级服务器  | 
| presto-coordinator | 0.151 | 用于在 presto-worker 之中接受查询并管理查询的服务。 | 
| presto-worker | 0.151 | 用于执行查询的各个部分的服务。 | 
| pig-client | 0.14.0-amzn-0 | Pig 命令行客户端。 | 
| spark-client | 1.6.2 | Spark 命令行客户端。 | 
| spark-history-server | 1.6.2 | 用于查看完整的 Spark 应用程序的生命周期的已记录事件的 Web UI。 | 
| spark-on-yarn | 1.6.2 | 适用于 YARN 的内存中执行引擎。 | 
| spark-yarn-slave | 1.6.2 | YARN 从属项所需的 Apache Spark 库。 | 
| sqoop-client | 1.4.6 | Apache Sqoop 命令行客户端。 | 
| tez-on-yarn | 0.8.4 | tez YARN 应用程序和库。 | 
| webserver | 2.4.23 | Apache HTTP 服务器。 | 
| zeppelin-server | 0.6.1 | 支持交互式数据分析的基于 Web 的 Notebook。 | 
| zookeeper-server | 3.4.8 | 用于维护配置信息、命名、提供分布式同步以及提供组服务的集中式服务。 | 
| zookeeper-client | 3.4.8 | ZooKeeper 命令行客户端。 | 

## 4.8.0 配置分类
<a name="emr-480-class"></a>

配置分类允许您自定义应用程序。这些通常与应用程序的配置 XML 文件（例如 `hive-site.xml`）相对应。有关更多信息，请参阅[配置应用程序](emr-configure-apps.md)。


**emr-4.8.0 分类**  

| 分类 | 说明 | 
| --- | --- | 
| capacity-scheduler | 更改 Hadoop 的 capacity-scheduler.xml 文件中的值。 | 
| core-site | 更改 Hadoop 的 core-site.xml 文件中的值。 | 
| emrfs-site | 更改 EMRFS 设置。 | 
| hadoop-env | 更改适用于所有 Hadoop 组件的 Hadoop 环境中的值。 | 
| hadoop-log4j | 更改 Hadoop 的 log4j.properties 文件中的值。 | 
| hadoop-ssl-server | 更改 hadoop ssl 服务器配置 | 
| hadoop-ssl-client | 更改 hadoop ssl 客户端配置 | 
| hbase-env | 更改环境 HBase中的值。 | 
| hbase-log4j | 更改 hbase- HBase log4j.properties 文件中的值。 | 
| hbase-metrics | 更改 hadoop-metrics2-hb HBase aase.properties 文件中的值。 | 
| hbase-policy | 更改 hbase-policy.xml 文件 HBase中的值。 | 
| hbase-site | 更改 hbase-site.xml 文件 HBase中的值。 | 
| hdfs-encryption-zones | 配置 HDFS 加密区域。 | 
| hdfs-site | 更改 HDFS 的 hdfs-site.xml 中的值。 | 
| hcatalog-env | 更改环境 HCatalog中的值。 | 
| hcatalog-server-jndi | 更改 HCatalog的 jndi.properties 中的值。 | 
| hcatalog-server-proto-hive-site | 更改 proto-hive-site .x HCatalog ml 中的值。 | 
| hcatalog-webhcat-env | 更改 HCatalog Web 环境HCat中的值。 | 
| hcatalog-webhcat-log4j | 更改 HCatalog Web HCat 的 log4j.properties 中的值。 | 
| hcatalog-webhcat-site | 更改 HCatalog Web HCat 的 webhcat-site.xml 文件中的值。 | 
| hive-env | 更改 Hive 环境中的值。 | 
| hive-exec-log4j | 更改 Hive 的 hive-exec-log 4j.properties 文件中的值。 | 
| hive-log4j | 更改 Hive 的 hive-log4j.properties 文件中的值。 | 
| hive-site | 更改 Hive 的 hive-site.xml 文件中的值 | 
| hiveserver2-site | 更改 Hive Server2 的 hiveserver2-site.xml 文件中的值 | 
| hue-ini | 更改 Hue 的 ini 文件中的值 | 
| httpfs-env | 更改 HTTPFS 环境中的值。 | 
| httpfs-site | 更改 Hadoop 的 httpfs-site.xml 文件中的值。 | 
| hadoop-kms-acls | 更改 Hadoop 的 kms-acls.xml 文件中的值。 | 
| hadoop-kms-env | 更改 Hadoop KMS 环境中的值。 | 
| hadoop-kms-log4j | 更改 Hadoop 的 kms-log4j.properties 文件中的值。 | 
| hadoop-kms-site | 更改 Hadoop 的 kms-site.xml 文件中的值。 | 
| mapred-env | 更改 MapReduce 应用程序环境中的值。 | 
| mapred-site | 更改 MapReduce 应用程序的 mapred-site.xml 文件中的值。 | 
| oozie-env | 更改 Oozie 的环境中的值。 | 
| oozie-log4j | 更改 Oozie 的 oozie-log4j.properties 文件中的值。 | 
| oozie-site | 更改 Oozie 的 oozie-site.xml 文件中的值。 | 
| phoenix-hbase-metrics | 更改 Phoenix 的 hadoop-metrics2-hbase.properties 文件中的值。 | 
| phoenix-hbase-site | 更改 Phoenix 的 hbase-site.xml 文件中的值。 | 
| phoenix-log4j | 更改 Phoenix 的 log4j.properties 文件中的值。 | 
| phoenix-metrics | 更改 Phoenix 的 hadoop-metrics2-phoenix.properties 文件中的值。 | 
| pig-properties | 更改 Pig 的 pig.properties 文件中的值。 | 
| pig-log4j | 更改 Pig 的 log4j.properties 文件中的值。 | 
| presto-log | 更改 Presto 的 log.properties 文件中的值。 | 
| presto-config | 更改 Presto 的 config.properties 文件中的值。 | 
| presto-connector-blackhole | 更改 Presto 的 blackhole.properties 文件中的值。 | 
| presto-connector-cassandra | 更改 Presto 的 cassandra.properties 文件中的值。 | 
| presto-connector-hive | 更改 Presto 的 hive.properties 文件中的值。 | 
| presto-connector-jmx | 更改 Presto 的 jmx.properties 文件中的值。 | 
| presto-connector-kafka | 更改 Presto 的 kafka.properties 文件中的值。 | 
| presto-connector-localfile | 更改 Presto 的 localfile.properties 文件中的值。 | 
| presto-connector-mongodb | 更改 Presto 的 mongodb.properties 文件中的值。 | 
| presto-connector-mysql | 更改 Presto 的 mysql.properties 文件中的值。 | 
| presto-connector-postgresql | 更改 Presto 的 postgresql.properties 文件中的值。 | 
| presto-connector-raptor | 更改 Presto 的 raptor.properties 文件中的值。 | 
| presto-connector-redis | 更改 Presto 的 redis.properties 文件中的值。 | 
| presto-connector-tpch | 更改 Presto 的 tpch.properties 文件中的值。 | 
| spark | 适用于 Apache Spark 的 Amazon EMR 辅助设置。 | 
| spark-defaults | 更改 Spark 的 spark-defaults.conf 文件中的值。 | 
| spark-env | 更改 Spark 环境中的值。 | 
| spark-log4j | 更改 Spark 的 log4j.properties 文件中的值。 | 
| spark-metrics | 更改 Spark 的 metrics.properties 文件中的值。 | 
| sqoop-env | 更改 Sqoop 的环境中的值。 | 
| sqoop-oraoop-site | 更改 Sqoop OraOop 的 oraoop-site.xml 文件中的值。 | 
| sqoop-site | 更改 Sqoop 的 sqoop-site.xml 文件中的值。 | 
| tez-site | 更改 Tez 的 tez-site.xml 文件中的值。 | 
| yarn-env | 更改 YARN 环境中的值。 | 
| yarn-site | 更改 YARN 的 yarn-site.xml 文件中的值。 | 
| zeppelin-env | 更改 Zeppelin 环境中的值。 | 
| zookeeper-config | 更改 ZooKeeper的 zoo.cfg 文件中的值。 | 
| zookeeper-log4j | 更改 ZooKeeper的 log4j.properties 文件中的值。 | 

# Amazon EMR 发行版 4.7.4
<a name="emr-474-release"></a>

## 4.7.4 应用程序版本
<a name="emr-474-app-versions"></a>

此版本包括以下应用程序：[http://ganglia.info](http://ganglia.info)、[http://hbase.apache.org/](http://hbase.apache.org/)、[https://cwiki.apache.org/confluence/display/Hive/HCatalog](https://cwiki.apache.org/confluence/display/Hive/HCatalog)、[http://hadoop.apache.org/docs/current/](http://hadoop.apache.org/docs/current/)、[http://hive.apache.org/](http://hive.apache.org/)、[http://gethue.com/](http://gethue.com/)、[http://mahout.apache.org/](http://mahout.apache.org/)、[http://oozie.apache.org/](http://oozie.apache.org/)、[https://phoenix.apache.org/](https://phoenix.apache.org/)、[http://pig.apache.org/](http://pig.apache.org/)、[https://prestodb.io/](https://prestodb.io/)、[https://spark.apache.org/docs/latest/](https://spark.apache.org/docs/latest/)、[http://sqoop.apache.org/](http://sqoop.apache.org/)、[https://tez.apache.org/](https://tez.apache.org/)、[https://zeppelin.incubator.apache.org/](https://zeppelin.incubator.apache.org/) 和 [https://zookeeper.apache.org](https://zookeeper.apache.org)。

下表列出了此版本的 Amazon EMR 中提供的应用程序版本以及前三个 Amazon EMR 发行版中的应用程序版本（若适用）。

有关每个发行版的 Amazon EMR 的应用程序版本的全面历史记录，请参见以下主题：
+ [Amazon EMR 7.x 发行版中的应用程序版本](emr-release-app-versions-7.x.md)
+ [Amazon EMR 6.x 发行版中的应用程序版本](emr-release-app-versions-6.x.md)
+ [Amazon EMR 5.x 发行版中的应用程序版本](emr-release-app-versions-5.x.md)
+ [Amazon EMR 4.x 发行版中的应用程序版本](emr-release-app-versions-4.x.md)


**应用程序版本信息**  

|  | emr-4.7.4 | emr-4.7.3 | emr-4.7.2 | emr-4.7.1 | 
| --- | --- | --- | --- | --- | 
| AWS 适用于 Java 的 SDK | 1.10.75 | 1.10.75 | 1.10.75 | 1.10.75 | 
| Python | 未跟踪 | 未跟踪 | 未跟踪 | 未跟踪 | 
| Scala | 未跟踪 | 未跟踪 | 未跟踪 | 未跟踪 | 
| AmazonCloudWatchAgent |  -  |  -  |  -  |  -  | 
| Delta |  -  |  -  |  -  |  -  | 
| Flink |  -  |  -  |  -  |  -  | 
| Ganglia | 3.7.2 | 3.7.2 | 3.7.2 | 3.7.2 | 
| HBase | 1.2.1 | 1.2.1 | 1.2.1 | 1.2.1 | 
| HCatalog | 1.0.0-amzn-6 | 1.0.0-amzn-6 | 1.0.0-amzn-6 | 1.0.0-amzn-5 | 
| Hadoop | 2.7.2-amzn-3 | 2.7.2-amzn-3 | 2.7.2-amzn-3 | 2.7.2-amzn-2 | 
| Hive | 1.0.0-amzn-6 | 1.0.0-amzn-6 | 1.0.0-amzn-6 | 1.0.0-amzn-5 | 
| Hudi |  -  |  -  |  -  |  -  | 
| Hue | 3.7.1-amzn-7 | 3.7.1-amzn-7 | 3.7.1-amzn-7 | 3.7.1-amzn-7 | 
| Iceberg |  -  |  -  |  -  |  -  | 
| JupyterEnterpriseGateway |  -  |  -  |  -  |  -  | 
| JupyterHub |  -  |  -  |  -  |  -  | 
| Livy |  -  |  -  |  -  |  -  | 
| MXNet |  -  |  -  |  -  |  -  | 
| Mahout | 0.12.2 | 0.12.2 | 0.12.2 | 0.12.0 | 
| Oozie |  -  |  -  |  -  |  -  | 
| Oozie-Sandbox | 4.2.0 | 4.2.0 | 4.2.0 | 4.2.0 | 
| Phoenix | 4.7.0--1.2 HBase | 4.7.0--1.2 HBase | 4.7.0--1.2 HBase | 4.7.0--1.2 HBase | 
| Pig | 0.14.0-amzn-0 | 0.14.0-amzn-0 | 0.14.0-amzn-0 | 0.14.0-amzn-0 | 
| Presto |  -  |  -  |  -  |  -  | 
| Presto-Sandbox | 0.148 | 0.148 | 0.148 | 0.147 | 
| Spark | 1.6.2 | 1.6.2 | 1.6.2 | 1.6.1 | 
| Sqoop |  -  |  -  |  -  |  -  | 
| Sqoop-Sandbox | 1.4.6 | 1.4.6 | 1.4.6 | 1.4.6 | 
| TensorFlow |  -  |  -  |  -  |  -  | 
| Tez | 0.8.3 | 0.8.3 | 0.8.3 | 0.8.3 | 
| Trino (PrestoSQL) |  -  |  -  |  -  |  -  | 
| Zeppelin |  -  |  -  |  -  |  -  | 
| Zeppelin-Sandbox | 0.5.6-incubating | 0.5.6-incubating | 0.5.6-incubating | 0.5.6-incubating | 
| ZooKeeper |  -  |  -  |  -  |  -  | 
| ZooKeeper-Sandbox | 3.4.8 | 3.4.8 | 3.4.8 | 3.4.8 | 

## 4.7.4 发布说明
<a name="emr-474-relnotes"></a>

这是一个补丁版本，用于为向 Amazon S3 发出的请求添加 AWS 签名版本 4 身份验证。所有应用程序和组件都与之前的 Amazon EMR 发行版相同。

**重要**  
在此版本中，Amazon EMR 仅使用 AWS 签名版本 4 来验证向 Amazon S3 发出的请求。有关更多信息，请参阅[新功能](https://docs.aws.amazon.com/emr/latest/ReleaseGuide/emr-whatsnew.html)。

## 4.7.4 组件版本
<a name="emr-474-components"></a>

下面列出了 Amazon EMR 随此发行版一起安装的组件。一些组件作为大数据应用程序包的一部分安装。其它组件是 Amazon EMR 独有的，并且已为系统流程和功能安装这些组件。它们通常以 `emr` 或 `aws` 开头。最新的 Amazon EMR 发行版中的大数据应用程序包通常是在社区中找到的最新版本。我们会尽快在 Amazon EMR 中提供社区发行版。

Amazon EMR 中的某些组件与社区版本不同。这些组件具有以下形式的 `CommunityVersion-amzn-EmrVersion` 的发行版标注。`EmrVersion` 从 0 开始。例如，假设已对名为 `myapp-component` 的版本 2.2 的开源社区组件进行三次修改，以包含在不同的 Amazon EMR 发行版中，则其发行版将为 `2.2-amzn-2`。


| 组件 | 版本 | 说明 | 
| --- | --- | --- | 
| emr-ddb | 3.2.0 | 适用于 Hadoop 生态系统应用程序的 Amazon DynamoDB 连接器。 | 
| emr-goodies | 2.1.0 | 适用于 Hadoop 生态系统的方便易用的库。 | 
| emr-kinesis | 3.2.0 | 适用于 Hadoop 生态系统应用程序的 Amazon Kinesis 连接器。 | 
| emr-s3-dist-cp | 2.4.0 | 针对 Amazon S3 优化的分布式复制应用程序。 | 
| emrfs | 2.8.0 | 适用于 Hadoop 生态系统应用程序的 Amazon S3 连接器。 | 
| ganglia-monitor | 3.7.2 | 适用于 Hadoop 生态系统应用程序的嵌入式 Ganglia 代理以及 Ganglia 监控代理。 | 
| ganglia-metadata-collector | 3.7.2 | 用于从 Ganglia 监控代理中聚合指标的 Ganglia 元数据收集器。 | 
| ganglia-web | 3.7.1 | 用于查看由 Ganglia 元数据收集器收集的指标的 Web 应用程序。 | 
| hadoop-client | 2.7.2-amzn-3 | Hadoop 命令行客户端，如“hdfs”、“hadoop”或“yarn”。 | 
| hadoop-hdfs-datanode | 2.7.2-amzn-3 | 用于存储数据块的 HDFS 节点级服务。 | 
| hadoop-hdfs-library | 2.7.2-amzn-3 | HDFS 命令行客户端和库 | 
| hadoop-hdfs-namenode | 2.7.2-amzn-3 | 用于跟踪文件名和数据块位置的 HDFS 服务。 | 
| hadoop-httpfs-server | 2.7.2-amzn-3 | 用于 HDFS 操作的 HTTP 终端节点。 | 
| hadoop-kms-server | 2.7.2-amzn-3 | 基于 Hadoop 的 API 的加密密钥管理服务器。 KeyProvider  | 
| hadoop-mapred | 2.7.2-amzn-3 | MapReduce 用于运行 MapReduce 应用程序的执行引擎库。 | 
| hadoop-yarn-nodemanager | 2.7.2-amzn-3 | 用于管理单个节点上的容器的 YARN 服务。 | 
| hadoop-yarn-resourcemanager | 2.7.2-amzn-3 | 用于分配和管理集群资源与分布式应用程序的 YARN 服务。 | 
| hadoop-yarn-timeline-server | 2.7.2-amzn-3 | 用于检索 YARN 应用程序的当前信息和历史信息的服务。 | 
| hbase-hmaster | 1.2.1 | 为负责协调区域和执行管理命令的 HBase 集群提供服务。 | 
| hbase-region-server | 1.2.1 | 为一个或多个 HBase 地区提供服务的服务。 | 
| hbase-client | 1.2.1 | HBase 命令行客户端。 | 
| hbase-rest-server | 1.2.1 | 为提供 RESTful HTTP 端点的服务 HBase。 | 
| hbase-thrift-server | 1.2.1 | 为其提供 Thrift 端点的 HBase服务。 | 
| hcatalog-client | 1.0.0-amzn-6 | 用于操作 hcatalog-server 的“hcat”命令行客户端。 | 
| hcatalog-server | 1.0.0-amzn-6 | 提供服务 HCatalog，为分布式应用程序提供表和存储管理层。 | 
| hcatalog-webhcat-server | 1.0.0-amzn-6 | 为其提供 REST 接口的 HTTP 端点 HCatalog。 | 
| hive-client | 1.0.0-amzn-6 | Hive 命令行客户端。 | 
| hive-metastore-server | 1.0.0-amzn-6 | 用于访问 Hive 元存储 (一个用于存储 Hadoop 操作中的 SQL 的元数据的语义存储库) 的服务。 | 
| hive-server | 1.0.0-amzn-6 | 用于将 Hive 查询作为 Web 请求接受的服务。 | 
| hue-server | 3.7.1-amzn-7 | 用于使用 Hadoop 生态系统应用程序分析数据的 Web 应用程序 | 
| mahout-client | 0.12.2 | 用于机器学习的库。 | 
| mysql-server | 5.5.46 | MySQL 数据库服务器。 | 
| oozie-client | 4.2.0 | Oozie 命令行客户端。 | 
| oozie-server | 4.2.0 | 用于接受 Oozie 工作流请求的服务。 | 
| phoenix-library | 4.7.0--1.2 HBase | 服务器和客户端的 phoenix 库 | 
| phoenix-query-server | 4.7.0--1.2 HBase | 向 Avatica API 提供 JDBC 访问权限以及协议缓冲区和 JSON 格式访问权限的轻量级服务器  | 
| presto-coordinator | 0.148 | 用于在 presto-worker 之中接受查询并管理查询的服务。 | 
| presto-worker | 0.148 | 用于执行查询的各个部分的服务。 | 
| pig-client | 0.14.0-amzn-0 | Pig 命令行客户端。 | 
| spark-client | 1.6.2 | Spark 命令行客户端。 | 
| spark-history-server | 1.6.2 | 用于查看完整的 Spark 应用程序的生命周期的已记录事件的 Web UI。 | 
| spark-on-yarn | 1.6.2 | 适用于 YARN 的内存中执行引擎。 | 
| spark-yarn-slave | 1.6.2 | YARN 从属项所需的 Apache Spark 库。 | 
| sqoop-client | 1.4.6 | Apache Sqoop 命令行客户端。 | 
| tez-on-yarn | 0.8.3 | tez YARN 应用程序和库。 | 
| webserver | 2.4.23 | Apache HTTP 服务器。 | 
| zeppelin-server | 0.5.6-incubating | 支持交互式数据分析的基于 Web 的 Notebook。 | 
| zookeeper-server | 3.4.8 | 用于维护配置信息、命名、提供分布式同步以及提供组服务的集中式服务。 | 
| zookeeper-client | 3.4.8 | ZooKeeper 命令行客户端。 | 

## 4.7.4 配置分类
<a name="emr-474-class"></a>

配置分类允许您自定义应用程序。这些通常与应用程序的配置 XML 文件（例如 `hive-site.xml`）相对应。有关更多信息，请参阅[配置应用程序](emr-configure-apps.md)。


**emr-4.7.4 分类**  

| 分类 | 说明 | 
| --- | --- | 
| capacity-scheduler | 更改 Hadoop 的 capacity-scheduler.xml 文件中的值。 | 
| core-site | 更改 Hadoop 的 core-site.xml 文件中的值。 | 
| emrfs-site | 更改 EMRFS 设置。 | 
| hadoop-env | 更改适用于所有 Hadoop 组件的 Hadoop 环境中的值。 | 
| hadoop-log4j | 更改 Hadoop 的 log4j.properties 文件中的值。 | 
| hadoop-ssl-server | 更改 hadoop ssl 服务器配置 | 
| hadoop-ssl-client | 更改 hadoop ssl 客户端配置 | 
| hbase-env | 更改环境 HBase中的值。 | 
| hbase-log4j | 更改 hbase- HBase log4j.properties 文件中的值。 | 
| hbase-metrics | 更改 hadoop-metrics2-hb HBase aase.properties 文件中的值。 | 
| hbase-policy | 更改 hbase-policy.xml 文件 HBase中的值。 | 
| hbase-site | 更改 hbase-site.xml 文件 HBase中的值。 | 
| hdfs-encryption-zones | 配置 HDFS 加密区域。 | 
| hdfs-site | 更改 HDFS 的 hdfs-site.xml 中的值。 | 
| hcatalog-env | 更改环境 HCatalog中的值。 | 
| hcatalog-server-jndi | 更改 HCatalog的 jndi.properties 中的值。 | 
| hcatalog-server-proto-hive-site | 更改 proto-hive-site .x HCatalog ml 中的值。 | 
| hcatalog-webhcat-env | 更改 HCatalog Web 环境HCat中的值。 | 
| hcatalog-webhcat-log4j | 更改 HCatalog Web HCat 的 log4j.properties 中的值。 | 
| hcatalog-webhcat-site | 更改 HCatalog Web HCat 的 webhcat-site.xml 文件中的值。 | 
| hive-env | 更改 Hive 环境中的值。 | 
| hive-exec-log4j | 更改 Hive 的 hive-exec-log 4j.properties 文件中的值。 | 
| hive-log4j | 更改 Hive 的 hive-log4j.properties 文件中的值。 | 
| hive-site | 更改 Hive 的 hive-site.xml 文件中的值 | 
| hue-ini | 更改 Hue 的 ini 文件中的值 | 
| httpfs-env | 更改 HTTPFS 环境中的值。 | 
| httpfs-site | 更改 Hadoop 的 httpfs-site.xml 文件中的值。 | 
| hadoop-kms-acls | 更改 Hadoop 的 kms-acls.xml 文件中的值。 | 
| hadoop-kms-env | 更改 Hadoop KMS 环境中的值。 | 
| hadoop-kms-log4j | 更改 Hadoop 的 kms-log4j.properties 文件中的值。 | 
| hadoop-kms-site | 更改 Hadoop 的 kms-site.xml 文件中的值。 | 
| mapred-env | 更改 MapReduce 应用程序环境中的值。 | 
| mapred-site | 更改 MapReduce 应用程序的 mapred-site.xml 文件中的值。 | 
| oozie-env | 更改 Oozie 的环境中的值。 | 
| oozie-log4j | 更改 Oozie 的 oozie-log4j.properties 文件中的值。 | 
| oozie-site | 更改 Oozie 的 oozie-site.xml 文件中的值。 | 
| phoenix-hbase-metrics | 更改 Phoenix 的 hadoop-metrics2-hbase.properties 文件中的值。 | 
| phoenix-hbase-site | 更改 Phoenix 的 hbase-site.xml 文件中的值。 | 
| phoenix-log4j | 更改 Phoenix 的 log4j.properties 文件中的值。 | 
| phoenix-metrics | 更改 Phoenix 的 hadoop-metrics2-phoenix.properties 文件中的值。 | 
| pig-properties | 更改 Pig 的 pig.properties 文件中的值。 | 
| pig-log4j | 更改 Pig 的 log4j.properties 文件中的值。 | 
| presto-log | 更改 Presto 的 log.properties 文件中的值。 | 
| presto-config | 更改 Presto 的 config.properties 文件中的值。 | 
| presto-connector-hive | 更改 Presto 的 hive.properties 文件中的值。 | 
| spark | 适用于 Apache Spark 的 Amazon EMR 辅助设置。 | 
| spark-defaults | 更改 Spark 的 spark-defaults.conf 文件中的值。 | 
| spark-env | 更改 Spark 环境中的值。 | 
| spark-log4j | 更改 Spark 的 log4j.properties 文件中的值。 | 
| spark-metrics | 更改 Spark 的 metrics.properties 文件中的值。 | 
| sqoop-env | 更改 Sqoop 的环境中的值。 | 
| sqoop-oraoop-site | 更改 Sqoop OraOop 的 oraoop-site.xml 文件中的值。 | 
| sqoop-site | 更改 Sqoop 的 sqoop-site.xml 文件中的值。 | 
| tez-site | 更改 Tez 的 tez-site.xml 文件中的值。 | 
| yarn-env | 更改 YARN 环境中的值。 | 
| yarn-site | 更改 YARN 的 yarn-site.xml 文件中的值。 | 
| zeppelin-env | 更改 Zeppelin 环境中的值。 | 
| zookeeper-config | 更改 ZooKeeper的 zoo.cfg 文件中的值。 | 
| zookeeper-log4j | 更改 ZooKeeper的 log4j.properties 文件中的值。 | 

# Amazon EMR 发行版 4.7.3
<a name="emr-473-release"></a>

## 4.7.3 应用程序版本
<a name="emr-473-app-versions"></a>

此版本包括以下应用程序：[http://ganglia.info](http://ganglia.info)、[http://hbase.apache.org/](http://hbase.apache.org/)、[https://cwiki.apache.org/confluence/display/Hive/HCatalog](https://cwiki.apache.org/confluence/display/Hive/HCatalog)、[http://hadoop.apache.org/docs/current/](http://hadoop.apache.org/docs/current/)、[http://hive.apache.org/](http://hive.apache.org/)、[http://gethue.com/](http://gethue.com/)、[http://mahout.apache.org/](http://mahout.apache.org/)、[http://oozie.apache.org/](http://oozie.apache.org/)、[https://phoenix.apache.org/](https://phoenix.apache.org/)、[http://pig.apache.org/](http://pig.apache.org/)、[https://prestodb.io/](https://prestodb.io/)、[https://spark.apache.org/docs/latest/](https://spark.apache.org/docs/latest/)、[http://sqoop.apache.org/](http://sqoop.apache.org/)、[https://tez.apache.org/](https://tez.apache.org/)、[https://zeppelin.incubator.apache.org/](https://zeppelin.incubator.apache.org/) 和 [https://zookeeper.apache.org](https://zookeeper.apache.org)。

下表列出了此版本的 Amazon EMR 中提供的应用程序版本以及前三个 Amazon EMR 发行版中的应用程序版本（若适用）。

有关每个发行版的 Amazon EMR 的应用程序版本的全面历史记录，请参见以下主题：
+ [Amazon EMR 7.x 发行版中的应用程序版本](emr-release-app-versions-7.x.md)
+ [Amazon EMR 6.x 发行版中的应用程序版本](emr-release-app-versions-6.x.md)
+ [Amazon EMR 5.x 发行版中的应用程序版本](emr-release-app-versions-5.x.md)
+ [Amazon EMR 4.x 发行版中的应用程序版本](emr-release-app-versions-4.x.md)


**应用程序版本信息**  

|  | emr-4.7.3 | emr-4.7.2 | emr-4.7.1 | emr-4.7.0 | 
| --- | --- | --- | --- | --- | 
| AWS 适用于 Java 的 SDK | 1.10.75 | 1.10.75 | 1.10.75 | 1.10.75 | 
| Python | 未跟踪 | 未跟踪 | 未跟踪 | 未跟踪 | 
| Scala | 未跟踪 | 未跟踪 | 未跟踪 | 未跟踪 | 
| AmazonCloudWatchAgent |  -  |  -  |  -  |  -  | 
| Delta |  -  |  -  |  -  |  -  | 
| Flink |  -  |  -  |  -  |  -  | 
| Ganglia | 3.7.2 | 3.7.2 | 3.7.2 | 3.7.2 | 
| HBase | 1.2.1 | 1.2.1 | 1.2.1 | 1.2.1 | 
| HCatalog | 1.0.0-amzn-6 | 1.0.0-amzn-6 | 1.0.0-amzn-5 | 1.0.0-amzn-5 | 
| Hadoop | 2.7.2-amzn-3 | 2.7.2-amzn-3 | 2.7.2-amzn-2 | 2.7.2-amzn-2 | 
| Hive | 1.0.0-amzn-6 | 1.0.0-amzn-6 | 1.0.0-amzn-5 | 1.0.0-amzn-5 | 
| Hudi |  -  |  -  |  -  |  -  | 
| Hue | 3.7.1-amzn-7 | 3.7.1-amzn-7 | 3.7.1-amzn-7 | 3.7.1-amzn-7 | 
| Iceberg |  -  |  -  |  -  |  -  | 
| JupyterEnterpriseGateway |  -  |  -  |  -  |  -  | 
| JupyterHub |  -  |  -  |  -  |  -  | 
| Livy |  -  |  -  |  -  |  -  | 
| MXNet |  -  |  -  |  -  |  -  | 
| Mahout | 0.12.2 | 0.12.2 | 0.12.0 | 0.12.0 | 
| Oozie |  -  |  -  |  -  |  -  | 
| Oozie-Sandbox | 4.2.0 | 4.2.0 | 4.2.0 | 4.2.0 | 
| Phoenix | 4.7.0--1.2 HBase | 4.7.0--1.2 HBase | 4.7.0--1.2 HBase | 4.7.0--1.2 HBase | 
| Pig | 0.14.0-amzn-0 | 0.14.0-amzn-0 | 0.14.0-amzn-0 | 0.14.0-amzn-0 | 
| Presto |  -  |  -  |  -  |  -  | 
| Presto-Sandbox | 0.148 | 0.148 | 0.147 | 0.147 | 
| Spark | 1.6.2 | 1.6.2 | 1.6.1 | 1.6.1 | 
| Sqoop |  -  |  -  |  -  |  -  | 
| Sqoop-Sandbox | 1.4.6 | 1.4.6 | 1.4.6 | 1.4.6 | 
| TensorFlow |  -  |  -  |  -  |  -  | 
| Tez | 0.8.3 | 0.8.3 | 0.8.3 | 0.8.3 | 
| Trino (PrestoSQL) |  -  |  -  |  -  |  -  | 
| Zeppelin |  -  |  -  |  -  |  -  | 
| Zeppelin-Sandbox | 0.5.6-incubating | 0.5.6-incubating | 0.5.6-incubating | 0.5.6-incubating | 
| ZooKeeper |  -  |  -  |  -  |  -  | 
| ZooKeeper-Sandbox | 3.4.8 | 3.4.8 | 3.4.8 | 3.4.8 | 

## 4.7.3 发布说明
<a name="emr-473-relnotes"></a>

## 4.7.3 组件版本
<a name="emr-473-components"></a>

下面列出了 Amazon EMR 随此发行版一起安装的组件。一些组件作为大数据应用程序包的一部分安装。其它组件是 Amazon EMR 独有的，并且已为系统流程和功能安装这些组件。它们通常以 `emr` 或 `aws` 开头。最新的 Amazon EMR 发行版中的大数据应用程序包通常是在社区中找到的最新版本。我们会尽快在 Amazon EMR 中提供社区发行版。

Amazon EMR 中的某些组件与社区版本不同。这些组件具有以下形式的 `CommunityVersion-amzn-EmrVersion` 的发行版标注。`EmrVersion` 从 0 开始。例如，假设已对名为 `myapp-component` 的版本 2.2 的开源社区组件进行三次修改，以包含在不同的 Amazon EMR 发行版中，则其发行版将为 `2.2-amzn-2`。


| 组件 | 版本 | 说明 | 
| --- | --- | --- | 
| emr-ddb | 3.2.0 | 适用于 Hadoop 生态系统应用程序的 Amazon DynamoDB 连接器。 | 
| emr-goodies | 2.1.0 | 适用于 Hadoop 生态系统的方便易用的库。 | 
| emr-kinesis | 3.2.0 | 适用于 Hadoop 生态系统应用程序的 Amazon Kinesis 连接器。 | 
| emr-s3-dist-cp | 2.4.0 | 针对 Amazon S3 优化的分布式复制应用程序。 | 
| emrfs | 2.8.0 | 适用于 Hadoop 生态系统应用程序的 Amazon S3 连接器。 | 
| ganglia-monitor | 3.7.2 | 适用于 Hadoop 生态系统应用程序的嵌入式 Ganglia 代理以及 Ganglia 监控代理。 | 
| ganglia-metadata-collector | 3.7.2 | 用于从 Ganglia 监控代理中聚合指标的 Ganglia 元数据收集器。 | 
| ganglia-web | 3.7.1 | 用于查看由 Ganglia 元数据收集器收集的指标的 Web 应用程序。 | 
| hadoop-client | 2.7.2-amzn-3 | Hadoop 命令行客户端，如“hdfs”、“hadoop”或“yarn”。 | 
| hadoop-hdfs-datanode | 2.7.2-amzn-3 | 用于存储数据块的 HDFS 节点级服务。 | 
| hadoop-hdfs-library | 2.7.2-amzn-3 | HDFS 命令行客户端和库 | 
| hadoop-hdfs-namenode | 2.7.2-amzn-3 | 用于跟踪文件名和数据块位置的 HDFS 服务。 | 
| hadoop-httpfs-server | 2.7.2-amzn-3 | 用于 HDFS 操作的 HTTP 终端节点。 | 
| hadoop-kms-server | 2.7.2-amzn-3 | 基于 Hadoop 的 API 的加密密钥管理服务器。 KeyProvider  | 
| hadoop-mapred | 2.7.2-amzn-3 | MapReduce 用于运行 MapReduce 应用程序的执行引擎库。 | 
| hadoop-yarn-nodemanager | 2.7.2-amzn-3 | 用于管理单个节点上的容器的 YARN 服务。 | 
| hadoop-yarn-resourcemanager | 2.7.2-amzn-3 | 用于分配和管理集群资源与分布式应用程序的 YARN 服务。 | 
| hadoop-yarn-timeline-server | 2.7.2-amzn-3 | 用于检索 YARN 应用程序的当前信息和历史信息的服务。 | 
| hbase-hmaster | 1.2.1 | 为负责协调区域和执行管理命令的 HBase 集群提供服务。 | 
| hbase-region-server | 1.2.1 | 为一个或多个 HBase 地区提供服务的服务。 | 
| hbase-client | 1.2.1 | HBase 命令行客户端。 | 
| hbase-rest-server | 1.2.1 | 为提供 RESTful HTTP 端点的服务 HBase。 | 
| hbase-thrift-server | 1.2.1 | 为其提供 Thrift 端点的 HBase服务。 | 
| hcatalog-client | 1.0.0-amzn-6 | 用于操作 hcatalog-server 的“hcat”命令行客户端。 | 
| hcatalog-server | 1.0.0-amzn-6 | 提供服务 HCatalog，为分布式应用程序提供表和存储管理层。 | 
| hcatalog-webhcat-server | 1.0.0-amzn-6 | 为其提供 REST 接口的 HTTP 端点 HCatalog。 | 
| hive-client | 1.0.0-amzn-6 | Hive 命令行客户端。 | 
| hive-metastore-server | 1.0.0-amzn-6 | 用于访问 Hive 元存储 (一个用于存储 Hadoop 操作中的 SQL 的元数据的语义存储库) 的服务。 | 
| hive-server | 1.0.0-amzn-6 | 用于将 Hive 查询作为 Web 请求接受的服务。 | 
| hue-server | 3.7.1-amzn-7 | 用于使用 Hadoop 生态系统应用程序分析数据的 Web 应用程序 | 
| mahout-client | 0.12.2 | 用于机器学习的库。 | 
| mysql-server | 5.5.46 | MySQL 数据库服务器。 | 
| oozie-client | 4.2.0 | Oozie 命令行客户端。 | 
| oozie-server | 4.2.0 | 用于接受 Oozie 工作流请求的服务。 | 
| phoenix-library | 4.7.0--1.2 HBase | 服务器和客户端的 phoenix 库 | 
| phoenix-query-server | 4.7.0--1.2 HBase | 向 Avatica API 提供 JDBC 访问权限以及协议缓冲区和 JSON 格式访问权限的轻量级服务器  | 
| presto-coordinator | 0.148 | 用于在 presto-worker 之中接受查询并管理查询的服务。 | 
| presto-worker | 0.148 | 用于执行查询的各个部分的服务。 | 
| pig-client | 0.14.0-amzn-0 | Pig 命令行客户端。 | 
| spark-client | 1.6.2 | Spark 命令行客户端。 | 
| spark-history-server | 1.6.2 | 用于查看完整的 Spark 应用程序的生命周期的已记录事件的 Web UI。 | 
| spark-on-yarn | 1.6.2 | 适用于 YARN 的内存中执行引擎。 | 
| spark-yarn-slave | 1.6.2 | YARN 从属项所需的 Apache Spark 库。 | 
| sqoop-client | 1.4.6 | Apache Sqoop 命令行客户端。 | 
| tez-on-yarn | 0.8.3 | tez YARN 应用程序和库。 | 
| webserver | 2.4.23 | Apache HTTP 服务器。 | 
| zeppelin-server | 0.5.6-incubating | 支持交互式数据分析的基于 Web 的 Notebook。 | 
| zookeeper-server | 3.4.8 | 用于维护配置信息、命名、提供分布式同步以及提供组服务的集中式服务。 | 
| zookeeper-client | 3.4.8 | ZooKeeper 命令行客户端。 | 

## 4.7.3 配置分类
<a name="emr-473-class"></a>

配置分类允许您自定义应用程序。这些通常与应用程序的配置 XML 文件（例如 `hive-site.xml`）相对应。有关更多信息，请参阅 [配置应用程序](emr-configure-apps.md)。


**emr-4.7.3 分类**  

| 分类 | 说明 | 
| --- | --- | 
| capacity-scheduler | 更改 Hadoop 的 capacity-scheduler.xml 文件中的值。 | 
| core-site | 更改 Hadoop 的 core-site.xml 文件中的值。 | 
| emrfs-site | 更改 EMRFS 设置。 | 
| hadoop-env | 更改适用于所有 Hadoop 组件的 Hadoop 环境中的值。 | 
| hadoop-log4j | 更改 Hadoop 的 log4j.properties 文件中的值。 | 
| hadoop-ssl-server | 更改 hadoop ssl 服务器配置 | 
| hadoop-ssl-client | 更改 hadoop ssl 客户端配置 | 
| hbase-env | 更改环境 HBase中的值。 | 
| hbase-log4j | 更改 hbase- HBase log4j.properties 文件中的值。 | 
| hbase-metrics | 更改 hadoop-metrics2-hb HBase aase.properties 文件中的值。 | 
| hbase-policy | 更改 hbase-policy.xml 文件 HBase中的值。 | 
| hbase-site | 更改 hbase-site.xml 文件 HBase中的值。 | 
| hdfs-encryption-zones | 配置 HDFS 加密区域。 | 
| hdfs-site | 更改 HDFS 的 hdfs-site.xml 中的值。 | 
| hcatalog-env | 更改环境 HCatalog中的值。 | 
| hcatalog-server-jndi | 更改 HCatalog的 jndi.properties 中的值。 | 
| hcatalog-server-proto-hive-site | 更改 proto-hive-site .x HCatalog ml 中的值。 | 
| hcatalog-webhcat-env | 更改 HCatalog Web 环境HCat中的值。 | 
| hcatalog-webhcat-log4j | 更改 HCatalog Web HCat 的 log4j.properties 中的值。 | 
| hcatalog-webhcat-site | 更改 HCatalog Web HCat 的 webhcat-site.xml 文件中的值。 | 
| hive-env | 更改 Hive 环境中的值。 | 
| hive-exec-log4j | 更改 Hive 的 hive-exec-log 4j.properties 文件中的值。 | 
| hive-log4j | 更改 Hive 的 hive-log4j.properties 文件中的值。 | 
| hive-site | 更改 Hive 的 hive-site.xml 文件中的值 | 
| hue-ini | 更改 Hue 的 ini 文件中的值 | 
| httpfs-env | 更改 HTTPFS 环境中的值。 | 
| httpfs-site | 更改 Hadoop 的 httpfs-site.xml 文件中的值。 | 
| hadoop-kms-acls | 更改 Hadoop 的 kms-acls.xml 文件中的值。 | 
| hadoop-kms-env | 更改 Hadoop KMS 环境中的值。 | 
| hadoop-kms-log4j | 更改 Hadoop 的 kms-log4j.properties 文件中的值。 | 
| hadoop-kms-site | 更改 Hadoop 的 kms-site.xml 文件中的值。 | 
| mapred-env | 更改 MapReduce 应用程序环境中的值。 | 
| mapred-site | 更改 MapReduce 应用程序的 mapred-site.xml 文件中的值。 | 
| oozie-env | 更改 Oozie 的环境中的值。 | 
| oozie-log4j | 更改 Oozie 的 oozie-log4j.properties 文件中的值。 | 
| oozie-site | 更改 Oozie 的 oozie-site.xml 文件中的值。 | 
| phoenix-hbase-metrics | 更改 Phoenix 的 hadoop-metrics2-hbase.properties 文件中的值。 | 
| phoenix-hbase-site | 更改 Phoenix 的 hbase-site.xml 文件中的值。 | 
| phoenix-log4j | 更改 Phoenix 的 log4j.properties 文件中的值。 | 
| phoenix-metrics | 更改 Phoenix 的 hadoop-metrics2-phoenix.properties 文件中的值。 | 
| pig-properties | 更改 Pig 的 pig.properties 文件中的值。 | 
| pig-log4j | 更改 Pig 的 log4j.properties 文件中的值。 | 
| presto-log | 更改 Presto 的 log.properties 文件中的值。 | 
| presto-config | 更改 Presto 的 config.properties 文件中的值。 | 
| presto-connector-hive | 更改 Presto 的 hive.properties 文件中的值。 | 
| spark | 适用于 Apache Spark 的 Amazon EMR 辅助设置。 | 
| spark-defaults | 更改 Spark 的 spark-defaults.conf 文件中的值。 | 
| spark-env | 更改 Spark 环境中的值。 | 
| spark-log4j | 更改 Spark 的 log4j.properties 文件中的值。 | 
| spark-metrics | 更改 Spark 的 metrics.properties 文件中的值。 | 
| sqoop-env | 更改 Sqoop 的环境中的值。 | 
| sqoop-oraoop-site | 更改 Sqoop OraOop 的 oraoop-site.xml 文件中的值。 | 
| sqoop-site | 更改 Sqoop 的 sqoop-site.xml 文件中的值。 | 
| tez-site | 更改 Tez 的 tez-site.xml 文件中的值。 | 
| yarn-env | 更改 YARN 环境中的值。 | 
| yarn-site | 更改 YARN 的 yarn-site.xml 文件中的值。 | 
| zeppelin-env | 更改 Zeppelin 环境中的值。 | 
| zookeeper-config | 更改 ZooKeeper的 zoo.cfg 文件中的值。 | 
| zookeeper-log4j | 更改 ZooKeeper的 log4j.properties 文件中的值。 | 

# Amazon EMR 发行版 4.7.2
<a name="emr-472-release"></a>

## 4.7.2 应用程序版本
<a name="emr-472-app-versions"></a>

此版本包括以下应用程序：[http://ganglia.info](http://ganglia.info)、[http://hbase.apache.org/](http://hbase.apache.org/)、[https://cwiki.apache.org/confluence/display/Hive/HCatalog](https://cwiki.apache.org/confluence/display/Hive/HCatalog)、[http://hadoop.apache.org/docs/current/](http://hadoop.apache.org/docs/current/)、[http://hive.apache.org/](http://hive.apache.org/)、[http://gethue.com/](http://gethue.com/)、[http://mahout.apache.org/](http://mahout.apache.org/)、[http://oozie.apache.org/](http://oozie.apache.org/)、[https://phoenix.apache.org/](https://phoenix.apache.org/)、[http://pig.apache.org/](http://pig.apache.org/)、[https://prestodb.io/](https://prestodb.io/)、[https://spark.apache.org/docs/latest/](https://spark.apache.org/docs/latest/)、[http://sqoop.apache.org/](http://sqoop.apache.org/)、[https://tez.apache.org/](https://tez.apache.org/)、[https://zeppelin.incubator.apache.org/](https://zeppelin.incubator.apache.org/) 和 [https://zookeeper.apache.org](https://zookeeper.apache.org)。

下表列出了此版本的 Amazon EMR 中提供的应用程序版本以及前三个 Amazon EMR 发行版中的应用程序版本（若适用）。

有关每个发行版的 Amazon EMR 的应用程序版本的全面历史记录，请参见以下主题：
+ [Amazon EMR 7.x 发行版中的应用程序版本](emr-release-app-versions-7.x.md)
+ [Amazon EMR 6.x 发行版中的应用程序版本](emr-release-app-versions-6.x.md)
+ [Amazon EMR 5.x 发行版中的应用程序版本](emr-release-app-versions-5.x.md)
+ [Amazon EMR 4.x 发行版中的应用程序版本](emr-release-app-versions-4.x.md)


**应用程序版本信息**  

|  | emr-4.7.2 | emr-4.7.1 | emr-4.7.0 | emr-4.6.1 | 
| --- | --- | --- | --- | --- | 
| AWS 适用于 Java 的 SDK | 1.10.75 | 1.10.75 | 1.10.75 | 1.10.27 | 
| Python | 未跟踪 | 未跟踪 | 未跟踪 | 未跟踪 | 
| Scala | 未跟踪 | 未跟踪 | 未跟踪 | 未跟踪 | 
| AmazonCloudWatchAgent |  -  |  -  |  -  |  -  | 
| Delta |  -  |  -  |  -  |  -  | 
| Flink |  -  |  -  |  -  |  -  | 
| Ganglia | 3.7.2 | 3.7.2 | 3.7.2 | 3.7.2 | 
| HBase | 1.2.1 | 1.2.1 | 1.2.1 | 1.2.0 | 
| HCatalog | 1.0.0-amzn-6 | 1.0.0-amzn-5 | 1.0.0-amzn-5 | 1.0.0-amzn-4 | 
| Hadoop | 2.7.2-amzn-3 | 2.7.2-amzn-2 | 2.7.2-amzn-2 | 2.7.2-amzn-1 | 
| Hive | 1.0.0-amzn-6 | 1.0.0-amzn-5 | 1.0.0-amzn-5 | 1.0.0-amzn-4 | 
| Hudi |  -  |  -  |  -  |  -  | 
| Hue | 3.7.1-amzn-7 | 3.7.1-amzn-7 | 3.7.1-amzn-7 | 3.7.1-amzn-6 | 
| Iceberg |  -  |  -  |  -  |  -  | 
| JupyterEnterpriseGateway |  -  |  -  |  -  |  -  | 
| JupyterHub |  -  |  -  |  -  |  -  | 
| Livy |  -  |  -  |  -  |  -  | 
| MXNet |  -  |  -  |  -  |  -  | 
| Mahout | 0.12.2 | 0.12.0 | 0.12.0 | 0.11.1 | 
| Oozie |  -  |  -  |  -  |  -  | 
| Oozie-Sandbox | 4.2.0 | 4.2.0 | 4.2.0 | 4.2.0 | 
| Phoenix | 4.7.0--1.2 HBase | 4.7.0--1.2 HBase | 4.7.0--1.2 HBase |  -  | 
| Pig | 0.14.0-amzn-0 | 0.14.0-amzn-0 | 0.14.0-amzn-0 | 0.14.0-amzn-0 | 
| Presto |  -  |  -  |  -  |  -  | 
| Presto-Sandbox | 0.148 | 0.147 | 0.147 | 0.143 | 
| Spark | 1.6.2 | 1.6.1 | 1.6.1 | 1.6.1 | 
| Sqoop |  -  |  -  |  -  |  -  | 
| Sqoop-Sandbox | 1.4.6 | 1.4.6 | 1.4.6 | 1.4.6 | 
| TensorFlow |  -  |  -  |  -  |  -  | 
| Tez | 0.8.3 | 0.8.3 | 0.8.3 |  -  | 
| Trino (PrestoSQL) |  -  |  -  |  -  |  -  | 
| Zeppelin |  -  |  -  |  -  |  -  | 
| Zeppelin-Sandbox | 0.5.6-incubating | 0.5.6-incubating | 0.5.6-incubating | 0.5.6-incubating | 
| ZooKeeper |  -  |  -  |  -  |  -  | 
| ZooKeeper-Sandbox | 3.4.8 | 3.4.8 | 3.4.8 | 3.4.8 | 

## 4.7.2 发布说明
<a name="emr-472-relnotes"></a>

以下发布说明包括有关 Amazon EMR 4.7.2 的信息。

发布日期：2016 年 7 月 15 日

**功能**
+ 已升级到 Mahout 0.12.2
+ 已升级到 Presto 0.148
+ 已升级到 Spark 1.6.2
+ 现在，您可以使用 URI 作为参数创建用于 EMRFS 的 AWSCredentials提供程序。有关更多信息，请参阅为 [EMRFS 创建 AWSCredentials提供程序](https://docs.aws.amazon.com/emr/latest/ReleaseGuide/emr-plan-credentialsprovider.html)。
+ EMRFS 现在允许用户使用 `emrfs-site.xml` 中的 `fs.s3.consistent.dynamodb.endpoint` 属性来为其一致视图元数据配置自定义 DynamoDB 终端节点。
+ 在 `/usr/bin` 中添加了一个名为 `spark-example` 的脚本，它将包装 `/usr/lib/spark/spark/bin/run-example`，因此您可以直接运行示例。 SparkPi 例如，要运行 Spark 发行版附带的示例，可以`spark-example SparkPi 100`从命令行运行，也可以`command-runner.jar`将其用作 API 中的一个步骤。

**早期版本中已解决的已知问题**
+ 修复了 Oozie 在安装 Spark 后拥有的 `spark-assembly.jar` 未位于正确位置 (这导致使用 Oozie 启动 Spark 应用程序失败) 的问题。
+ 修复了与 YARN 容器中基于 Spark Log4j 的登录有关的问题。

## 4.7.2 组件版本
<a name="emr-472-components"></a>

下面列出了 Amazon EMR 随此发行版一起安装的组件。一些组件作为大数据应用程序包的一部分安装。其它组件是 Amazon EMR 独有的，并且已为系统流程和功能安装这些组件。它们通常以 `emr` 或 `aws` 开头。最新的 Amazon EMR 发行版中的大数据应用程序包通常是在社区中找到的最新版本。我们会尽快在 Amazon EMR 中提供社区发行版。

Amazon EMR 中的某些组件与社区版本不同。这些组件具有以下形式的 `CommunityVersion-amzn-EmrVersion` 的发行版标注。`EmrVersion` 从 0 开始。例如，假设已对名为 `myapp-component` 的版本 2.2 的开源社区组件进行三次修改，以包含在不同的 Amazon EMR 发行版中，则其发行版将为 `2.2-amzn-2`。


| 组件 | 版本 | 说明 | 
| --- | --- | --- | 
| emr-ddb | 3.2.0 | 适用于 Hadoop 生态系统应用程序的 Amazon DynamoDB 连接器。 | 
| emr-goodies | 2.1.0 | 适用于 Hadoop 生态系统的方便易用的库。 | 
| emr-kinesis | 3.2.0 | 适用于 Hadoop 生态系统应用程序的 Amazon Kinesis 连接器。 | 
| emr-s3-dist-cp | 2.4.0 | 针对 Amazon S3 优化的分布式复制应用程序。 | 
| emrfs | 2.8.0 | 适用于 Hadoop 生态系统应用程序的 Amazon S3 连接器。 | 
| ganglia-monitor | 3.7.2 | 适用于 Hadoop 生态系统应用程序的嵌入式 Ganglia 代理以及 Ganglia 监控代理。 | 
| ganglia-metadata-collector | 3.7.2 | 用于从 Ganglia 监控代理中聚合指标的 Ganglia 元数据收集器。 | 
| ganglia-web | 3.7.1 | 用于查看由 Ganglia 元数据收集器收集的指标的 Web 应用程序。 | 
| hadoop-client | 2.7.2-amzn-3 | Hadoop 命令行客户端，如“hdfs”、“hadoop”或“yarn”。 | 
| hadoop-hdfs-datanode | 2.7.2-amzn-3 | 用于存储数据块的 HDFS 节点级服务。 | 
| hadoop-hdfs-library | 2.7.2-amzn-3 | HDFS 命令行客户端和库 | 
| hadoop-hdfs-namenode | 2.7.2-amzn-3 | 用于跟踪文件名和数据块位置的 HDFS 服务。 | 
| hadoop-httpfs-server | 2.7.2-amzn-3 | 用于 HDFS 操作的 HTTP 终端节点。 | 
| hadoop-kms-server | 2.7.2-amzn-3 | 基于 Hadoop 的 API 的加密密钥管理服务器。 KeyProvider  | 
| hadoop-mapred | 2.7.2-amzn-3 | MapReduce 用于运行 MapReduce 应用程序的执行引擎库。 | 
| hadoop-yarn-nodemanager | 2.7.2-amzn-3 | 用于管理单个节点上的容器的 YARN 服务。 | 
| hadoop-yarn-resourcemanager | 2.7.2-amzn-3 | 用于分配和管理集群资源与分布式应用程序的 YARN 服务。 | 
| hadoop-yarn-timeline-server | 2.7.2-amzn-3 | 用于检索 YARN 应用程序的当前信息和历史信息的服务。 | 
| hbase-hmaster | 1.2.1 | 为负责协调区域和执行管理命令的 HBase 集群提供服务。 | 
| hbase-region-server | 1.2.1 | 为一个或多个 HBase 地区提供服务的服务。 | 
| hbase-client | 1.2.1 | HBase 命令行客户端。 | 
| hbase-rest-server | 1.2.1 | 为提供 RESTful HTTP 端点的服务 HBase。 | 
| hbase-thrift-server | 1.2.1 | 为其提供 Thrift 端点的 HBase服务。 | 
| hcatalog-client | 1.0.0-amzn-6 | 用于操作 hcatalog-server 的“hcat”命令行客户端。 | 
| hcatalog-server | 1.0.0-amzn-6 | 提供服务 HCatalog，为分布式应用程序提供表和存储管理层。 | 
| hcatalog-webhcat-server | 1.0.0-amzn-6 | 为其提供 REST 接口的 HTTP 端点 HCatalog。 | 
| hive-client | 1.0.0-amzn-6 | Hive 命令行客户端。 | 
| hive-metastore-server | 1.0.0-amzn-6 | 用于访问 Hive 元存储 (一个用于存储 Hadoop 操作中的 SQL 的元数据的语义存储库) 的服务。 | 
| hive-server | 1.0.0-amzn-6 | 用于将 Hive 查询作为 Web 请求接受的服务。 | 
| hue-server | 3.7.1-amzn-7 | 用于使用 Hadoop 生态系统应用程序分析数据的 Web 应用程序 | 
| mahout-client | 0.12.2 | 用于机器学习的库。 | 
| mysql-server | 5.5.46 | MySQL 数据库服务器。 | 
| oozie-client | 4.2.0 | Oozie 命令行客户端。 | 
| oozie-server | 4.2.0 | 用于接受 Oozie 工作流请求的服务。 | 
| phoenix-library | 4.7.0--1.2 HBase | 服务器和客户端的 phoenix 库 | 
| phoenix-query-server | 4.7.0--1.2 HBase | 向 Avatica API 提供 JDBC 访问权限以及协议缓冲区和 JSON 格式访问权限的轻量级服务器  | 
| presto-coordinator | 0.148 | 用于在 presto-worker 之中接受查询并管理查询的服务。 | 
| presto-worker | 0.148 | 用于执行查询的各个部分的服务。 | 
| pig-client | 0.14.0-amzn-0 | Pig 命令行客户端。 | 
| spark-client | 1.6.2 | Spark 命令行客户端。 | 
| spark-history-server | 1.6.2 | 用于查看完整的 Spark 应用程序的生命周期的已记录事件的 Web UI。 | 
| spark-on-yarn | 1.6.2 | 适用于 YARN 的内存中执行引擎。 | 
| spark-yarn-slave | 1.6.2 | YARN 从属项所需的 Apache Spark 库。 | 
| sqoop-client | 1.4.6 | Apache Sqoop 命令行客户端。 | 
| tez-on-yarn | 0.8.3 | tez YARN 应用程序和库。 | 
| webserver | 2.4.23 | Apache HTTP 服务器。 | 
| zeppelin-server | 0.5.6-incubating | 支持交互式数据分析的基于 Web 的 Notebook。 | 
| zookeeper-server | 3.4.8 | 用于维护配置信息、命名、提供分布式同步以及提供组服务的集中式服务。 | 
| zookeeper-client | 3.4.8 | ZooKeeper 命令行客户端。 | 

## 4.7.2 配置分类
<a name="emr-472-class"></a>

配置分类允许您自定义应用程序。这些通常与应用程序的配置 XML 文件（例如 `hive-site.xml`）相对应。有关更多信息，请参阅[配置应用程序](emr-configure-apps.md)。


**emr-4.7.2 分类**  

| 分类 | 说明 | 
| --- | --- | 
| capacity-scheduler | 更改 Hadoop 的 capacity-scheduler.xml 文件中的值。 | 
| core-site | 更改 Hadoop 的 core-site.xml 文件中的值。 | 
| emrfs-site | 更改 EMRFS 设置。 | 
| hadoop-env | 更改适用于所有 Hadoop 组件的 Hadoop 环境中的值。 | 
| hadoop-log4j | 更改 Hadoop 的 log4j.properties 文件中的值。 | 
| hadoop-ssl-server | 更改 hadoop ssl 服务器配置 | 
| hadoop-ssl-client | 更改 hadoop ssl 客户端配置 | 
| hbase-env | 更改环境 HBase中的值。 | 
| hbase-log4j | 更改 hbase- HBase log4j.properties 文件中的值。 | 
| hbase-metrics | 更改 hadoop-metrics2-hb HBase aase.properties 文件中的值。 | 
| hbase-policy | 更改 hbase-policy.xml 文件 HBase中的值。 | 
| hbase-site | 更改 hbase-site.xml 文件 HBase中的值。 | 
| hdfs-encryption-zones | 配置 HDFS 加密区域。 | 
| hdfs-site | 更改 HDFS 的 hdfs-site.xml 中的值。 | 
| hcatalog-env | 更改环境 HCatalog中的值。 | 
| hcatalog-server-jndi | 更改 HCatalog的 jndi.properties 中的值。 | 
| hcatalog-server-proto-hive-site | 更改 proto-hive-site .x HCatalog ml 中的值。 | 
| hcatalog-webhcat-env | 更改 HCatalog Web 环境HCat中的值。 | 
| hcatalog-webhcat-log4j | 更改 HCatalog Web HCat 的 log4j.properties 中的值。 | 
| hcatalog-webhcat-site | 更改 HCatalog Web HCat 的 webhcat-site.xml 文件中的值。 | 
| hive-env | 更改 Hive 环境中的值。 | 
| hive-exec-log4j | 更改 Hive 的 hive-exec-log 4j.properties 文件中的值。 | 
| hive-log4j | 更改 Hive 的 hive-log4j.properties 文件中的值。 | 
| hive-site | 更改 Hive 的 hive-site.xml 文件中的值 | 
| hue-ini | 更改 Hue 的 ini 文件中的值 | 
| httpfs-env | 更改 HTTPFS 环境中的值。 | 
| httpfs-site | 更改 Hadoop 的 httpfs-site.xml 文件中的值。 | 
| hadoop-kms-acls | 更改 Hadoop 的 kms-acls.xml 文件中的值。 | 
| hadoop-kms-env | 更改 Hadoop KMS 环境中的值。 | 
| hadoop-kms-log4j | 更改 Hadoop 的 kms-log4j.properties 文件中的值。 | 
| hadoop-kms-site | 更改 Hadoop 的 kms-site.xml 文件中的值。 | 
| mapred-env | 更改 MapReduce 应用程序环境中的值。 | 
| mapred-site | 更改 MapReduce 应用程序的 mapred-site.xml 文件中的值。 | 
| oozie-env | 更改 Oozie 的环境中的值。 | 
| oozie-log4j | 更改 Oozie 的 oozie-log4j.properties 文件中的值。 | 
| oozie-site | 更改 Oozie 的 oozie-site.xml 文件中的值。 | 
| phoenix-hbase-metrics | 更改 Phoenix 的 hadoop-metrics2-hbase.properties 文件中的值。 | 
| phoenix-hbase-site | 更改 Phoenix 的 hbase-site.xml 文件中的值。 | 
| phoenix-log4j | 更改 Phoenix 的 log4j.properties 文件中的值。 | 
| phoenix-metrics | 更改 Phoenix 的 hadoop-metrics2-phoenix.properties 文件中的值。 | 
| pig-properties | 更改 Pig 的 pig.properties 文件中的值。 | 
| pig-log4j | 更改 Pig 的 log4j.properties 文件中的值。 | 
| presto-log | 更改 Presto 的 log.properties 文件中的值。 | 
| presto-config | 更改 Presto 的 config.properties 文件中的值。 | 
| presto-connector-hive | 更改 Presto 的 hive.properties 文件中的值。 | 
| spark | 适用于 Apache Spark 的 Amazon EMR 辅助设置。 | 
| spark-defaults | 更改 Spark 的 spark-defaults.conf 文件中的值。 | 
| spark-env | 更改 Spark 环境中的值。 | 
| spark-log4j | 更改 Spark 的 log4j.properties 文件中的值。 | 
| spark-metrics | 更改 Spark 的 metrics.properties 文件中的值。 | 
| sqoop-env | 更改 Sqoop 的环境中的值。 | 
| sqoop-oraoop-site | 更改 Sqoop OraOop 的 oraoop-site.xml 文件中的值。 | 
| sqoop-site | 更改 Sqoop 的 sqoop-site.xml 文件中的值。 | 
| tez-site | 更改 Tez 的 tez-site.xml 文件中的值。 | 
| yarn-env | 更改 YARN 环境中的值。 | 
| yarn-site | 更改 YARN 的 yarn-site.xml 文件中的值。 | 
| zeppelin-env | 更改 Zeppelin 环境中的值。 | 
| zookeeper-config | 更改 ZooKeeper的 zoo.cfg 文件中的值。 | 
| zookeeper-log4j | 更改 ZooKeeper的 log4j.properties 文件中的值。 | 

# Amazon EMR 发行版 4.7.1
<a name="emr-471-release"></a>

## 4.7.1 应用程序版本
<a name="emr-471-app-versions"></a>

此版本包括以下应用程序：[http://ganglia.info](http://ganglia.info)、[http://hbase.apache.org/](http://hbase.apache.org/)、[https://cwiki.apache.org/confluence/display/Hive/HCatalog](https://cwiki.apache.org/confluence/display/Hive/HCatalog)、[http://hadoop.apache.org/docs/current/](http://hadoop.apache.org/docs/current/)、[http://hive.apache.org/](http://hive.apache.org/)、[http://gethue.com/](http://gethue.com/)、[http://mahout.apache.org/](http://mahout.apache.org/)、[http://oozie.apache.org/](http://oozie.apache.org/)、[https://phoenix.apache.org/](https://phoenix.apache.org/)、[http://pig.apache.org/](http://pig.apache.org/)、[https://prestodb.io/](https://prestodb.io/)、[https://spark.apache.org/docs/latest/](https://spark.apache.org/docs/latest/)、[http://sqoop.apache.org/](http://sqoop.apache.org/)、[https://tez.apache.org/](https://tez.apache.org/)、[https://zeppelin.incubator.apache.org/](https://zeppelin.incubator.apache.org/) 和 [https://zookeeper.apache.org](https://zookeeper.apache.org)。

下表列出了此版本的 Amazon EMR 中提供的应用程序版本以及前三个 Amazon EMR 发行版中的应用程序版本（若适用）。

有关每个发行版的 Amazon EMR 的应用程序版本的全面历史记录，请参见以下主题：
+ [Amazon EMR 7.x 发行版中的应用程序版本](emr-release-app-versions-7.x.md)
+ [Amazon EMR 6.x 发行版中的应用程序版本](emr-release-app-versions-6.x.md)
+ [Amazon EMR 5.x 发行版中的应用程序版本](emr-release-app-versions-5.x.md)
+ [Amazon EMR 4.x 发行版中的应用程序版本](emr-release-app-versions-4.x.md)


**应用程序版本信息**  

|  | emr-4.7.1 | emr-4.7.0 | emr-4.6.1 | emr-4.6.0 | 
| --- | --- | --- | --- | --- | 
| AWS 适用于 Java 的 SDK | 1.10.75 | 1.10.75 | 1.10.27 | 1.10.27 | 
| Python | 未跟踪 | 未跟踪 | 未跟踪 | 未跟踪 | 
| Scala | 未跟踪 | 未跟踪 | 未跟踪 | 未跟踪 | 
| AmazonCloudWatchAgent |  -  |  -  |  -  |  -  | 
| Delta |  -  |  -  |  -  |  -  | 
| Flink |  -  |  -  |  -  |  -  | 
| Ganglia | 3.7.2 | 3.7.2 | 3.7.2 | 3.7.2 | 
| HBase | 1.2.1 | 1.2.1 | 1.2.0 | 1.2.0 | 
| HCatalog | 1.0.0-amzn-5 | 1.0.0-amzn-5 | 1.0.0-amzn-4 | 1.0.0-amzn-4 | 
| Hadoop | 2.7.2-amzn-2 | 2.7.2-amzn-2 | 2.7.2-amzn-1 | 2.7.2-amzn-1 | 
| Hive | 1.0.0-amzn-5 | 1.0.0-amzn-5 | 1.0.0-amzn-4 | 1.0.0-amzn-4 | 
| Hudi |  -  |  -  |  -  |  -  | 
| Hue | 3.7.1-amzn-7 | 3.7.1-amzn-7 | 3.7.1-amzn-6 | 3.7.1-amzn-6 | 
| Iceberg |  -  |  -  |  -  |  -  | 
| JupyterEnterpriseGateway |  -  |  -  |  -  |  -  | 
| JupyterHub |  -  |  -  |  -  |  -  | 
| Livy |  -  |  -  |  -  |  -  | 
| MXNet |  -  |  -  |  -  |  -  | 
| Mahout | 0.12.0 | 0.12.0 | 0.11.1 | 0.11.1 | 
| Oozie |  -  |  -  |  -  |  -  | 
| Oozie-Sandbox | 4.2.0 | 4.2.0 | 4.2.0 | 4.2.0 | 
| Phoenix | 4.7.0--1.2 HBase | 4.7.0--1.2 HBase |  -  |  -  | 
| Pig | 0.14.0-amzn-0 | 0.14.0-amzn-0 | 0.14.0-amzn-0 | 0.14.0-amzn-0 | 
| Presto |  -  |  -  |  -  |  -  | 
| Presto-Sandbox | 0.147 | 0.147 | 0.143 | 0.143 | 
| Spark | 1.6.1 | 1.6.1 | 1.6.1 | 1.6.1 | 
| Sqoop |  -  |  -  |  -  |  -  | 
| Sqoop-Sandbox | 1.4.6 | 1.4.6 | 1.4.6 | 1.4.6 | 
| TensorFlow |  -  |  -  |  -  |  -  | 
| Tez | 0.8.3 | 0.8.3 |  -  |  -  | 
| Trino (PrestoSQL) |  -  |  -  |  -  |  -  | 
| Zeppelin |  -  |  -  |  -  |  -  | 
| Zeppelin-Sandbox | 0.5.6-incubating | 0.5.6-incubating | 0.5.6-incubating | 0.5.6-incubating | 
| ZooKeeper |  -  |  -  |  -  |  -  | 
| ZooKeeper-Sandbox | 3.4.8 | 3.4.8 | 3.4.8 | 3.4.8 | 

## 4.7.1 发布说明
<a name="emr-471-relnotes"></a>

以下发布说明包括有关 Amazon EMR 4.7.1 的信息。

发布日期：2016 年 6 月 10 日

**早期版本中已解决的已知问题**
+ 修复了延长带有私有子网的 VPC 中启动的集群的启动时间的问题。此错误仅影响使用 Amazon EMR 4.7.0 发行版启动的集群。
+ 修复了在 Amazon EMR 中错误处理针对使用 Amazon EMR 4.7.0 发行版启动的集群的文件列表的问题。

## 4.7.1 组件版本
<a name="emr-471-components"></a>

下面列出了 Amazon EMR 随此发行版一起安装的组件。一些组件作为大数据应用程序包的一部分安装。其它组件是 Amazon EMR 独有的，并且已为系统流程和功能安装这些组件。它们通常以 `emr` 或 `aws` 开头。最新的 Amazon EMR 发行版中的大数据应用程序包通常是在社区中找到的最新版本。我们会尽快在 Amazon EMR 中提供社区发行版。

Amazon EMR 中的某些组件与社区版本不同。这些组件具有以下形式的 `CommunityVersion-amzn-EmrVersion` 的发行版标注。`EmrVersion` 从 0 开始。例如，假设已对名为 `myapp-component` 的版本 2.2 的开源社区组件进行三次修改，以包含在不同的 Amazon EMR 发行版中，则其发行版将为 `2.2-amzn-2`。


| 组件 | 版本 | 说明 | 
| --- | --- | --- | 
| emr-ddb | 3.1.0 | 适用于 Hadoop 生态系统应用程序的 Amazon DynamoDB 连接器。 | 
| emr-goodies | 2.0.0 | 适用于 Hadoop 生态系统的方便易用的库。 | 
| emr-kinesis | 3.2.0 | 适用于 Hadoop 生态系统应用程序的 Amazon Kinesis 连接器。 | 
| emr-s3-dist-cp | 2.4.0 | 针对 Amazon S3 优化的分布式复制应用程序。 | 
| emrfs | 2.7.1 | 适用于 Hadoop 生态系统应用程序的 Amazon S3 连接器。 | 
| ganglia-monitor | 3.7.2 | 适用于 Hadoop 生态系统应用程序的嵌入式 Ganglia 代理以及 Ganglia 监控代理。 | 
| ganglia-metadata-collector | 3.7.2 | 用于从 Ganglia 监控代理中聚合指标的 Ganglia 元数据收集器。 | 
| ganglia-web | 3.7.1 | 用于查看由 Ganglia 元数据收集器收集的指标的 Web 应用程序。 | 
| hadoop-client | 2.7.2-amzn-2 | Hadoop 命令行客户端，如“hdfs”、“hadoop”或“yarn”。 | 
| hadoop-hdfs-datanode | 2.7.2-amzn-2 | 用于存储数据块的 HDFS 节点级服务。 | 
| hadoop-hdfs-library | 2.7.2-amzn-2 | HDFS 命令行客户端和库 | 
| hadoop-hdfs-namenode | 2.7.2-amzn-2 | 用于跟踪文件名和数据块位置的 HDFS 服务。 | 
| hadoop-httpfs-server | 2.7.2-amzn-2 | 用于 HDFS 操作的 HTTP 终端节点。 | 
| hadoop-kms-server | 2.7.2-amzn-2 | 基于 Hadoop 的 API 的加密密钥管理服务器。 KeyProvider  | 
| hadoop-mapred | 2.7.2-amzn-2 | MapReduce 用于运行 MapReduce 应用程序的执行引擎库。 | 
| hadoop-yarn-nodemanager | 2.7.2-amzn-2 | 用于管理单个节点上的容器的 YARN 服务。 | 
| hadoop-yarn-resourcemanager | 2.7.2-amzn-2 | 用于分配和管理集群资源与分布式应用程序的 YARN 服务。 | 
| hadoop-yarn-timeline-server | 2.7.2-amzn-2 | 用于检索 YARN 应用程序的当前信息和历史信息的服务。 | 
| hbase-hmaster | 1.2.1 | 为负责协调区域和执行管理命令的 HBase 集群提供服务。 | 
| hbase-region-server | 1.2.1 | 为一个或多个 HBase 地区提供服务的服务。 | 
| hbase-client | 1.2.1 | HBase 命令行客户端。 | 
| hbase-rest-server | 1.2.1 | 为提供 RESTful HTTP 端点的服务 HBase。 | 
| hbase-thrift-server | 1.2.1 | 为其提供 Thrift 端点的 HBase服务。 | 
| hcatalog-client | 1.0.0-amzn-5 | 用于操作 hcatalog-server 的“hcat”命令行客户端。 | 
| hcatalog-server | 1.0.0-amzn-5 | 提供服务 HCatalog，为分布式应用程序提供表和存储管理层。 | 
| hcatalog-webhcat-server | 1.0.0-amzn-5 | 为其提供 REST 接口的 HTTP 端点 HCatalog。 | 
| hive-client | 1.0.0-amzn-5 | Hive 命令行客户端。 | 
| hive-metastore-server | 1.0.0-amzn-5 | 用于访问 Hive 元存储 (一个用于存储 Hadoop 操作中的 SQL 的元数据的语义存储库) 的服务。 | 
| hive-server | 1.0.0-amzn-5 | 用于将 Hive 查询作为 Web 请求接受的服务。 | 
| hue-server | 3.7.1-amzn-7 | 用于使用 Hadoop 生态系统应用程序分析数据的 Web 应用程序 | 
| mahout-client | 0.12.0 | 用于机器学习的库。 | 
| mysql-server | 5.5.46 | MySQL 数据库服务器。 | 
| oozie-client | 4.2.0 | Oozie 命令行客户端。 | 
| oozie-server | 4.2.0 | 用于接受 Oozie 工作流请求的服务。 | 
| phoenix-library | 4.7.0--1.2 HBase | 服务器和客户端的 phoenix 库 | 
| phoenix-query-server | 4.7.0--1.2 HBase | 向 Avatica API 提供 JDBC 访问权限以及协议缓冲区和 JSON 格式访问权限的轻量级服务器  | 
| presto-coordinator | 0.147 | 用于在 presto-worker 之中接受查询并管理查询的服务。 | 
| presto-worker | 0.147 | 用于执行查询的各个部分的服务。 | 
| pig-client | 0.14.0-amzn-0 | Pig 命令行客户端。 | 
| spark-client | 1.6.1 | Spark 命令行客户端。 | 
| spark-history-server | 1.6.1 | 用于查看完整的 Spark 应用程序的生命周期的已记录事件的 Web UI。 | 
| spark-on-yarn | 1.6.1 | 适用于 YARN 的内存中执行引擎。 | 
| spark-yarn-slave | 1.6.1 | YARN 从属项所需的 Apache Spark 库。 | 
| sqoop-client | 1.4.6 | Apache Sqoop 命令行客户端。 | 
| tez-on-yarn | 0.8.3 | tez YARN 应用程序和库。 | 
| webserver | 2.4.18 | Apache HTTP 服务器。 | 
| zeppelin-server | 0.5.6-incubating | 支持交互式数据分析的基于 Web 的 Notebook。 | 
| zookeeper-server | 3.4.8 | 用于维护配置信息、命名、提供分布式同步以及提供组服务的集中式服务。 | 
| zookeeper-client | 3.4.8 | ZooKeeper 命令行客户端。 | 

## 4.7.1 配置分类
<a name="emr-471-class"></a>

配置分类允许您自定义应用程序。这些通常与应用程序的配置 XML 文件（例如 `hive-site.xml`）相对应。有关更多信息，请参阅[配置应用程序](emr-configure-apps.md)。


**emr-4.7.1 分类**  

| 分类 | 说明 | 
| --- | --- | 
| capacity-scheduler | 更改 Hadoop 的 capacity-scheduler.xml 文件中的值。 | 
| core-site | 更改 Hadoop 的 core-site.xml 文件中的值。 | 
| emrfs-site | 更改 EMRFS 设置。 | 
| hadoop-env | 更改适用于所有 Hadoop 组件的 Hadoop 环境中的值。 | 
| hadoop-log4j | 更改 Hadoop 的 log4j.properties 文件中的值。 | 
| hbase-env | 更改环境 HBase中的值。 | 
| hbase-log4j | 更改 hbase- HBase log4j.properties 文件中的值。 | 
| hbase-metrics | 更改 hadoop-metrics2-hb HBase aase.properties 文件中的值。 | 
| hbase-policy | 更改 hbase-policy.xml 文件 HBase中的值。 | 
| hbase-site | 更改 hbase-site.xml 文件 HBase中的值。 | 
| hdfs-encryption-zones | 配置 HDFS 加密区域。 | 
| hdfs-site | 更改 HDFS 的 hdfs-site.xml 中的值。 | 
| hcatalog-env | 更改环境 HCatalog中的值。 | 
| hcatalog-server-jndi | 更改 HCatalog的 jndi.properties 中的值。 | 
| hcatalog-server-proto-hive-site | 更改 proto-hive-site .x HCatalog ml 中的值。 | 
| hcatalog-webhcat-env | 更改 HCatalog Web 环境HCat中的值。 | 
| hcatalog-webhcat-log4j | 更改 HCatalog Web HCat 的 log4j.properties 中的值。 | 
| hcatalog-webhcat-site | 更改 HCatalog Web HCat 的 webhcat-site.xml 文件中的值。 | 
| hive-env | 更改 Hive 环境中的值。 | 
| hive-exec-log4j | 更改 Hive 的 hive-exec-log 4j.properties 文件中的值。 | 
| hive-log4j | 更改 Hive 的 hive-log4j.properties 文件中的值。 | 
| hive-site | 更改 Hive 的 hive-site.xml 文件中的值 | 
| hue-ini | 更改 Hue 的 ini 文件中的值 | 
| httpfs-env | 更改 HTTPFS 环境中的值。 | 
| httpfs-site | 更改 Hadoop 的 httpfs-site.xml 文件中的值。 | 
| hadoop-kms-acls | 更改 Hadoop 的 kms-acls.xml 文件中的值。 | 
| hadoop-kms-env | 更改 Hadoop KMS 环境中的值。 | 
| hadoop-kms-log4j | 更改 Hadoop 的 kms-log4j.properties 文件中的值。 | 
| hadoop-kms-site | 更改 Hadoop 的 kms-site.xml 文件中的值。 | 
| mapred-env | 更改 MapReduce 应用程序环境中的值。 | 
| mapred-site | 更改 MapReduce 应用程序的 mapred-site.xml 文件中的值。 | 
| oozie-env | 更改 Oozie 的环境中的值。 | 
| oozie-log4j | 更改 Oozie 的 oozie-log4j.properties 文件中的值。 | 
| oozie-site | 更改 Oozie 的 oozie-site.xml 文件中的值。 | 
| phoenix-hbase-metrics | 更改 Phoenix 的 hadoop-metrics2-hbase.properties 文件中的值。 | 
| phoenix-hbase-site | 更改 Phoenix 的 hbase-site.xml 文件中的值。 | 
| phoenix-log4j | 更改 Phoenix 的 log4j.properties 文件中的值。 | 
| phoenix-metrics | 更改 Phoenix 的 hadoop-metrics2-phoenix.properties 文件中的值。 | 
| pig-properties | 更改 Pig 的 pig.properties 文件中的值。 | 
| pig-log4j | 更改 Pig 的 log4j.properties 文件中的值。 | 
| presto-log | 更改 Presto 的 log.properties 文件中的值。 | 
| presto-config | 更改 Presto 的 config.properties 文件中的值。 | 
| presto-connector-hive | 更改 Presto 的 hive.properties 文件中的值。 | 
| spark | 适用于 Apache Spark 的 Amazon EMR 辅助设置。 | 
| spark-defaults | 更改 Spark 的 spark-defaults.conf 文件中的值。 | 
| spark-env | 更改 Spark 环境中的值。 | 
| spark-log4j | 更改 Spark 的 log4j.properties 文件中的值。 | 
| spark-metrics | 更改 Spark 的 metrics.properties 文件中的值。 | 
| sqoop-env | 更改 Sqoop 的环境中的值。 | 
| sqoop-oraoop-site | 更改 Sqoop OraOop 的 oraoop-site.xml 文件中的值。 | 
| sqoop-site | 更改 Sqoop 的 sqoop-site.xml 文件中的值。 | 
| tez-site | 更改 Tez 的 tez-site.xml 文件中的值。 | 
| yarn-env | 更改 YARN 环境中的值。 | 
| yarn-site | 更改 YARN 的 yarn-site.xml 文件中的值。 | 
| zeppelin-env | 更改 Zeppelin 环境中的值。 | 
| zookeeper-config | 更改 ZooKeeper的 zoo.cfg 文件中的值。 | 
| zookeeper-log4j | 更改 ZooKeeper的 log4j.properties 文件中的值。 | 

# Amazon EMR 发行版 4.7.0
<a name="emr-470-release"></a>

## 4.7.0 应用程序版本
<a name="emr-470-app-versions"></a>

此版本包括以下应用程序：[http://ganglia.info](http://ganglia.info)、[http://hbase.apache.org/](http://hbase.apache.org/)、[https://cwiki.apache.org/confluence/display/Hive/HCatalog](https://cwiki.apache.org/confluence/display/Hive/HCatalog)、[http://hadoop.apache.org/docs/current/](http://hadoop.apache.org/docs/current/)、[http://hive.apache.org/](http://hive.apache.org/)、[http://gethue.com/](http://gethue.com/)、[http://mahout.apache.org/](http://mahout.apache.org/)、[http://oozie.apache.org/](http://oozie.apache.org/)、[https://phoenix.apache.org/](https://phoenix.apache.org/)、[http://pig.apache.org/](http://pig.apache.org/)、[https://prestodb.io/](https://prestodb.io/)、[https://spark.apache.org/docs/latest/](https://spark.apache.org/docs/latest/)、[http://sqoop.apache.org/](http://sqoop.apache.org/)、[https://tez.apache.org/](https://tez.apache.org/)、[https://zeppelin.incubator.apache.org/](https://zeppelin.incubator.apache.org/) 和 [https://zookeeper.apache.org](https://zookeeper.apache.org)。

下表列出了此版本的 Amazon EMR 中提供的应用程序版本以及前三个 Amazon EMR 发行版中的应用程序版本（若适用）。

有关每个发行版的 Amazon EMR 的应用程序版本的全面历史记录，请参见以下主题：
+ [Amazon EMR 7.x 发行版中的应用程序版本](emr-release-app-versions-7.x.md)
+ [Amazon EMR 6.x 发行版中的应用程序版本](emr-release-app-versions-6.x.md)
+ [Amazon EMR 5.x 发行版中的应用程序版本](emr-release-app-versions-5.x.md)
+ [Amazon EMR 4.x 发行版中的应用程序版本](emr-release-app-versions-4.x.md)


**应用程序版本信息**  

|  | emr-4.7.0 | emr-4.6.1 | emr-4.6.0 | emr-4.5.0 | 
| --- | --- | --- | --- | --- | 
| AWS 适用于 Java 的 SDK | 1.10.75 | 1.10.27 | 1.10.27 | 1.10.27 | 
| Python | 未跟踪 | 未跟踪 | 未跟踪 | 未跟踪 | 
| Scala | 未跟踪 | 未跟踪 | 未跟踪 | 未跟踪 | 
| AmazonCloudWatchAgent |  -  |  -  |  -  |  -  | 
| Delta |  -  |  -  |  -  |  -  | 
| Flink |  -  |  -  |  -  |  -  | 
| Ganglia | 3.7.2 | 3.7.2 | 3.7.2 | 3.7.2 | 
| HBase | 1.2.1 | 1.2.0 | 1.2.0 |  -  | 
| HCatalog | 1.0.0-amzn-5 | 1.0.0-amzn-4 | 1.0.0-amzn-4 | 1.0.0-amzn-4 | 
| Hadoop | 2.7.2-amzn-2 | 2.7.2-amzn-1 | 2.7.2-amzn-1 | 2.7.2-amzn-0 | 
| Hive | 1.0.0-amzn-5 | 1.0.0-amzn-4 | 1.0.0-amzn-4 | 1.0.0-amzn-4 | 
| Hudi |  -  |  -  |  -  |  -  | 
| Hue | 3.7.1-amzn-7 | 3.7.1-amzn-6 | 3.7.1-amzn-6 | 3.7.1-amzn-5 | 
| Iceberg |  -  |  -  |  -  |  -  | 
| JupyterEnterpriseGateway |  -  |  -  |  -  |  -  | 
| JupyterHub |  -  |  -  |  -  |  -  | 
| Livy |  -  |  -  |  -  |  -  | 
| MXNet |  -  |  -  |  -  |  -  | 
| Mahout | 0.12.0 | 0.11.1 | 0.11.1 | 0.11.1 | 
| Oozie |  -  |  -  |  -  |  -  | 
| Oozie-Sandbox | 4.2.0 | 4.2.0 | 4.2.0 | 4.2.0 | 
| Phoenix | 4.7.0--1.2 HBase |  -  |  -  |  -  | 
| Pig | 0.14.0-amzn-0 | 0.14.0-amzn-0 | 0.14.0-amzn-0 | 0.14.0-amzn-0 | 
| Presto |  -  |  -  |  -  |  -  | 
| Presto-Sandbox | 0.147 | 0.143 | 0.143 | 0.140 | 
| Spark | 1.6.1 | 1.6.1 | 1.6.1 | 1.6.1 | 
| Sqoop |  -  |  -  |  -  |  -  | 
| Sqoop-Sandbox | 1.4.6 | 1.4.6 | 1.4.6 | 1.4.6 | 
| TensorFlow |  -  |  -  |  -  |  -  | 
| Tez | 0.8.3 |  -  |  -  |  -  | 
| Trino (PrestoSQL) |  -  |  -  |  -  |  -  | 
| Zeppelin |  -  |  -  |  -  |  -  | 
| Zeppelin-Sandbox | 0.5.6-incubating | 0.5.6-incubating | 0.5.6-incubating | 0.5.6-incubating | 
| ZooKeeper |  -  |  -  |  -  |  -  | 
| ZooKeeper-Sandbox | 3.4.8 | 3.4.8 | 3.4.8 |  -  | 

## 4.7.0 发布说明
<a name="emr-470-relnotes"></a>

**重要**  
Amazon EMR 4.7.0 已弃用。请改用 Amazon EMR 4.7.1 或更高版本。

发布日期：2016 年 6 月 2 日

**功能**
+ 已添加 Apache Phoenix 4.7.0
+ 已添加 Apache Tez 0.8.3
+ 已升级到 HBase 1.2.1
+ 已升级到 Mahout 0.12.0
+ 已升级到 Presto 0.147
+ 已将升级 适用于 Java 的 AWS SDK 到 1.10.75
+ 已从 `mapreduce.cluster.local.dir` 中的 `mapred-site.xml` 属性中删除最终标志以允许用户以本地模式运行 Pig。
+ 集群上可用的 Amazon Redshift JDBC 驱动程序

  Amazon Redshift JDBC 驱动程序现在包含在 `/usr/share/aws/redshift/jdbc` 中。`/usr/share/aws/redshift/jdbc/RedshiftJDBC41.jar` 是与 JDBC 4.1 兼容的驱动程序，`/usr/share/aws/redshift/jdbc/RedshiftJDBC4.jar` 是与 JDBC 4.0 兼容的 Amazon Redshift 驱动程序。有关更多信息，请参阅 [Amazon Redshift 管理指南](https://docs.aws.amazon.com/redshift/latest/mgmt/configure-jdbc-connection.html)中的*配置 JDBC 连接*。
+ Java 8

  OpenJDK 1.7 是用于所有应用程序 (Presto 除外) 的默认 JDK。但是，将同时安装 OpenJDK 1.7 和 1.8。有关如何为应用程序设置 `JAVA_HOME` 的信息，请参阅[配置应用程序以使用 Java 8](https://docs.aws.amazon.com/emr/latest/ReleaseGuide/emr-configure-apps.html#configuring-java8)。

**早期版本中已解决的已知问题**
+ 修复了一个内核问题，该问题已明显影响了 emr-4.6.0 中的 Amazon EMR 的吞吐量优化 HDD（st1）EBS 卷的性能。
+ 修复了在不选择 Hadoop 作为应用程序的情况下指定任何 HDFS 加密区域时集群将失败的问题。
+ 已将默认 HDFS 编写策略从 `RoundRobin` 更改为 `AvailableSpaceVolumeChoosingPolicy`。 RoundRobin配置中未正确利用某些卷，导致核心节点出现故障和 HDFS 不可靠。
+ 修复了与 EMRFS CLI 有关的问题，此问题将在创建默认 DynamoDB 元数据表以获得一致视图时导致异常。
+ 修复了在分段重命名和复制操作期间可能发生在 EMRFS 中的死锁问题。
+ 修复了 EMRFS 导致默认 CopyPart 大小为 5 MB 的问题。默认值现已相应地设置为 128 MB。
+ 修复了与 Zeppelin upstart 配置有关的问题，此问题可能会阻止您停止服务。
+ 修复了与 Spark 和 Zeppelin 有关的问题，此问题会阻止您使用 `s3a://` URI 方案，因为 `/usr/lib/hadoop/hadoop-aws.jar` 未在其各自的类路径中正确加载。
+ 已逆向移植 [HUE-2484](https://issues.cloudera.org/browse/HUE-2484)。
+ 向后移植了 Hue 3.9.0（不存在 JIRA）的[提交](https://github.com/cloudera/hue/commit/c3c89f085e7a29c9fac7de016d881142d90af3eb)，以修复浏览器示例的问题。 HBase 
+ 已逆向移植 [HIVE-9073](https://issues.apache.org/jira/browse/HIVE-9073)。

## 4.7.0 组件版本
<a name="emr-470-components"></a>

下面列出了 Amazon EMR 随此发行版一起安装的组件。一些组件作为大数据应用程序包的一部分安装。其它组件是 Amazon EMR 独有的，并且已为系统流程和功能安装这些组件。它们通常以 `emr` 或 `aws` 开头。最新的 Amazon EMR 发行版中的大数据应用程序包通常是在社区中找到的最新版本。我们会尽快在 Amazon EMR 中提供社区发行版。

Amazon EMR 中的某些组件与社区版本不同。这些组件具有以下形式的 `CommunityVersion-amzn-EmrVersion` 的发行版标注。`EmrVersion` 从 0 开始。例如，假设已对名为 `myapp-component` 的版本 2.2 的开源社区组件进行三次修改，以包含在不同的 Amazon EMR 发行版中，则其发行版将为 `2.2-amzn-2`。


| 组件 | 版本 | 说明 | 
| --- | --- | --- | 
| emr-ddb | 3.1.0 | 适用于 Hadoop 生态系统应用程序的 Amazon DynamoDB 连接器。 | 
| emr-goodies | 2.0.0 | 适用于 Hadoop 生态系统的方便易用的库。 | 
| emr-kinesis | 3.2.0 | 适用于 Hadoop 生态系统应用程序的 Amazon Kinesis 连接器。 | 
| emr-s3-dist-cp | 2.4.0 | 针对 Amazon S3 优化的分布式复制应用程序。 | 
| emrfs | 2.7.1 | 适用于 Hadoop 生态系统应用程序的 Amazon S3 连接器。 | 
| ganglia-monitor | 3.7.2 | 适用于 Hadoop 生态系统应用程序的嵌入式 Ganglia 代理以及 Ganglia 监控代理。 | 
| ganglia-metadata-collector | 3.7.2 | 用于从 Ganglia 监控代理中聚合指标的 Ganglia 元数据收集器。 | 
| ganglia-web | 3.7.1 | 用于查看由 Ganglia 元数据收集器收集的指标的 Web 应用程序。 | 
| hadoop-client | 2.7.2-amzn-2 | Hadoop 命令行客户端，如“hdfs”、“hadoop”或“yarn”。 | 
| hadoop-hdfs-datanode | 2.7.2-amzn-2 | 用于存储数据块的 HDFS 节点级服务。 | 
| hadoop-hdfs-library | 2.7.2-amzn-2 | HDFS 命令行客户端和库 | 
| hadoop-hdfs-namenode | 2.7.2-amzn-2 | 用于跟踪文件名和数据块位置的 HDFS 服务。 | 
| hadoop-httpfs-server | 2.7.2-amzn-2 | 用于 HDFS 操作的 HTTP 终端节点。 | 
| hadoop-kms-server | 2.7.2-amzn-2 | 基于 Hadoop 的 API 的加密密钥管理服务器。 KeyProvider  | 
| hadoop-mapred | 2.7.2-amzn-2 | MapReduce 用于运行 MapReduce 应用程序的执行引擎库。 | 
| hadoop-yarn-nodemanager | 2.7.2-amzn-2 | 用于管理单个节点上的容器的 YARN 服务。 | 
| hadoop-yarn-resourcemanager | 2.7.2-amzn-2 | 用于分配和管理集群资源与分布式应用程序的 YARN 服务。 | 
| hadoop-yarn-timeline-server | 2.7.2-amzn-2 | 用于检索 YARN 应用程序的当前信息和历史信息的服务。 | 
| hbase-hmaster | 1.2.1 | 为负责协调区域和执行管理命令的 HBase 集群提供服务。 | 
| hbase-region-server | 1.2.1 | 为一个或多个 HBase 地区提供服务的服务。 | 
| hbase-client | 1.2.1 | HBase 命令行客户端。 | 
| hbase-rest-server | 1.2.1 | 为提供 RESTful HTTP 端点的服务 HBase。 | 
| hbase-thrift-server | 1.2.1 | 为其提供 Thrift 端点的 HBase服务。 | 
| hcatalog-client | 1.0.0-amzn-5 | 用于操作 hcatalog-server 的“hcat”命令行客户端。 | 
| hcatalog-server | 1.0.0-amzn-5 | 提供服务 HCatalog，为分布式应用程序提供表和存储管理层。 | 
| hcatalog-webhcat-server | 1.0.0-amzn-5 | 为其提供 REST 接口的 HTTP 端点 HCatalog。 | 
| hive-client | 1.0.0-amzn-5 | Hive 命令行客户端。 | 
| hive-metastore-server | 1.0.0-amzn-5 | 用于访问 Hive 元存储 (一个用于存储 Hadoop 操作中的 SQL 的元数据的语义存储库) 的服务。 | 
| hive-server | 1.0.0-amzn-5 | 用于将 Hive 查询作为 Web 请求接受的服务。 | 
| hue-server | 3.7.1-amzn-7 | 用于使用 Hadoop 生态系统应用程序分析数据的 Web 应用程序 | 
| mahout-client | 0.12.0 | 用于机器学习的库。 | 
| mysql-server | 5.5.46 | MySQL 数据库服务器。 | 
| oozie-client | 4.2.0 | Oozie 命令行客户端。 | 
| oozie-server | 4.2.0 | 用于接受 Oozie 工作流请求的服务。 | 
| phoenix-library | 4.7.0--1.2 HBase | 服务器和客户端的 phoenix 库 | 
| phoenix-query-server | 4.7.0--1.2 HBase | 向 Avatica API 提供 JDBC 访问权限以及协议缓冲区和 JSON 格式访问权限的轻量级服务器  | 
| presto-coordinator | 0.147 | 用于在 presto-worker 之中接受查询并管理查询的服务。 | 
| presto-worker | 0.147 | 用于执行查询的各个部分的服务。 | 
| pig-client | 0.14.0-amzn-0 | Pig 命令行客户端。 | 
| spark-client | 1.6.1 | Spark 命令行客户端。 | 
| spark-history-server | 1.6.1 | 用于查看完整的 Spark 应用程序的生命周期的已记录事件的 Web UI。 | 
| spark-on-yarn | 1.6.1 | 适用于 YARN 的内存中执行引擎。 | 
| spark-yarn-slave | 1.6.1 | YARN 从属项所需的 Apache Spark 库。 | 
| sqoop-client | 1.4.6 | Apache Sqoop 命令行客户端。 | 
| tez-on-yarn | 0.8.3 | tez YARN 应用程序和库。 | 
| webserver | 2.4.18 | Apache HTTP 服务器。 | 
| zeppelin-server | 0.5.6-incubating | 支持交互式数据分析的基于 Web 的 Notebook。 | 
| zookeeper-server | 3.4.8 | 用于维护配置信息、命名、提供分布式同步以及提供组服务的集中式服务。 | 
| zookeeper-client | 3.4.8 | ZooKeeper 命令行客户端。 | 

## 4.7.0 配置分类
<a name="emr-470-class"></a>

配置分类允许您自定义应用程序。这些通常与应用程序的配置 XML 文件（例如 `hive-site.xml`）相对应。有关更多信息，请参阅[配置应用程序](emr-configure-apps.md)。


**emr-4.7.0 分类**  

| 分类 | 说明 | 
| --- | --- | 
| capacity-scheduler | 更改 Hadoop 的 capacity-scheduler.xml 文件中的值。 | 
| core-site | 更改 Hadoop 的 core-site.xml 文件中的值。 | 
| emrfs-site | 更改 EMRFS 设置。 | 
| hadoop-env | 更改适用于所有 Hadoop 组件的 Hadoop 环境中的值。 | 
| hadoop-log4j | 更改 Hadoop 的 log4j.properties 文件中的值。 | 
| hbase-env | 更改环境 HBase中的值。 | 
| hbase-log4j | 更改 hbase- HBase log4j.properties 文件中的值。 | 
| hbase-metrics | 更改 hadoop-metrics2-hb HBase aase.properties 文件中的值。 | 
| hbase-policy | 更改 hbase-policy.xml 文件 HBase中的值。 | 
| hbase-site | 更改 hbase-site.xml 文件 HBase中的值。 | 
| hdfs-encryption-zones | 配置 HDFS 加密区域。 | 
| hdfs-site | 更改 HDFS 的 hdfs-site.xml 中的值。 | 
| hcatalog-env | 更改环境 HCatalog中的值。 | 
| hcatalog-server-jndi | 更改 HCatalog的 jndi.properties 中的值。 | 
| hcatalog-server-proto-hive-site | 更改 proto-hive-site .x HCatalog ml 中的值。 | 
| hcatalog-webhcat-env | 更改 HCatalog Web 环境HCat中的值。 | 
| hcatalog-webhcat-log4j | 更改 HCatalog Web HCat 的 log4j.properties 中的值。 | 
| hcatalog-webhcat-site | 更改 HCatalog Web HCat 的 webhcat-site.xml 文件中的值。 | 
| hive-env | 更改 Hive 环境中的值。 | 
| hive-exec-log4j | 更改 Hive 的 hive-exec-log 4j.properties 文件中的值。 | 
| hive-log4j | 更改 Hive 的 hive-log4j.properties 文件中的值。 | 
| hive-site | 更改 Hive 的 hive-site.xml 文件中的值 | 
| hue-ini | 更改 Hue 的 ini 文件中的值 | 
| httpfs-env | 更改 HTTPFS 环境中的值。 | 
| httpfs-site | 更改 Hadoop 的 httpfs-site.xml 文件中的值。 | 
| hadoop-kms-acls | 更改 Hadoop 的 kms-acls.xml 文件中的值。 | 
| hadoop-kms-env | 更改 Hadoop KMS 环境中的值。 | 
| hadoop-kms-log4j | 更改 Hadoop 的 kms-log4j.properties 文件中的值。 | 
| hadoop-kms-site | 更改 Hadoop 的 kms-site.xml 文件中的值。 | 
| mapred-env | 更改 MapReduce 应用程序环境中的值。 | 
| mapred-site | 更改 MapReduce 应用程序的 mapred-site.xml 文件中的值。 | 
| oozie-env | 更改 Oozie 的环境中的值。 | 
| oozie-log4j | 更改 Oozie 的 oozie-log4j.properties 文件中的值。 | 
| oozie-site | 更改 Oozie 的 oozie-site.xml 文件中的值。 | 
| phoenix-hbase-metrics | 更改 Phoenix 的 hadoop-metrics2-hbase.properties 文件中的值。 | 
| phoenix-hbase-site | 更改 Phoenix 的 hbase-site.xml 文件中的值。 | 
| phoenix-log4j | 更改 Phoenix 的 log4j.properties 文件中的值。 | 
| phoenix-metrics | 更改 Phoenix 的 hadoop-metrics2-phoenix.properties 文件中的值。 | 
| pig-properties | 更改 Pig 的 pig.properties 文件中的值。 | 
| pig-log4j | 更改 Pig 的 log4j.properties 文件中的值。 | 
| presto-log | 更改 Presto 的 log.properties 文件中的值。 | 
| presto-config | 更改 Presto 的 config.properties 文件中的值。 | 
| presto-connector-hive | 更改 Presto 的 hive.properties 文件中的值。 | 
| spark | 适用于 Apache Spark 的 Amazon EMR 辅助设置。 | 
| spark-defaults | 更改 Spark 的 spark-defaults.conf 文件中的值。 | 
| spark-env | 更改 Spark 环境中的值。 | 
| spark-log4j | 更改 Spark 的 log4j.properties 文件中的值。 | 
| spark-metrics | 更改 Spark 的 metrics.properties 文件中的值。 | 
| sqoop-env | 更改 Sqoop 的环境中的值。 | 
| sqoop-oraoop-site | 更改 Sqoop OraOop 的 oraoop-site.xml 文件中的值。 | 
| sqoop-site | 更改 Sqoop 的 sqoop-site.xml 文件中的值。 | 
| tez-site | 更改 Tez 的 tez-site.xml 文件中的值。 | 
| yarn-env | 更改 YARN 环境中的值。 | 
| yarn-site | 更改 YARN 的 yarn-site.xml 文件中的值。 | 
| zeppelin-env | 更改 Zeppelin 环境中的值。 | 
| zookeeper-config | 更改 ZooKeeper的 zoo.cfg 文件中的值。 | 
| zookeeper-log4j | 更改 ZooKeeper的 log4j.properties 文件中的值。 | 

# Amazon EMR 发行版 4.6.1
<a name="emr-461-release"></a>

## 4.6.1 应用程序版本
<a name="emr-461-app-versions"></a>

此版本包括以下应用程序：[http://ganglia.info](http://ganglia.info)、[http://hbase.apache.org/](http://hbase.apache.org/)、[https://cwiki.apache.org/confluence/display/Hive/HCatalog](https://cwiki.apache.org/confluence/display/Hive/HCatalog)、[http://hadoop.apache.org/docs/current/](http://hadoop.apache.org/docs/current/)、[http://hive.apache.org/](http://hive.apache.org/)、[http://gethue.com/](http://gethue.com/)、[http://mahout.apache.org/](http://mahout.apache.org/)、[http://oozie.apache.org/](http://oozie.apache.org/)、[http://pig.apache.org/](http://pig.apache.org/)、[https://prestodb.io/](https://prestodb.io/)、[https://spark.apache.org/docs/latest/](https://spark.apache.org/docs/latest/)、[http://sqoop.apache.org/](http://sqoop.apache.org/)、[https://zeppelin.incubator.apache.org/](https://zeppelin.incubator.apache.org/) 和 [https://zookeeper.apache.org](https://zookeeper.apache.org)。

下表列出了此版本的 Amazon EMR 中提供的应用程序版本以及前三个 Amazon EMR 发行版中的应用程序版本（若适用）。

有关每个发行版的 Amazon EMR 的应用程序版本的全面历史记录，请参见以下主题：
+ [Amazon EMR 7.x 发行版中的应用程序版本](emr-release-app-versions-7.x.md)
+ [Amazon EMR 6.x 发行版中的应用程序版本](emr-release-app-versions-6.x.md)
+ [Amazon EMR 5.x 发行版中的应用程序版本](emr-release-app-versions-5.x.md)
+ [Amazon EMR 4.x 发行版中的应用程序版本](emr-release-app-versions-4.x.md)


**应用程序版本信息**  

|  | emr-4.6.1 | emr-4.6.0 | emr-4.5.0 | emr-4.4.0 | 
| --- | --- | --- | --- | --- | 
| AWS 适用于 Java 的 SDK | 1.10.27 | 1.10.27 | 1.10.27 | 1.10.27 | 
| Python | 未跟踪 | 未跟踪 | 未跟踪 | 未跟踪 | 
| Scala | 未跟踪 | 未跟踪 | 未跟踪 | 未跟踪 | 
| AmazonCloudWatchAgent |  -  |  -  |  -  |  -  | 
| Delta |  -  |  -  |  -  |  -  | 
| Flink |  -  |  -  |  -  |  -  | 
| Ganglia | 3.7.2 | 3.7.2 | 3.7.2 | 3.7.2 | 
| HBase | 1.2.0 | 1.2.0 |  -  |  -  | 
| HCatalog | 1.0.0-amzn-4 | 1.0.0-amzn-4 | 1.0.0-amzn-4 | 1.0.0-amzn-3 | 
| Hadoop | 2.7.2-amzn-1 | 2.7.2-amzn-1 | 2.7.2-amzn-0 | 2.7.1-amzn-1 | 
| Hive | 1.0.0-amzn-4 | 1.0.0-amzn-4 | 1.0.0-amzn-4 | 1.0.0-amzn-3 | 
| Hudi |  -  |  -  |  -  |  -  | 
| Hue | 3.7.1-amzn-6 | 3.7.1-amzn-6 | 3.7.1-amzn-5 | 3.7.1-amzn-5 | 
| Iceberg |  -  |  -  |  -  |  -  | 
| JupyterEnterpriseGateway |  -  |  -  |  -  |  -  | 
| JupyterHub |  -  |  -  |  -  |  -  | 
| Livy |  -  |  -  |  -  |  -  | 
| MXNet |  -  |  -  |  -  |  -  | 
| Mahout | 0.11.1 | 0.11.1 | 0.11.1 | 0.11.1 | 
| Oozie |  -  |  -  |  -  |  -  | 
| Oozie-Sandbox | 4.2.0 | 4.2.0 | 4.2.0 | 4.2.0 | 
| Phoenix |  -  |  -  |  -  |  -  | 
| Pig | 0.14.0-amzn-0 | 0.14.0-amzn-0 | 0.14.0-amzn-0 | 0.14.0-amzn-0 | 
| Presto |  -  |  -  |  -  |  -  | 
| Presto-Sandbox | 0.143 | 0.143 | 0.140 | 0.136 | 
| Spark | 1.6.1 | 1.6.1 | 1.6.1 | 1.6.0 | 
| Sqoop |  -  |  -  |  -  |  -  | 
| Sqoop-Sandbox | 1.4.6 | 1.4.6 | 1.4.6 | 1.4.6 | 
| TensorFlow |  -  |  -  |  -  |  -  | 
| Tez |  -  |  -  |  -  |  -  | 
| Trino (PrestoSQL) |  -  |  -  |  -  |  -  | 
| Zeppelin |  -  |  -  |  -  |  -  | 
| Zeppelin-Sandbox | 0.5.6-incubating | 0.5.6-incubating | 0.5.6-incubating | 0.5.6-incubating | 
| ZooKeeper |  -  |  -  |  -  |  -  | 
| ZooKeeper-Sandbox | 3.4.8 | 3.4.8 |  -  |  -  | 

## 4.6.1 发布说明
<a name="emr-461-relnotes"></a>

## 4.6.1 组件版本
<a name="emr-461-components"></a>

下面列出了 Amazon EMR 随此发行版一起安装的组件。一些组件作为大数据应用程序包的一部分安装。其它组件是 Amazon EMR 独有的，并且已为系统流程和功能安装这些组件。它们通常以 `emr` 或 `aws` 开头。最新的 Amazon EMR 发行版中的大数据应用程序包通常是在社区中找到的最新版本。我们会尽快在 Amazon EMR 中提供社区发行版。

Amazon EMR 中的某些组件与社区版本不同。这些组件具有以下形式的 `CommunityVersion-amzn-EmrVersion` 的发行版标注。`EmrVersion` 从 0 开始。例如，假设已对名为 `myapp-component` 的版本 2.2 的开源社区组件进行三次修改，以包含在不同的 Amazon EMR 发行版中，则其发行版将为 `2.2-amzn-2`。


| 组件 | 版本 | 说明 | 
| --- | --- | --- | 
| emr-ddb | 3.0.0 | 适用于 Hadoop 生态系统应用程序的 Amazon DynamoDB 连接器。 | 
| emr-goodies | 2.0.0 | 适用于 Hadoop 生态系统的方便易用的库。 | 
| emr-kinesis | 3.1.0 | 适用于 Hadoop 生态系统应用程序的 Amazon Kinesis 连接器。 | 
| emr-s3-dist-cp | 2.3.0 | 针对 Amazon S3 优化的分布式复制应用程序。 | 
| emrfs | 2.6.0 | 适用于 Hadoop 生态系统应用程序的 Amazon S3 连接器。 | 
| ganglia-monitor | 3.7.2 | 适用于 Hadoop 生态系统应用程序的嵌入式 Ganglia 代理以及 Ganglia 监控代理。 | 
| ganglia-metadata-collector | 3.7.2 | 用于从 Ganglia 监控代理中聚合指标的 Ganglia 元数据收集器。 | 
| ganglia-web | 3.7.1 | 用于查看由 Ganglia 元数据收集器收集的指标的 Web 应用程序。 | 
| hadoop-client | 2.7.2-amzn-1 | Hadoop 命令行客户端，如“hdfs”、“hadoop”或“yarn”。 | 
| hadoop-hdfs-datanode | 2.7.2-amzn-1 | 用于存储数据块的 HDFS 节点级服务。 | 
| hadoop-hdfs-library | 2.7.2-amzn-1 | HDFS 命令行客户端和库 | 
| hadoop-hdfs-namenode | 2.7.2-amzn-1 | 用于跟踪文件名和数据块位置的 HDFS 服务。 | 
| hadoop-httpfs-server | 2.7.2-amzn-1 | 用于 HDFS 操作的 HTTP 终端节点。 | 
| hadoop-kms-server | 2.7.2-amzn-1 | 基于 Hadoop 的 API 的加密密钥管理服务器。 KeyProvider  | 
| hadoop-mapred | 2.7.2-amzn-1 | MapReduce 用于运行 MapReduce 应用程序的执行引擎库。 | 
| hadoop-yarn-nodemanager | 2.7.2-amzn-1 | 用于管理单个节点上的容器的 YARN 服务。 | 
| hadoop-yarn-resourcemanager | 2.7.2-amzn-1 | 用于分配和管理集群资源与分布式应用程序的 YARN 服务。 | 
| hbase-hmaster | 1.2.0 | 为负责协调区域和执行管理命令的 HBase 集群提供服务。 | 
| hbase-region-server | 1.2.0 | 为一个或多个 HBase 地区提供服务的服务。 | 
| hbase-client | 1.2.0 | HBase 命令行客户端。 | 
| hbase-rest-server | 1.2.0 | 为提供 RESTful HTTP 端点的服务 HBase。 | 
| hbase-thrift-server | 1.2.0 | 为其提供 Thrift 端点的 HBase服务。 | 
| hcatalog-client | 1.0.0-amzn-4 | 用于操作 hcatalog-server 的“hcat”命令行客户端。 | 
| hcatalog-server | 1.0.0-amzn-4 | 提供服务 HCatalog，为分布式应用程序提供表和存储管理层。 | 
| hcatalog-webhcat-server | 1.0.0-amzn-4 | 为其提供 REST 接口的 HTTP 端点 HCatalog。 | 
| hive-client | 1.0.0-amzn-4 | Hive 命令行客户端。 | 
| hive-metastore-server | 1.0.0-amzn-4 | 用于访问 Hive 元存储 (一个用于存储 Hadoop 操作中的 SQL 的元数据的语义存储库) 的服务。 | 
| hive-server | 1.0.0-amzn-4 | 用于将 Hive 查询作为 Web 请求接受的服务。 | 
| hue-server | 3.7.1-amzn-6 | 用于使用 Hadoop 生态系统应用程序分析数据的 Web 应用程序 | 
| mahout-client | 0.11.1 | 用于机器学习的库。 | 
| mysql-server | 5.5 | MySQL 数据库服务器。 | 
| oozie-client | 4.2.0 | Oozie 命令行客户端。 | 
| oozie-server | 4.2.0 | 用于接受 Oozie 工作流请求的服务。 | 
| presto-coordinator | 0.143 | 用于在 presto-worker 之中接受查询并管理查询的服务。 | 
| presto-worker | 0.143 | 用于执行查询的各个部分的服务。 | 
| pig-client | 0.14.0-amzn-0 | Pig 命令行客户端。 | 
| spark-client | 1.6.1 | Spark 命令行客户端。 | 
| spark-history-server | 1.6.1 | 用于查看完整的 Spark 应用程序的生命周期的已记录事件的 Web UI。 | 
| spark-on-yarn | 1.6.1 | 适用于 YARN 的内存中执行引擎。 | 
| spark-yarn-slave | 1.6.1 | YARN 从属项所需的 Apache Spark 库。 | 
| sqoop-client | 1.4.6 | Apache Sqoop 命令行客户端。 | 
| webserver | 2.4 | Apache HTTP 服务器。 | 
| zeppelin-server | 0.5.6-incubating | 支持交互式数据分析的基于 Web 的 Notebook。 | 
| zookeeper-server | 3.4.8 | 用于维护配置信息、命名、提供分布式同步以及提供组服务的集中式服务。 | 
| zookeeper-client | 3.4.8 | ZooKeeper 命令行客户端。 | 

## 4.6.1 配置分类
<a name="emr-461-class"></a>

配置分类允许您自定义应用程序。这些通常与应用程序的配置 XML 文件（例如 `hive-site.xml`）相对应。有关更多信息，请参阅 [配置应用程序](emr-configure-apps.md)。


**emr-4.6.1 分类**  

| 分类 | 说明 | 
| --- | --- | 
| capacity-scheduler | 更改 Hadoop 的 capacity-scheduler.xml 文件中的值。 | 
| core-site | 更改 Hadoop 的 core-site.xml 文件中的值。 | 
| emrfs-site | 更改 EMRFS 设置。 | 
| hadoop-env | 更改适用于所有 Hadoop 组件的 Hadoop 环境中的值。 | 
| hadoop-log4j | 更改 Hadoop 的 log4j.properties 文件中的值。 | 
| hbase-env | 更改环境 HBase中的值。 | 
| hbase-log4j | 更改 hbase- HBase log4j.properties 文件中的值。 | 
| hbase-metrics | 更改 hadoop-metrics2-hb HBase aase.properties 文件中的值。 | 
| hbase-policy | 更改 HBase的 hbase-policy.xml 文件中的值。 | 
| hbase-site | 更改 hbase-site.xml 文件 HBase中的值。 | 
| hdfs-encryption-zones | 配置 HDFS 加密区域。 | 
| hdfs-site | 更改 HDFS 的 hdfs-site.xml 中的值。 | 
| hcatalog-env | 更改环境 HCatalog中的值。 | 
| hcatalog-server-jndi | 更改 HCatalog的 jndi.properties 中的值。 | 
| hcatalog-server-proto-hive-site | 更改 proto-hive-site .x HCatalog ml 中的值。 | 
| hcatalog-webhcat-env | 更改 HCatalog Web 环境HCat中的值。 | 
| hcatalog-webhcat-log4j | 更改 HCatalog Web HCat 的 log4j.properties 中的值。 | 
| hcatalog-webhcat-site | 更改 HCatalog Web HCat 的 webhcat-site.xml 文件中的值。 | 
| hive-env | 更改 Hive 环境中的值。 | 
| hive-exec-log4j | 更改 Hive 的 hive-exec-log 4j.properties 文件中的值。 | 
| hive-log4j | 更改 Hive 的 hive-log4j.properties 文件中的值。 | 
| hive-site | 更改 Hive 的 hive-site.xml 文件中的值 | 
| hue-ini | 更改 Hue 的 ini 文件中的值 | 
| httpfs-env | 更改 HTTPFS 环境中的值。 | 
| httpfs-site | 更改 Hadoop 的 httpfs-site.xml 文件中的值。 | 
| hadoop-kms-acls | 更改 Hadoop 的 kms-acls.xml 文件中的值。 | 
| hadoop-kms-env | 更改 Hadoop KMS 环境中的值。 | 
| hadoop-kms-log4j | 更改 Hadoop 的 kms-log4j.properties 文件中的值。 | 
| hadoop-kms-site | 更改 Hadoop 的 kms-site.xml 文件中的值。 | 
| mapred-env | 更改 MapReduce 应用程序环境中的值。 | 
| mapred-site | 更改 MapReduce 应用程序的 mapred-site.xml 文件中的值。 | 
| oozie-env | 更改 Oozie 的环境中的值。 | 
| oozie-log4j | 更改 Oozie 的 oozie-log4j.properties 文件中的值。 | 
| oozie-site | 更改 Oozie 的 oozie-site.xml 文件中的值。 | 
| pig-properties | 更改 Pig 的 pig.properties 文件中的值。 | 
| pig-log4j | 更改 Pig 的 log4j.properties 文件中的值。 | 
| presto-log | 更改 Presto 的 log.properties 文件中的值。 | 
| presto-config | 更改 Presto 的 config.properties 文件中的值。 | 
| presto-connector-hive | 更改 Presto 的 hive.properties 文件中的值。 | 
| spark | 适用于 Apache Spark 的 Amazon EMR 辅助设置。 | 
| spark-defaults | 更改 Spark 的 spark-defaults.conf 文件中的值。 | 
| spark-env | 更改 Spark 环境中的值。 | 
| spark-log4j | 更改 Spark 的 log4j.properties 文件中的值。 | 
| spark-metrics | 更改 Spark 的 metrics.properties 文件中的值。 | 
| sqoop-env | 更改 Sqoop 的环境中的值。 | 
| sqoop-oraoop-site | 更改 Sqoop OraOop 的 oraoop-site.xml 文件中的值。 | 
| sqoop-site | 更改 Sqoop 的 sqoop-site.xml 文件中的值。 | 
| yarn-env | 更改 YARN 环境中的值。 | 
| yarn-site | 更改 YARN 的 yarn-site.xml 文件中的值。 | 
| zeppelin-env | 更改 Zeppelin 环境中的值。 | 
| zookeeper-config | 更改 ZooKeeper的 zoo.cfg 文件中的值。 | 
| zookeeper-log4j | 更改 ZooKeeper的 log4j.properties 文件中的值。 | 

# Amazon EMR 发行版 4.6.0
<a name="emr-460-release"></a>

## 4.6.0 应用程序版本
<a name="emr-460-app-versions"></a>

此版本包括以下应用程序：[http://ganglia.info](http://ganglia.info)、[http://hbase.apache.org/](http://hbase.apache.org/)、[https://cwiki.apache.org/confluence/display/Hive/HCatalog](https://cwiki.apache.org/confluence/display/Hive/HCatalog)、[http://hadoop.apache.org/docs/current/](http://hadoop.apache.org/docs/current/)、[http://hive.apache.org/](http://hive.apache.org/)、[http://gethue.com/](http://gethue.com/)、[http://mahout.apache.org/](http://mahout.apache.org/)、[http://oozie.apache.org/](http://oozie.apache.org/)、[http://pig.apache.org/](http://pig.apache.org/)、[https://prestodb.io/](https://prestodb.io/)、[https://spark.apache.org/docs/latest/](https://spark.apache.org/docs/latest/)、[http://sqoop.apache.org/](http://sqoop.apache.org/)、[https://zeppelin.incubator.apache.org/](https://zeppelin.incubator.apache.org/) 和 [https://zookeeper.apache.org](https://zookeeper.apache.org)。

下表列出了此版本的 Amazon EMR 中提供的应用程序版本以及前三个 Amazon EMR 发行版中的应用程序版本（若适用）。

有关每个发行版的 Amazon EMR 的应用程序版本的全面历史记录，请参见以下主题：
+ [Amazon EMR 7.x 发行版中的应用程序版本](emr-release-app-versions-7.x.md)
+ [Amazon EMR 6.x 发行版中的应用程序版本](emr-release-app-versions-6.x.md)
+ [Amazon EMR 5.x 发行版中的应用程序版本](emr-release-app-versions-5.x.md)
+ [Amazon EMR 4.x 发行版中的应用程序版本](emr-release-app-versions-4.x.md)


**应用程序版本信息**  

|  | emr-4.6.0 | emr-4.5.0 | emr-4.4.0 | emr-4.3.0 | 
| --- | --- | --- | --- | --- | 
| AWS 适用于 Java 的 SDK | 1.10.27 | 1.10.27 | 1.10.27 | 1.10.27 | 
| Python | 未跟踪 | 未跟踪 | 未跟踪 | 未跟踪 | 
| Scala | 未跟踪 | 未跟踪 | 未跟踪 | 未跟踪 | 
| AmazonCloudWatchAgent |  -  |  -  |  -  |  -  | 
| Delta |  -  |  -  |  -  |  -  | 
| Flink |  -  |  -  |  -  |  -  | 
| Ganglia | 3.7.2 | 3.7.2 | 3.7.2 | 3.7.2 | 
| HBase | 1.2.0 |  -  |  -  |  -  | 
| HCatalog | 1.0.0-amzn-4 | 1.0.0-amzn-4 | 1.0.0-amzn-3 |  -  | 
| Hadoop | 2.7.2-amzn-1 | 2.7.2-amzn-0 | 2.7.1-amzn-1 | 2.7.1-amzn-0 | 
| Hive | 1.0.0-amzn-4 | 1.0.0-amzn-4 | 1.0.0-amzn-3 | 1.0.0-amzn-2 | 
| Hudi |  -  |  -  |  -  |  -  | 
| Hue | 3.7.1-amzn-6 | 3.7.1-amzn-5 | 3.7.1-amzn-5 | 3.7.1-amzn-5 | 
| Iceberg |  -  |  -  |  -  |  -  | 
| JupyterEnterpriseGateway |  -  |  -  |  -  |  -  | 
| JupyterHub |  -  |  -  |  -  |  -  | 
| Livy |  -  |  -  |  -  |  -  | 
| MXNet |  -  |  -  |  -  |  -  | 
| Mahout | 0.11.1 | 0.11.1 | 0.11.1 | 0.11.0 | 
| Oozie |  -  |  -  |  -  |  -  | 
| Oozie-Sandbox | 4.2.0 | 4.2.0 | 4.2.0 | 4.2.0 | 
| Phoenix |  -  |  -  |  -  |  -  | 
| Pig | 0.14.0-amzn-0 | 0.14.0-amzn-0 | 0.14.0-amzn-0 | 0.14.0-amzn-0 | 
| Presto |  -  |  -  |  -  |  -  | 
| Presto-Sandbox | 0.143 | 0.140 | 0.136 | 0.130 | 
| Spark | 1.6.1 | 1.6.1 | 1.6.0 | 1.6.0 | 
| Sqoop |  -  |  -  |  -  |  -  | 
| Sqoop-Sandbox | 1.4.6 | 1.4.6 | 1.4.6 |  -  | 
| TensorFlow |  -  |  -  |  -  |  -  | 
| Tez |  -  |  -  |  -  |  -  | 
| Trino (PrestoSQL) |  -  |  -  |  -  |  -  | 
| Zeppelin |  -  |  -  |  -  |  -  | 
| Zeppelin-Sandbox | 0.5.6-incubating | 0.5.6-incubating | 0.5.6-incubating | 0.5.5-incubating-amzn-1 | 
| ZooKeeper |  -  |  -  |  -  |  -  | 
| ZooKeeper-Sandbox | 3.4.8 |  -  |  -  |  -  | 

## 4.6.0 发布说明
<a name="emr-460-relnotes"></a>

以下发布说明包括有关 Amazon EMR 发行版 4.6.0 的信息。
+ 已添加 HBase 1.2.0
+ 已添加 Zookeeper-Sandbox 3.4.8 
+ 已升级到 Presto-Sandbox 0.143
+ Amazon EMR 发行版现在基于 Amazon Linux 2016.03.0。有关更多信息，请参阅[https://aws.amazon.com/amazon-linux-ami/2016.03-release-notes/](https://aws.amazon.com/amazon-linux-ami/2016.03-release-notes/)。
+ 影响吞吐量优化 HDD（st1）EBS 卷类型的问题

  Linux 内核版本 4.2 及更高版本中的问题将显著影响 EMR 的吞吐量优化 HDD (st1) EBS 卷上的性能。此版本 (emr-4.6.0) 使用内核版本 4.4.5，因此会受到影响。因此，如果您打算使用 st1 EBS 卷，我们建议您不要使用 emr-4.6.0。您可将 emr-4.5.0 或早期 Amazon EMR 发行版与 st1 配合使用，而不会产生影响。此外，我们将随将来版本一起提供修复程序。
+ Python 默认值

  现在，默认情况下已安装 Python 3.4，但 Python 2.7 将保留系统默认值。您可以使用引导操作将 Python 3.4 配置为系统默认值；您可以使用配置 API `/usr/bin/python3.4` 在`spark-env`分类中将 PYSPARK\$1PYTHON 导出设置为，以影响所使用的 Python 版本。 PySpark
+ Java 8

  OpenJDK 1.7 是用于所有应用程序 (Presto 除外) 的默认 JDK。但是，将同时安装 OpenJDK 1.7 和 1.8。有关如何为应用程序设置 `JAVA_HOME` 的信息，请参阅[配置应用程序以使用 Java 8](https://docs.aws.amazon.com/emr/latest/ReleaseGuide/emr-configure-apps.html#configuring-java8)。

**早期版本中已解决的已知问题**
+ 修复了应用程序预置有时会因生成的密码导致随机失败的问题。
+ 之前，`mysqld` 已安装在所有节点上。现在，它仅安装在主实例上，而且仅在所选应用程序将 `mysql-server` 作为组件包含时安装。目前，以下应用程序包括该`mysql-server`组件：、Hive HCatalog、Hue、Presto-Sandbox 和 Sqoop-Sandbox。
+ 已将 `yarn.scheduler.maximum-allocation-vcores` 从默认值 32 更改为 80，这修复了 emr-4.4.0 中引入的一个问题，此问题主要在使用集群（其内核实例类型为具有高于 32 的 YARN 虚拟内核集的几个大型实例类型之一）中的 `maximizeResourceAllocation` 选项时与 Spark 时一起出现；也就是说，此问题影响了 c4.8xlarge、cc2.8xlarge、hs1.8xlarge、i2.8xlarge、m2.4xlarge、r3.8xlarge、d2.8xlarge 或 m4.10xlarge。
+ s3-dist-cp 现在对所有 Amazon S3 提名使用 EMRFS，并且不再过渡到临时 HDFS 目录。
+ 修复了与针对客户端加密分段上载的异常处理有关的问题。
+ 添加了允许用户更改 Amazon S3 存储类的选项。默认情况下，此设置为 `STANDARD`。`emrfs-site` 配置分类设置为 `fs.s3.storageClass`，可能的值为 `STANDARD`、`STANDARD_IA` 和 `REDUCED_REDUNDANCY`。有关存储类的更多信息，请参阅*《Amazon Simple Storage Service 用户指南》*中的[存储类](https://docs.aws.amazon.com/AmazonS3/latest/userguide/storage-class-intro.html)。

## 4.6.0 组件版本
<a name="emr-460-components"></a>

下面列出了 Amazon EMR 随此发行版一起安装的组件。一些组件作为大数据应用程序包的一部分安装。其它组件是 Amazon EMR 独有的，并且已为系统流程和功能安装这些组件。它们通常以 `emr` 或 `aws` 开头。最新的 Amazon EMR 发行版中的大数据应用程序包通常是在社区中找到的最新版本。我们会尽快在 Amazon EMR 中提供社区发行版。

Amazon EMR 中的某些组件与社区版本不同。这些组件具有以下形式的 `CommunityVersion-amzn-EmrVersion` 的发行版标注。`EmrVersion` 从 0 开始。例如，假设已对名为 `myapp-component` 的版本 2.2 的开源社区组件进行三次修改，以包含在不同的 Amazon EMR 发行版中，则其发行版将为 `2.2-amzn-2`。


| 组件 | 版本 | 说明 | 
| --- | --- | --- | 
| emr-ddb | 3.0.0 | 适用于 Hadoop 生态系统应用程序的 Amazon DynamoDB 连接器。 | 
| emr-goodies | 2.0.0 | 适用于 Hadoop 生态系统的方便易用的库。 | 
| emr-kinesis | 3.1.0 | 适用于 Hadoop 生态系统应用程序的 Amazon Kinesis 连接器。 | 
| emr-s3-dist-cp | 2.3.0 | 针对 Amazon S3 优化的分布式复制应用程序。 | 
| emrfs | 2.6.0 | 适用于 Hadoop 生态系统应用程序的 Amazon S3 连接器。 | 
| ganglia-monitor | 3.7.2 | 适用于 Hadoop 生态系统应用程序的嵌入式 Ganglia 代理以及 Ganglia 监控代理。 | 
| ganglia-metadata-collector | 3.7.2 | 用于从 Ganglia 监控代理中聚合指标的 Ganglia 元数据收集器。 | 
| ganglia-web | 3.7.1 | 用于查看由 Ganglia 元数据收集器收集的指标的 Web 应用程序。 | 
| hadoop-client | 2.7.2-amzn-1 | Hadoop 命令行客户端，如“hdfs”、“hadoop”或“yarn”。 | 
| hadoop-hdfs-datanode | 2.7.2-amzn-1 | 用于存储数据块的 HDFS 节点级服务。 | 
| hadoop-hdfs-library | 2.7.2-amzn-1 | HDFS 命令行客户端和库 | 
| hadoop-hdfs-namenode | 2.7.2-amzn-1 | 用于跟踪文件名和数据块位置的 HDFS 服务。 | 
| hadoop-httpfs-server | 2.7.2-amzn-1 | 用于 HDFS 操作的 HTTP 终端节点。 | 
| hadoop-kms-server | 2.7.2-amzn-1 | 基于 Hadoop 的 API 的加密密钥管理服务器。 KeyProvider  | 
| hadoop-mapred | 2.7.2-amzn-1 | MapReduce 用于运行 MapReduce 应用程序的执行引擎库。 | 
| hadoop-yarn-nodemanager | 2.7.2-amzn-1 | 用于管理单个节点上的容器的 YARN 服务。 | 
| hadoop-yarn-resourcemanager | 2.7.2-amzn-1 | 用于分配和管理集群资源与分布式应用程序的 YARN 服务。 | 
| hbase-hmaster | 1.2.0 | 为负责协调区域和执行管理命令的 HBase 集群提供服务。 | 
| hbase-region-server | 1.2.0 | 为一个或多个 HBase 地区提供服务的服务。 | 
| hbase-client | 1.2.0 | HBase 命令行客户端。 | 
| hbase-rest-server | 1.2.0 | 为提供 RESTful HTTP 端点的服务 HBase。 | 
| hbase-thrift-server | 1.2.0 | 为其提供 Thrift 端点的 HBase服务。 | 
| hcatalog-client | 1.0.0-amzn-4 | 用于操作 hcatalog-server 的“hcat”命令行客户端。 | 
| hcatalog-server | 1.0.0-amzn-4 | 提供服务 HCatalog，为分布式应用程序提供表和存储管理层。 | 
| hcatalog-webhcat-server | 1.0.0-amzn-4 | 为其提供 REST 接口的 HTTP 端点 HCatalog。 | 
| hive-client | 1.0.0-amzn-4 | Hive 命令行客户端。 | 
| hive-metastore-server | 1.0.0-amzn-4 | 用于访问 Hive 元存储 (一个用于存储 Hadoop 操作中的 SQL 的元数据的语义存储库) 的服务。 | 
| hive-server | 1.0.0-amzn-4 | 用于将 Hive 查询作为 Web 请求接受的服务。 | 
| hue-server | 3.7.1-amzn-6 | 用于使用 Hadoop 生态系统应用程序分析数据的 Web 应用程序 | 
| mahout-client | 0.11.1 | 用于机器学习的库。 | 
| mysql-server | 5.5 | MySQL 数据库服务器。 | 
| oozie-client | 4.2.0 | Oozie 命令行客户端。 | 
| oozie-server | 4.2.0 | 用于接受 Oozie 工作流请求的服务。 | 
| presto-coordinator | 0.143 | 用于在 presto-worker 之中接受查询并管理查询的服务。 | 
| presto-worker | 0.143 | 用于执行查询的各个部分的服务。 | 
| pig-client | 0.14.0-amzn-0 | Pig 命令行客户端。 | 
| spark-client | 1.6.1 | Spark 命令行客户端。 | 
| spark-history-server | 1.6.1 | 用于查看完整的 Spark 应用程序的生命周期的已记录事件的 Web UI。 | 
| spark-on-yarn | 1.6.1 | 适用于 YARN 的内存中执行引擎。 | 
| spark-yarn-slave | 1.6.1 | YARN 从属项所需的 Apache Spark 库。 | 
| sqoop-client | 1.4.6 | Apache Sqoop 命令行客户端。 | 
| webserver | 2.4 | Apache HTTP 服务器。 | 
| zeppelin-server | 0.5.6-incubating | 支持交互式数据分析的基于 Web 的 Notebook。 | 
| zookeeper-server | 3.4.8 | 用于维护配置信息、命名、提供分布式同步以及提供组服务的集中式服务。 | 
| zookeeper-client | 3.4.8 | ZooKeeper 命令行客户端。 | 

## 4.6.0 配置分类
<a name="emr-460-class"></a>

配置分类允许您自定义应用程序。这些通常与应用程序的配置 XML 文件（例如 `hive-site.xml`）相对应。有关更多信息，请参阅[配置应用程序](emr-configure-apps.md)。


**emr-4.6.0 分类**  

| 分类 | 说明 | 
| --- | --- | 
| capacity-scheduler | 更改 Hadoop 的 capacity-scheduler.xml 文件中的值。 | 
| core-site | 更改 Hadoop 的 core-site.xml 文件中的值。 | 
| emrfs-site | 更改 EMRFS 设置。 | 
| hadoop-env | 更改适用于所有 Hadoop 组件的 Hadoop 环境中的值。 | 
| hadoop-log4j | 更改 Hadoop 的 log4j.properties 文件中的值。 | 
| hbase-env | 更改环境 HBase中的值。 | 
| hbase-log4j | 更改 hbase- HBase log4j.properties 文件中的值。 | 
| hbase-metrics | 更改 hadoop-metrics2-hb HBase aase.properties 文件中的值。 | 
| hbase-policy | 更改 HBase的 hbase-policy.xml 文件中的值。 | 
| hbase-site | 更改 hbase-site.xml 文件 HBase中的值。 | 
| hdfs-encryption-zones | 配置 HDFS 加密区域。 | 
| hdfs-site | 更改 HDFS 的 hdfs-site.xml 中的值。 | 
| hcatalog-env | 更改环境 HCatalog中的值。 | 
| hcatalog-server-jndi | 更改 HCatalog的 jndi.properties 中的值。 | 
| hcatalog-server-proto-hive-site | 更改 proto-hive-site .x HCatalog ml 中的值。 | 
| hcatalog-webhcat-env | 更改 HCatalog Web 环境HCat中的值。 | 
| hcatalog-webhcat-log4j | 更改 HCatalog Web HCat 的 log4j.properties 中的值。 | 
| hcatalog-webhcat-site | 更改 HCatalog Web HCat 的 webhcat-site.xml 文件中的值。 | 
| hive-env | 更改 Hive 环境中的值。 | 
| hive-exec-log4j | 更改 Hive 的 hive-exec-log 4j.properties 文件中的值。 | 
| hive-log4j | 更改 Hive 的 hive-log4j.properties 文件中的值。 | 
| hive-site | 更改 Hive 的 hive-site.xml 文件中的值 | 
| hue-ini | 更改 Hue 的 ini 文件中的值 | 
| httpfs-env | 更改 HTTPFS 环境中的值。 | 
| httpfs-site | 更改 Hadoop 的 httpfs-site.xml 文件中的值。 | 
| hadoop-kms-acls | 更改 Hadoop 的 kms-acls.xml 文件中的值。 | 
| hadoop-kms-env | 更改 Hadoop KMS 环境中的值。 | 
| hadoop-kms-log4j | 更改 Hadoop 的 kms-log4j.properties 文件中的值。 | 
| hadoop-kms-site | 更改 Hadoop 的 kms-site.xml 文件中的值。 | 
| mapred-env | 更改 MapReduce 应用程序环境中的值。 | 
| mapred-site | 更改 MapReduce 应用程序的 mapred-site.xml 文件中的值。 | 
| oozie-env | 更改 Oozie 的环境中的值。 | 
| oozie-log4j | 更改 Oozie 的 oozie-log4j.properties 文件中的值。 | 
| oozie-site | 更改 Oozie 的 oozie-site.xml 文件中的值。 | 
| pig-properties | 更改 Pig 的 pig.properties 文件中的值。 | 
| pig-log4j | 更改 Pig 的 log4j.properties 文件中的值。 | 
| presto-log | 更改 Presto 的 log.properties 文件中的值。 | 
| presto-config | 更改 Presto 的 config.properties 文件中的值。 | 
| presto-connector-hive | 更改 Presto 的 hive.properties 文件中的值。 | 
| spark | 适用于 Apache Spark 的 Amazon EMR 辅助设置。 | 
| spark-defaults | 更改 Spark 的 spark-defaults.conf 文件中的值。 | 
| spark-env | 更改 Spark 环境中的值。 | 
| spark-log4j | 更改 Spark 的 log4j.properties 文件中的值。 | 
| spark-metrics | 更改 Spark 的 metrics.properties 文件中的值。 | 
| sqoop-env | 更改 Sqoop 的环境中的值。 | 
| sqoop-oraoop-site | 更改 Sqoop OraOop 的 oraoop-site.xml 文件中的值。 | 
| sqoop-site | 更改 Sqoop 的 sqoop-site.xml 文件中的值。 | 
| yarn-env | 更改 YARN 环境中的值。 | 
| yarn-site | 更改 YARN 的 yarn-site.xml 文件中的值。 | 
| zeppelin-env | 更改 Zeppelin 环境中的值。 | 
| zookeeper-config | 更改 ZooKeeper的 zoo.cfg 文件中的值。 | 
| zookeeper-log4j | 更改 ZooKeeper的 log4j.properties 文件中的值。 | 

# Amazon EMR 发行版 4.5.0
<a name="emr-450-release"></a>

## 4.5.0 应用程序版本
<a name="emr-450-app-versions"></a>

此版本包括以下应用程序：[http://ganglia.info](http://ganglia.info)、[https://cwiki.apache.org/confluence/display/Hive/HCatalog](https://cwiki.apache.org/confluence/display/Hive/HCatalog)、[http://hadoop.apache.org/docs/current/](http://hadoop.apache.org/docs/current/)、[http://hive.apache.org/](http://hive.apache.org/)、[http://gethue.com/](http://gethue.com/)、[http://mahout.apache.org/](http://mahout.apache.org/)、[http://oozie.apache.org/](http://oozie.apache.org/)、[http://pig.apache.org/](http://pig.apache.org/)、[https://prestodb.io/](https://prestodb.io/)、[https://spark.apache.org/docs/latest/](https://spark.apache.org/docs/latest/)、[http://sqoop.apache.org/](http://sqoop.apache.org/) 和 [https://zeppelin.incubator.apache.org/](https://zeppelin.incubator.apache.org/)。

下表列出了此版本的 Amazon EMR 中提供的应用程序版本以及前三个 Amazon EMR 发行版中的应用程序版本（若适用）。

有关每个发行版的 Amazon EMR 的应用程序版本的全面历史记录，请参见以下主题：
+ [Amazon EMR 7.x 发行版中的应用程序版本](emr-release-app-versions-7.x.md)
+ [Amazon EMR 6.x 发行版中的应用程序版本](emr-release-app-versions-6.x.md)
+ [Amazon EMR 5.x 发行版中的应用程序版本](emr-release-app-versions-5.x.md)
+ [Amazon EMR 4.x 发行版中的应用程序版本](emr-release-app-versions-4.x.md)


**应用程序版本信息**  

|  | emr-4.5.0 | emr-4.4.0 | emr-4.3.0 | emr-4.2.0 | 
| --- | --- | --- | --- | --- | 
| AWS 适用于 Java 的 SDK | 1.10.27 | 1.10.27 | 1.10.27 | 1.10.27 | 
| Python | 未跟踪 | 未跟踪 | 未跟踪 | 未跟踪 | 
| Scala | 未跟踪 | 未跟踪 | 未跟踪 | 未跟踪 | 
| AmazonCloudWatchAgent |  -  |  -  |  -  |  -  | 
| Delta |  -  |  -  |  -  |  -  | 
| Flink |  -  |  -  |  -  |  -  | 
| Ganglia | 3.7.2 | 3.7.2 | 3.7.2 | 3.6.0 | 
| HBase |  -  |  -  |  -  |  -  | 
| HCatalog | 1.0.0-amzn-4 | 1.0.0-amzn-3 |  -  |  -  | 
| Hadoop | 2.7.2-amzn-0 | 2.7.1-amzn-1 | 2.7.1-amzn-0 | 2.6.0-amzn-2 | 
| Hive | 1.0.0-amzn-4 | 1.0.0-amzn-3 | 1.0.0-amzn-2 | 1.0.0-amzn-1 | 
| Hudi |  -  |  -  |  -  |  -  | 
| Hue | 3.7.1-amzn-5 | 3.7.1-amzn-5 | 3.7.1-amzn-5 | 3.7.1-amzn-5 | 
| Iceberg |  -  |  -  |  -  |  -  | 
| JupyterEnterpriseGateway |  -  |  -  |  -  |  -  | 
| JupyterHub |  -  |  -  |  -  |  -  | 
| Livy |  -  |  -  |  -  |  -  | 
| MXNet |  -  |  -  |  -  |  -  | 
| Mahout | 0.11.1 | 0.11.1 | 0.11.0 | 0.11.0 | 
| Oozie |  -  |  -  |  -  |  -  | 
| Oozie-Sandbox | 4.2.0 | 4.2.0 | 4.2.0 | 4.2.0 | 
| Phoenix |  -  |  -  |  -  |  -  | 
| Pig | 0.14.0-amzn-0 | 0.14.0-amzn-0 | 0.14.0-amzn-0 | 0.14.0-amzn-0 | 
| Presto |  -  |  -  |  -  |  -  | 
| Presto-Sandbox | 0.140 | 0.136 | 0.130 | 0.125 | 
| Spark | 1.6.1 | 1.6.0 | 1.6.0 | 1.5.2 | 
| Sqoop |  -  |  -  |  -  |  -  | 
| Sqoop-Sandbox | 1.4.6 | 1.4.6 |  -  |  -  | 
| TensorFlow |  -  |  -  |  -  |  -  | 
| Tez |  -  |  -  |  -  |  -  | 
| Trino (PrestoSQL) |  -  |  -  |  -  |  -  | 
| Zeppelin |  -  |  -  |  -  |  -  | 
| Zeppelin-Sandbox | 0.5.6-incubating | 0.5.6-incubating | 0.5.5-incubating-amzn-1 | 0.5.5-incubating-amzn-0 | 
| ZooKeeper |  -  |  -  |  -  |  -  | 
| ZooKeeper-Sandbox |  -  |  -  |  -  |  -  | 

## 4.5.0 发布说明
<a name="emr-450-relnotes"></a>

以下发布说明包括有关 Amazon EMR 发行版 4.5.0 的信息。

发布日期：2016 年 4 月 4 日

**功能**
+ 已升级到 Spark 1.6.1
+ 已升级到 Hadoop 2.7.2
+ 已升级到 Presto 0.140
+ 增加了对 Amazon S3 服务器端加密的 AWS KMS 支持。

**早期版本中已解决的已知问题**
+ 修复了重启节点后无法启动 MySQL 和 Apache 服务器的问题。
+ 修复了 IMPORT 未正确使用存储在 Amazon S3 中的非分区表的问题
+ 修复了与 Presto 有关的问题，此问题导致在写入 Hive 表时要求暂存目录为 `/mnt/tmp` 而不是 `/tmp`。

## 4.5.0 组件版本
<a name="emr-450-components"></a>

下面列出了 Amazon EMR 随此发行版一起安装的组件。一些组件作为大数据应用程序包的一部分安装。其它组件是 Amazon EMR 独有的，并且已为系统流程和功能安装这些组件。它们通常以 `emr` 或 `aws` 开头。最新的 Amazon EMR 发行版中的大数据应用程序包通常是在社区中找到的最新版本。我们会尽快在 Amazon EMR 中提供社区发行版。

Amazon EMR 中的某些组件与社区版本不同。这些组件具有以下形式的 `CommunityVersion-amzn-EmrVersion` 的发行版标注。`EmrVersion` 从 0 开始。例如，假设已对名为 `myapp-component` 的版本 2.2 的开源社区组件进行三次修改，以包含在不同的 Amazon EMR 发行版中，则其发行版将为 `2.2-amzn-2`。


| 组件 | 版本 | 说明 | 
| --- | --- | --- | 
| emr-ddb | 3.0.0 | 适用于 Hadoop 生态系统应用程序的 Amazon DynamoDB 连接器。 | 
| emr-goodies | 2.0.0 | 适用于 Hadoop 生态系统的方便易用的库。 | 
| emr-kinesis | 3.1.0 | 适用于 Hadoop 生态系统应用程序的 Amazon Kinesis 连接器。 | 
| emr-s3-dist-cp | 2.2.0 | 针对 Amazon S3 优化的分布式复制应用程序。 | 
| emrfs | 2.5.0 | 适用于 Hadoop 生态系统应用程序的 Amazon S3 连接器。 | 
| ganglia-monitor | 3.7.2 | 适用于 Hadoop 生态系统应用程序的嵌入式 Ganglia 代理以及 Ganglia 监控代理。 | 
| ganglia-metadata-collector | 3.7.2 | 用于从 Ganglia 监控代理中聚合指标的 Ganglia 元数据收集器。 | 
| ganglia-web | 3.7.1 | 用于查看由 Ganglia 元数据收集器收集的指标的 Web 应用程序。 | 
| hadoop-client | 2.7.2-amzn-0 | Hadoop 命令行客户端，如“hdfs”、“hadoop”或“yarn”。 | 
| hadoop-hdfs-datanode | 2.7.2-amzn-0 | 用于存储数据块的 HDFS 节点级服务。 | 
| hadoop-hdfs-library | 2.7.2-amzn-0 | HDFS 命令行客户端和库 | 
| hadoop-hdfs-namenode | 2.7.2-amzn-0 | 用于跟踪文件名和数据块位置的 HDFS 服务。 | 
| hadoop-httpfs-server | 2.7.2-amzn-0 | 用于 HDFS 操作的 HTTP 终端节点。 | 
| hadoop-kms-server | 2.7.2-amzn-0 | 基于 Hadoop 的 API 的加密密钥管理服务器。 KeyProvider  | 
| hadoop-mapred | 2.7.2-amzn-0 | MapReduce 用于运行 MapReduce 应用程序的执行引擎库。 | 
| hadoop-yarn-nodemanager | 2.7.2-amzn-0 | 用于管理单个节点上的容器的 YARN 服务。 | 
| hadoop-yarn-resourcemanager | 2.7.2-amzn-0 | 用于分配和管理集群资源与分布式应用程序的 YARN 服务。 | 
| hcatalog-client | 1.0.0-amzn-4 | 用于操作 hcatalog-server 的“hcat”命令行客户端。 | 
| hcatalog-server | 1.0.0-amzn-4 | 提供服务 HCatalog，为分布式应用程序提供表和存储管理层。 | 
| hcatalog-webhcat-server | 1.0.0-amzn-4 | 为其提供 REST 接口的 HTTP 端点 HCatalog。 | 
| hive-client | 1.0.0-amzn-4 | Hive 命令行客户端。 | 
| hive-metastore-server | 1.0.0-amzn-4 | 用于访问 Hive 元存储 (一个用于存储 Hadoop 操作中的 SQL 的元数据的语义存储库) 的服务。 | 
| hive-server | 1.0.0-amzn-4 | 用于将 Hive 查询作为 Web 请求接受的服务。 | 
| hue-server | 3.7.1-amzn-5 | 用于使用 Hadoop 生态系统应用程序分析数据的 Web 应用程序 | 
| mahout-client | 0.11.1 | 用于机器学习的库。 | 
| mysql-server | 5.5 | MySQL 数据库服务器。 | 
| oozie-client | 4.2.0 | Oozie 命令行客户端。 | 
| oozie-server | 4.2.0 | 用于接受 Oozie 工作流请求的服务。 | 
| presto-coordinator | 0.140 | 用于在 presto-worker 之中接受查询并管理查询的服务。 | 
| presto-worker | 0.140 | 用于执行查询的各个部分的服务。 | 
| pig-client | 0.14.0-amzn-0 | Pig 命令行客户端。 | 
| spark-client | 1.6.1 | Spark 命令行客户端。 | 
| spark-history-server | 1.6.1 | 用于查看完整的 Spark 应用程序的生命周期的已记录事件的 Web UI。 | 
| spark-on-yarn | 1.6.1 | 适用于 YARN 的内存中执行引擎。 | 
| spark-yarn-slave | 1.6.1 | YARN 从属项所需的 Apache Spark 库。 | 
| sqoop-client | 1.4.6 | Apache Sqoop 命令行客户端。 | 
| webserver | 2.4 | Apache HTTP 服务器。 | 
| zeppelin-server | 0.5.6-incubating | 支持交互式数据分析的基于 Web 的 Notebook。 | 

## 4.5.0 配置分类
<a name="emr-450-class"></a>

配置分类允许您自定义应用程序。这些通常与应用程序的配置 XML 文件（例如 `hive-site.xml`）相对应。有关更多信息，请参阅[配置应用程序](emr-configure-apps.md)。


**emr-4.5.0 分类**  

| 分类 | 说明 | 
| --- | --- | 
| capacity-scheduler | 更改 Hadoop 的 capacity-scheduler.xml 文件中的值。 | 
| core-site | 更改 Hadoop 的 core-site.xml 文件中的值。 | 
| emrfs-site | 更改 EMRFS 设置。 | 
| hadoop-env | 更改适用于所有 Hadoop 组件的 Hadoop 环境中的值。 | 
| hadoop-log4j | 更改 Hadoop 的 log4j.properties 文件中的值。 | 
| hdfs-encryption-zones | 配置 HDFS 加密区域。 | 
| hdfs-site | 更改 HDFS 的 hdfs-site.xml 中的值。 | 
| hcatalog-env | 更改环境 HCatalog中的值。 | 
| hcatalog-server-jndi | 更改 HCatalog的 jndi.properties 中的值。 | 
| hcatalog-server-proto-hive-site | 更改 proto-hive-site .x HCatalog ml 中的值。 | 
| hcatalog-webhcat-env | 更改 HCatalog Web 环境HCat中的值。 | 
| hcatalog-webhcat-log4j | 更改 HCatalog Web HCat 的 log4j.properties 中的值。 | 
| hcatalog-webhcat-site | 更改 HCatalog Web HCat 的 webhcat-site.xml 文件中的值。 | 
| hive-env | 更改 Hive 环境中的值。 | 
| hive-exec-log4j | 更改 Hive 的 hive-exec-log 4j.properties 文件中的值。 | 
| hive-log4j | 更改 Hive 的 hive-log4j.properties 文件中的值。 | 
| hive-site | 更改 Hive 的 hive-site.xml 文件中的值 | 
| hue-ini | 更改 Hue 的 ini 文件中的值 | 
| httpfs-env | 更改 HTTPFS 环境中的值。 | 
| httpfs-site | 更改 Hadoop 的 httpfs-site.xml 文件中的值。 | 
| hadoop-kms-acls | 更改 Hadoop 的 kms-acls.xml 文件中的值。 | 
| hadoop-kms-env | 更改 Hadoop KMS 环境中的值。 | 
| hadoop-kms-log4j | 更改 Hadoop 的 kms-log4j.properties 文件中的值。 | 
| hadoop-kms-site | 更改 Hadoop 的 kms-site.xml 文件中的值。 | 
| mapred-env | 更改 MapReduce 应用程序环境中的值。 | 
| mapred-site | 更改 MapReduce 应用程序的 mapred-site.xml 文件中的值。 | 
| oozie-env | 更改 Oozie 的环境中的值。 | 
| oozie-log4j | 更改 Oozie 的 oozie-log4j.properties 文件中的值。 | 
| oozie-site | 更改 Oozie 的 oozie-site.xml 文件中的值。 | 
| pig-properties | 更改 Pig 的 pig.properties 文件中的值。 | 
| pig-log4j | 更改 Pig 的 log4j.properties 文件中的值。 | 
| presto-log | 更改 Presto 的 log.properties 文件中的值。 | 
| presto-config | 更改 Presto 的 config.properties 文件中的值。 | 
| presto-connector-hive | 更改 Presto 的 hive.properties 文件中的值。 | 
| spark | 适用于 Apache Spark 的 Amazon EMR 辅助设置。 | 
| spark-defaults | 更改 Spark 的 spark-defaults.conf 文件中的值。 | 
| spark-env | 更改 Spark 环境中的值。 | 
| spark-log4j | 更改 Spark 的 log4j.properties 文件中的值。 | 
| spark-metrics | 更改 Spark 的 metrics.properties 文件中的值。 | 
| sqoop-env | 更改 Sqoop 的环境中的值。 | 
| sqoop-oraoop-site | 更改 Sqoop OraOop 的 oraoop-site.xml 文件中的值。 | 
| sqoop-site | 更改 Sqoop 的 sqoop-site.xml 文件中的值。 | 
| yarn-env | 更改 YARN 环境中的值。 | 
| yarn-site | 更改 YARN 的 yarn-site.xml 文件中的值。 | 
| zeppelin-env | 更改 Zeppelin 环境中的值。 | 

# Amazon EMR 发行版 4.4.0
<a name="emr-440-release"></a>

## 4.4.0 应用程序版本
<a name="emr-440-app-versions"></a>

此版本包括以下应用程序：[http://ganglia.info](http://ganglia.info)、[https://cwiki.apache.org/confluence/display/Hive/HCatalog](https://cwiki.apache.org/confluence/display/Hive/HCatalog)、[http://hadoop.apache.org/docs/current/](http://hadoop.apache.org/docs/current/)、[http://hive.apache.org/](http://hive.apache.org/)、[http://gethue.com/](http://gethue.com/)、[http://mahout.apache.org/](http://mahout.apache.org/)、[http://oozie.apache.org/](http://oozie.apache.org/)、[http://pig.apache.org/](http://pig.apache.org/)、[https://prestodb.io/](https://prestodb.io/)、[https://spark.apache.org/docs/latest/](https://spark.apache.org/docs/latest/)、[http://sqoop.apache.org/](http://sqoop.apache.org/) 和 [https://zeppelin.incubator.apache.org/](https://zeppelin.incubator.apache.org/)。

下表列出了此版本的 Amazon EMR 中提供的应用程序版本以及前三个 Amazon EMR 发行版中的应用程序版本（若适用）。

有关每个发行版的 Amazon EMR 的应用程序版本的全面历史记录，请参见以下主题：
+ [Amazon EMR 7.x 发行版中的应用程序版本](emr-release-app-versions-7.x.md)
+ [Amazon EMR 6.x 发行版中的应用程序版本](emr-release-app-versions-6.x.md)
+ [Amazon EMR 5.x 发行版中的应用程序版本](emr-release-app-versions-5.x.md)
+ [Amazon EMR 4.x 发行版中的应用程序版本](emr-release-app-versions-4.x.md)


**应用程序版本信息**  

|  | emr-4.4.0 | emr-4.3.0 | emr-4.2.0 | emr-4.1.0 | 
| --- | --- | --- | --- | --- | 
| AWS 适用于 Java 的 SDK | 1.10.27 | 1.10.27 | 1.10.27 | 未跟踪 | 
| Python | 未跟踪 | 未跟踪 | 未跟踪 | 未跟踪 | 
| Scala | 未跟踪 | 未跟踪 | 未跟踪 | 未跟踪 | 
| AmazonCloudWatchAgent |  -  |  -  |  -  |  -  | 
| Delta |  -  |  -  |  -  |  -  | 
| Flink |  -  |  -  |  -  |  -  | 
| Ganglia | 3.7.2 | 3.7.2 | 3.6.0 |  -  | 
| HBase |  -  |  -  |  -  |  -  | 
| HCatalog | 1.0.0-amzn-3 |  -  |  -  |  -  | 
| Hadoop | 2.7.1-amzn-1 | 2.7.1-amzn-0 | 2.6.0-amzn-2 | 2.6.0-amzn-1 | 
| Hive | 1.0.0-amzn-3 | 1.0.0-amzn-2 | 1.0.0-amzn-1 | 1.0.0-amzn-1 | 
| Hudi |  -  |  -  |  -  |  -  | 
| Hue | 3.7.1-amzn-5 | 3.7.1-amzn-5 | 3.7.1-amzn-5 | 3.7.1-amzn-4 | 
| Iceberg |  -  |  -  |  -  |  -  | 
| JupyterEnterpriseGateway |  -  |  -  |  -  |  -  | 
| JupyterHub |  -  |  -  |  -  |  -  | 
| Livy |  -  |  -  |  -  |  -  | 
| MXNet |  -  |  -  |  -  |  -  | 
| Mahout | 0.11.1 | 0.11.0 | 0.11.0 | 0.11.0 | 
| Oozie |  -  |  -  |  -  |  -  | 
| Oozie-Sandbox | 4.2.0 | 4.2.0 | 4.2.0 | 4.0.1 | 
| Phoenix |  -  |  -  |  -  |  -  | 
| Pig | 0.14.0-amzn-0 | 0.14.0-amzn-0 | 0.14.0-amzn-0 | 0.14.0-amzn-0 | 
| Presto |  -  |  -  |  -  |  -  | 
| Presto-Sandbox | 0.136 | 0.130 | 0.125 | 0.119 | 
| Spark | 1.6.0 | 1.6.0 | 1.5.2 | 1.5.0 | 
| Sqoop |  -  |  -  |  -  |  -  | 
| Sqoop-Sandbox | 1.4.6 |  -  |  -  |  -  | 
| TensorFlow |  -  |  -  |  -  |  -  | 
| Tez |  -  |  -  |  -  |  -  | 
| Trino (PrestoSQL) |  -  |  -  |  -  |  -  | 
| Zeppelin |  -  |  -  |  -  |  -  | 
| Zeppelin-Sandbox | 0.5.6-incubating | 0.5.5-incubating-amzn-1 | 0.5.5-incubating-amzn-0 | 0.6.0-incubating-SNAPSHOT | 
| ZooKeeper |  -  |  -  |  -  |  -  | 
| ZooKeeper-Sandbox |  -  |  -  |  -  |  -  | 

## 4.4.0 发布说明
<a name="emr-440-relnotes"></a>

以下发布说明包括有关 Amazon EMR 发行版 4.4.0 的信息。

发布日期：2016 年 3 月 14 日

**功能**
+ 已添加 HCatalog 1.0.0
+ 已添加 Sqoop-Sandbox 1.4.6
+ 已升级到 Presto 0.136
+ 已升级到 Zeppelin 0.5.6
+ 已升级到 Mahout 0.11.1
+ 默认情况下已启用 `dynamicResourceAllocation`。
+ 已添加针对此版本的所有配置分类的表。有关更多信息，请参阅[配置应用程序](https://docs.aws.amazon.com/emr/latest/ReleaseGuide/emr-configure-apps.html)中的“配置分类”表。

**早期版本中已解决的已知问题**
+ 修复了该`maximizeResourceAllocation`设置无法为 YARN ApplicationMaster 守护程序保留足够内存的问题。
+ 修复了遇到的与自定义 DNS 相关的问题。如果 `resolve.conf` 中的任何条目位于提供的自定义条目之前，则自定义条目不可解析。此行为受 VPC 中集群的影响，其中，默认 VPC 名称服务器已作为顶部条目插入 `resolve.conf` 中。
+ 修复了默认 Python 已移至版本 2.7 且未为该版本安装 boto 的问题。
+ 修复了 YARN 容器和 Spark 应用程序将生成唯一 Ganglia 轮询数据库 (rrd) 文件的问题，此问题会导致第一个附加到实例的磁盘填满。修复后，YARN 容器级别指标和 Spark 应用程序级别指标均已禁用。
+ 修复了导致日志推送程序中删除所有空日志文件夹的问题。这会造成 Hive CLI 无法记录日志，因为日志推送程序已删除 `user` 下的 `/var/log/hive` 空文件夹。
+ 修复了影响 Hive 导入的问题，此问题影响分区并导致导入期间出现错误。
+ 修复了 EMRFS 和 s3-dist-cp 未正确处理包含句点的存储桶名称的问题。
+ 更改了 EMRFS 中的行为，以便在启用版本控制的存储桶中，不会持续创建 `_$folder$` 标记文件，从而有助于提高启用版本控制的存储桶的性能。
+ 更改了 EMRFS 中的行为，使它不会使用说明文件，已启用客户端加密的情况除外。如果您要在使用客户端加密时删除说明文件，可将 emrfs-site.xml 属性 `fs.s3.cse.cryptoStorageMode.deleteInstructionFiles.enabled` 设置为 true。
+ 更改了 YARN 日志聚合以在聚合目标中将日志保留两天。默认目标为您的集群的 HDFS 存储。如果您要更改此持续时间，请在创建集群时使用 `yarn.log-aggregation.retain-seconds` 配置分类来更改 `yarn-site` 的值。与往常一样，您可以在创建集群时使用 `log-uri` 参数将应用程序日志保存到 Amazon S3。

**已应用的修补程序**
+ [HIVE-9655](https://issues.apache.org/jira/browse/HIVE-9655)
+ [HIVE-9183](https://issues.apache.org/jira/browse/HIVE-9183)
+ [HADOOP-12810](https://issues.apache.org/jira/browse/HADOOP-12810)

## 4.4.0 组件版本
<a name="emr-440-components"></a>

下面列出了 Amazon EMR 随此发行版一起安装的组件。一些组件作为大数据应用程序包的一部分安装。其它组件是 Amazon EMR 独有的，并且已为系统流程和功能安装这些组件。它们通常以 `emr` 或 `aws` 开头。最新的 Amazon EMR 发行版中的大数据应用程序包通常是在社区中找到的最新版本。我们会尽快在 Amazon EMR 中提供社区发行版。

Amazon EMR 中的某些组件与社区版本不同。这些组件具有以下形式的 `CommunityVersion-amzn-EmrVersion` 的发行版标注。`EmrVersion` 从 0 开始。例如，假设已对名为 `myapp-component` 的版本 2.2 的开源社区组件进行三次修改，以包含在不同的 Amazon EMR 发行版中，则其发行版将为 `2.2-amzn-2`。


| 组件 | 版本 | 说明 | 
| --- | --- | --- | 
| emr-ddb | 3.0.0 | 适用于 Hadoop 生态系统应用程序的 Amazon DynamoDB 连接器。 | 
| emr-goodies | 2.0.0 | 适用于 Hadoop 生态系统的方便易用的库。 | 
| emr-kinesis | 3.1.0 | 适用于 Hadoop 生态系统应用程序的 Amazon Kinesis 连接器。 | 
| emr-s3-dist-cp | 2.2.0 | 针对 Amazon S3 优化的分布式复制应用程序。 | 
| emrfs | 2.4.0 | 适用于 Hadoop 生态系统应用程序的 Amazon S3 连接器。 | 
| ganglia-monitor | 3.7.2 | 适用于 Hadoop 生态系统应用程序的嵌入式 Ganglia 代理以及 Ganglia 监控代理。 | 
| ganglia-metadata-collector | 3.7.2 | 用于从 Ganglia 监控代理中聚合指标的 Ganglia 元数据收集器。 | 
| ganglia-web | 3.7.1 | 用于查看由 Ganglia 元数据收集器收集的指标的 Web 应用程序。 | 
| hadoop-client | 2.7.1-amzn-1 | Hadoop 命令行客户端，如“hdfs”、“hadoop”或“yarn”。 | 
| hadoop-hdfs-datanode | 2.7.1-amzn-1 | 用于存储数据块的 HDFS 节点级服务。 | 
| hadoop-hdfs-library | 2.7.1-amzn-1 | HDFS 命令行客户端和库 | 
| hadoop-hdfs-namenode | 2.7.1-amzn-1 | 用于跟踪文件名和数据块位置的 HDFS 服务。 | 
| hadoop-httpfs-server | 2.7.1-amzn-1 | 用于 HDFS 操作的 HTTP 终端节点。 | 
| hadoop-kms-server | 2.7.1-amzn-1 | 基于 Hadoop 的 API 的加密密钥管理服务器。 KeyProvider  | 
| hadoop-mapred | 2.7.1-amzn-1 | MapReduce 用于运行 MapReduce 应用程序的执行引擎库。 | 
| hadoop-yarn-nodemanager | 2.7.1-amzn-1 | 用于管理单个节点上的容器的 YARN 服务。 | 
| hadoop-yarn-resourcemanager | 2.7.1-amzn-1 | 用于分配和管理集群资源与分布式应用程序的 YARN 服务。 | 
| hcatalog-client | 1.0.0-amzn-3 | 用于操作 hcatalog-server 的“hcat”命令行客户端。 | 
| hcatalog-server | 1.0.0-amzn-3 | 提供服务 HCatalog，为分布式应用程序提供表和存储管理层。 | 
| hcatalog-webhcat-server | 1.0.0-amzn-3 | 为其提供 REST 接口的 HTTP 端点 HCatalog。 | 
| hive-client | 1.0.0-amzn-3 | Hive 命令行客户端。 | 
| hive-metastore-server | 1.0.0-amzn-3 | 用于访问 Hive 元存储 (一个用于存储 Hadoop 操作中的 SQL 的元数据的语义存储库) 的服务。 | 
| hive-server | 1.0.0-amzn-3 | 用于将 Hive 查询作为 Web 请求接受的服务。 | 
| hue-server | 3.7.1-amzn-5 | 用于使用 Hadoop 生态系统应用程序分析数据的 Web 应用程序 | 
| mahout-client | 0.11.1 | 用于机器学习的库。 | 
| mysql-server | 5.5 | MySQL 数据库服务器。 | 
| oozie-client | 4.2.0 | Oozie 命令行客户端。 | 
| oozie-server | 4.2.0 | 用于接受 Oozie 工作流请求的服务。 | 
| presto-coordinator | 0.136 | 用于在 presto-worker 之中接受查询并管理查询的服务。 | 
| presto-worker | 0.136 | 用于执行查询的各个部分的服务。 | 
| pig-client | 0.14.0-amzn-0 | Pig 命令行客户端。 | 
| spark-client | 1.6.0 | Spark 命令行客户端。 | 
| spark-history-server | 1.6.0 | 用于查看完整的 Spark 应用程序的生命周期的已记录事件的 Web UI。 | 
| spark-on-yarn | 1.6.0 | 适用于 YARN 的内存中执行引擎。 | 
| spark-yarn-slave | 1.6.0 | YARN 从属项所需的 Apache Spark 库。 | 
| sqoop-client | 1.4.6 | Apache Sqoop 命令行客户端。 | 
| webserver | 2.4 | Apache HTTP 服务器。 | 
| zeppelin-server | 0.5.6-incubating | 支持交互式数据分析的基于 Web 的 Notebook。 | 

## 4.4.0 配置分类
<a name="emr-440-class"></a>

配置分类允许您自定义应用程序。这些通常与应用程序的配置 XML 文件（例如 `hive-site.xml`）相对应。有关更多信息，请参阅[配置应用程序](emr-configure-apps.md)。


**emr-4.4.0 分类**  

| 分类 | 说明 | 
| --- | --- | 
| capacity-scheduler | 更改 Hadoop 的 capacity-scheduler.xml 文件中的值。 | 
| core-site | 更改 Hadoop 的 core-site.xml 文件中的值。 | 
| emrfs-site | 更改 EMRFS 设置。 | 
| hadoop-env | 更改适用于所有 Hadoop 组件的 Hadoop 环境中的值。 | 
| hadoop-log4j | 更改 Hadoop 的 log4j.properties 文件中的值。 | 
| hdfs-encryption-zones | 配置 HDFS 加密区域。 | 
| hdfs-site | 更改 HDFS 的 hdfs-site.xml 中的值。 | 
| hcatalog-env | 更改环境 HCatalog中的值。 | 
| hcatalog-server-jndi | 更改 HCatalog的 jndi.properties 中的值。 | 
| hcatalog-server-proto-hive-site | 更改 proto-hive-site .x HCatalog ml 中的值。 | 
| hcatalog-webhcat-env | 更改 HCatalog Web 环境HCat中的值。 | 
| hcatalog-webhcat-log4j | 更改 HCatalog Web HCat 的 log4j.properties 中的值。 | 
| hcatalog-webhcat-site | 更改 HCatalog Web HCat 的 webhcat-site.xml 文件中的值。 | 
| hive-env | 更改 Hive 环境中的值。 | 
| hive-exec-log4j | 更改 Hive 的 hive-exec-log 4j.properties 文件中的值。 | 
| hive-log4j | 更改 Hive 的 hive-log4j.properties 文件中的值。 | 
| hive-site | 更改 Hive 的 hive-site.xml 文件中的值 | 
| hue-ini | 更改 Hue 的 ini 文件中的值 | 
| httpfs-env | 更改 HTTPFS 环境中的值。 | 
| httpfs-site | 更改 Hadoop 的 httpfs-site.xml 文件中的值。 | 
| hadoop-kms-acls | 更改 Hadoop 的 kms-acls.xml 文件中的值。 | 
| hadoop-kms-env | 更改 Hadoop KMS 环境中的值。 | 
| hadoop-kms-log4j | 更改 Hadoop 的 kms-log4j.properties 文件中的值。 | 
| hadoop-kms-site | 更改 Hadoop 的 kms-site.xml 文件中的值。 | 
| mapred-env | 更改 MapReduce 应用程序环境中的值。 | 
| mapred-site | 更改 MapReduce 应用程序的 mapred-site.xml 文件中的值。 | 
| oozie-env | 更改 Oozie 的环境中的值。 | 
| oozie-log4j | 更改 Oozie 的 oozie-log4j.properties 文件中的值。 | 
| oozie-site | 更改 Oozie 的 oozie-site.xml 文件中的值。 | 
| pig-properties | 更改 Pig 的 pig.properties 文件中的值。 | 
| pig-log4j | 更改 Pig 的 log4j.properties 文件中的值。 | 
| presto-log | 更改 Presto 的 log.properties 文件中的值。 | 
| presto-config | 更改 Presto 的 config.properties 文件中的值。 | 
| presto-connector-hive | 更改 Presto 的 hive.properties 文件中的值。 | 
| spark | 适用于 Apache Spark 的 Amazon EMR 辅助设置。 | 
| spark-defaults | 更改 Spark 的 spark-defaults.conf 文件中的值。 | 
| spark-env | 更改 Spark 环境中的值。 | 
| spark-log4j | 更改 Spark 的 log4j.properties 文件中的值。 | 
| spark-metrics | 更改 Spark 的 metrics.properties 文件中的值。 | 
| sqoop-env | 更改 Sqoop 的环境中的值。 | 
| sqoop-oraoop-site | 更改 Sqoop OraOop 的 oraoop-site.xml 文件中的值。 | 
| sqoop-site | 更改 Sqoop 的 sqoop-site.xml 文件中的值。 | 
| yarn-env | 更改 YARN 环境中的值。 | 
| yarn-site | 更改 YARN 的 yarn-site.xml 文件中的值。 | 
| zeppelin-env | 更改 Zeppelin 环境中的值。 | 

# Amazon EMR 发行版 4.3.0
<a name="emr-430-release"></a>

## 4.3.0 应用程序版本
<a name="emr-430-app-versions"></a>

此版本包括以下应用程序：[http://ganglia.info](http://ganglia.info)、[http://hadoop.apache.org/docs/current/](http://hadoop.apache.org/docs/current/)、[http://hive.apache.org/](http://hive.apache.org/)、[http://gethue.com/](http://gethue.com/)、[http://mahout.apache.org/](http://mahout.apache.org/)、[http://oozie.apache.org/](http://oozie.apache.org/)、[http://pig.apache.org/](http://pig.apache.org/)、[https://prestodb.io/](https://prestodb.io/)、[https://spark.apache.org/docs/latest/](https://spark.apache.org/docs/latest/) 和 [https://zeppelin.incubator.apache.org/](https://zeppelin.incubator.apache.org/)。

下表列出了此版本的 Amazon EMR 中提供的应用程序版本以及前三个 Amazon EMR 发行版中的应用程序版本（若适用）。

有关每个发行版的 Amazon EMR 的应用程序版本的全面历史记录，请参见以下主题：
+ [Amazon EMR 7.x 发行版中的应用程序版本](emr-release-app-versions-7.x.md)
+ [Amazon EMR 6.x 发行版中的应用程序版本](emr-release-app-versions-6.x.md)
+ [Amazon EMR 5.x 发行版中的应用程序版本](emr-release-app-versions-5.x.md)
+ [Amazon EMR 4.x 发行版中的应用程序版本](emr-release-app-versions-4.x.md)


**应用程序版本信息**  

|  | emr-4.3.0 | emr-4.2.0 | emr-4.1.0 | emr-4.0.0 | 
| --- | --- | --- | --- | --- | 
| AWS 适用于 Java 的 SDK | 1.10.27 | 1.10.27 | 未跟踪 | 未跟踪 | 
| Python | 未跟踪 | 未跟踪 | 未跟踪 | 未跟踪 | 
| Scala | 未跟踪 | 未跟踪 | 未跟踪 | 未跟踪 | 
| AmazonCloudWatchAgent |  -  |  -  |  -  |  -  | 
| Delta |  -  |  -  |  -  |  -  | 
| Flink |  -  |  -  |  -  |  -  | 
| Ganglia | 3.7.2 | 3.6.0 |  -  |  -  | 
| HBase |  -  |  -  |  -  |  -  | 
| HCatalog |  -  |  -  |  -  |  -  | 
| Hadoop | 2.7.1-amzn-0 | 2.6.0-amzn-2 | 2.6.0-amzn-1 | 2.6.0-amzn-0 | 
| Hive | 1.0.0-amzn-2 | 1.0.0-amzn-1 | 1.0.0-amzn-1 | 1.0.0-amzn-0 | 
| Hudi |  -  |  -  |  -  |  -  | 
| Hue | 3.7.1-amzn-5 | 3.7.1-amzn-5 | 3.7.1-amzn-4 |  -  | 
| Iceberg |  -  |  -  |  -  |  -  | 
| JupyterEnterpriseGateway |  -  |  -  |  -  |  -  | 
| JupyterHub |  -  |  -  |  -  |  -  | 
| Livy |  -  |  -  |  -  |  -  | 
| MXNet |  -  |  -  |  -  |  -  | 
| Mahout | 0.11.0 | 0.11.0 | 0.11.0 | 0.10.0 | 
| Oozie |  -  |  -  |  -  |  -  | 
| Oozie-Sandbox | 4.2.0 | 4.2.0 | 4.0.1 |  -  | 
| Phoenix |  -  |  -  |  -  |  -  | 
| Pig | 0.14.0-amzn-0 | 0.14.0-amzn-0 | 0.14.0-amzn-0 | 0.14.0-amzn-0 | 
| Presto |  -  |  -  |  -  |  -  | 
| Presto-Sandbox | 0.130 | 0.125 | 0.119 |  -  | 
| Spark | 1.6.0 | 1.5.2 | 1.5.0 | 1.4.1 | 
| Sqoop |  -  |  -  |  -  |  -  | 
| Sqoop-Sandbox |  -  |  -  |  -  |  -  | 
| TensorFlow |  -  |  -  |  -  |  -  | 
| Tez |  -  |  -  |  -  |  -  | 
| Trino (PrestoSQL) |  -  |  -  |  -  |  -  | 
| Zeppelin |  -  |  -  |  -  |  -  | 
| Zeppelin-Sandbox | 0.5.5-incubating-amzn-1 | 0.5.5-incubating-amzn-0 | 0.6.0-incubating-SNAPSHOT |  -  | 
| ZooKeeper |  -  |  -  |  -  |  -  | 
| ZooKeeper-Sandbox |  -  |  -  |  -  |  -  | 

## 4.3.0 发布说明
<a name="emr-430-relnotes"></a>

以下发布说明包括有关 Amazon EMR 发行版 4.3.0 的信息。

发布日期：2016 年 1 月 19 日

**功能**
+ 已升级到 Hadoop 2.7.1
+ 已升级到 Spark 1.6.0
+ 已将 Ganglia 升级到 3.7.2 
+ 已将 Presto 升级到 0.130
+ 将 `spark.dynamicAllocation.enabled` 设置为 true 时，Amazon EMR 已对其做出一些更改；默认情况下，此项为 false。如果设置为 true，则会影响由 `maximizeResourceAllocation` 设置设定的默认值：
  + 若`spark.dynamicAllocation.enabled`设为 true，则 `spark.executor.instances` 将不被 `maximizeResourceAllocation` 设置。
  + 目前，`spark.driver.memory` 设置根据集群中的实例类型进行配置，与 `spark.executors.memory` 设置的方式类似。但是，由于 Spark 驱动应用程序可在主实例或核心实例之一上运行 (例如在 YARN 客户端和集群模式下分别进行)，`spark.driver.memory` 设置根据更小实例类型的实例类型，在两个实例组之间进行。
  + 目前，`spark.default.parallelism` 设置为 YARN 容器可用的 CPU 内核数的两倍。在上一版本中，这是该值的一半。
  + 为 Spark YARN 过程预留的内存开销计算精确性经过优化，从而使得 Spark 可用内存总量略有增加（即 `spark.executor.memory`）。

**早期版本中已解决的已知问题**
+ 默认情况下，现已启用 YARN 日志聚合。
+ 修复了在启用 YARN 日志聚合后日志未推送至集群的 Amazon S3 日志存储桶的问题。
+ YARN 容器大小现跨所有节点类型具有新的最小值 32。
+ 修复了导致大型集群中主节点磁盘 I/O 过多的 Ganglia 问题。
+ 修复了在关闭集群时阻止应用程序日志推送至 Amazon S3 的问题。
+ 修复了 EMRFS CLI 中导致某些命令失败的问题。
+ 修复了齐柏林飞艇无法在底层加载依赖项的问题。 SparkContext
+ 修复了因发出尝试添加实例的调整大小命令导致的问题。
+ 修复了 Hive 中的问题，此问题导致 CREATE TABLE AS SELECT 对 Amazon S3 进行过多的列表调用。
+ 修复了在安装 Hue、Oozie 和 Ganglia 时无法正常预置大型集群的问题。
+ 修复了 s3-dist-cp 中的问题，此问题导致即使在失败并出现错误的情况下仍将返回零退出代码。

## 4.3.0 组件版本
<a name="emr-430-components"></a>

下面列出了 Amazon EMR 随此发行版一起安装的组件。一些组件作为大数据应用程序包的一部分安装。其它组件是 Amazon EMR 独有的，并且已为系统流程和功能安装这些组件。它们通常以 `emr` 或 `aws` 开头。最新的 Amazon EMR 发行版中的大数据应用程序包通常是在社区中找到的最新版本。我们会尽快在 Amazon EMR 中提供社区发行版。

Amazon EMR 中的某些组件与社区版本不同。这些组件具有以下形式的 `CommunityVersion-amzn-EmrVersion` 的发行版标注。`EmrVersion` 从 0 开始。例如，假设已对名为 `myapp-component` 的版本 2.2 的开源社区组件进行三次修改，以包含在不同的 Amazon EMR 发行版中，则其发行版将为 `2.2-amzn-2`。


| 组件 | 版本 | 说明 | 
| --- | --- | --- | 
| emr-ddb | 3.0.0 | 适用于 Hadoop 生态系统应用程序的 Amazon DynamoDB 连接器。 | 
| emr-goodies | 2.0.0 | 适用于 Hadoop 生态系统的方便易用的库。 | 
| emr-kinesis | 3.1.0 | 适用于 Hadoop 生态系统应用程序的 Amazon Kinesis 连接器。 | 
| emr-s3-dist-cp | 2.1.0 | 针对 Amazon S3 优化的分布式复制应用程序。 | 
| emrfs | 2.3.0 | 适用于 Hadoop 生态系统应用程序的 Amazon S3 连接器。 | 
| ganglia-monitor | 3.7.2 | 适用于 Hadoop 生态系统应用程序的嵌入式 Ganglia 代理以及 Ganglia 监控代理。 | 
| ganglia-metadata-collector | 3.7.2 | 用于从 Ganglia 监控代理中聚合指标的 Ganglia 元数据收集器。 | 
| ganglia-web | 3.7.1 | 用于查看由 Ganglia 元数据收集器收集的指标的 Web 应用程序。 | 
| hadoop-client | 2.7.1-amzn-0 | Hadoop 命令行客户端，如“hdfs”、“hadoop”或“yarn”。 | 
| hadoop-hdfs-datanode | 2.7.1-amzn-0 | 用于存储数据块的 HDFS 节点级服务。 | 
| hadoop-hdfs-library | 2.7.1-amzn-0 | HDFS 命令行客户端和库 | 
| hadoop-hdfs-namenode | 2.7.1-amzn-0 | 用于跟踪文件名和数据块位置的 HDFS 服务。 | 
| hadoop-httpfs-server | 2.7.1-amzn-0 | 用于 HDFS 操作的 HTTP 终端节点。 | 
| hadoop-kms-server | 2.7.1-amzn-0 | 基于 Hadoop 的 API 的加密密钥管理服务器。 KeyProvider  | 
| hadoop-mapred | 2.7.1-amzn-0 | MapReduce 用于运行 MapReduce 应用程序的执行引擎库。 | 
| hadoop-yarn-nodemanager | 2.7.1-amzn-0 | 用于管理单个节点上的容器的 YARN 服务。 | 
| hadoop-yarn-resourcemanager | 2.7.1-amzn-0 | 用于分配和管理集群资源与分布式应用程序的 YARN 服务。 | 
| hive-client | 1.0.0-amzn-2 | Hive 命令行客户端。 | 
| hive-metastore-server | 1.0.0-amzn-2 | 用于访问 Hive 元存储 (一个用于存储 Hadoop 操作中的 SQL 的元数据的语义存储库) 的服务。 | 
| hive-server | 1.0.0-amzn-2 | 用于将 Hive 查询作为 Web 请求接受的服务。 | 
| hue-server | 3.7.1-amzn-5 | 用于使用 Hadoop 生态系统应用程序分析数据的 Web 应用程序 | 
| mahout-client | 0.11.0 | 用于机器学习的库。 | 
| mysql-server | 5.5 | MySQL 数据库服务器。 | 
| oozie-client | 4.2.0 | Oozie 命令行客户端。 | 
| oozie-server | 4.2.0 | 用于接受 Oozie 工作流请求的服务。 | 
| presto-coordinator | 0.130 | 用于在 presto-worker 之中接受查询并管理查询的服务。 | 
| presto-worker | 0.130 | 用于执行查询的各个部分的服务。 | 
| pig-client | 0.14.0-amzn-0 | Pig 命令行客户端。 | 
| spark-client | 1.6.0 | Spark 命令行客户端。 | 
| spark-history-server | 1.6.0 | 用于查看完整的 Spark 应用程序的生命周期的已记录事件的 Web UI。 | 
| spark-on-yarn | 1.6.0 | 适用于 YARN 的内存中执行引擎。 | 
| spark-yarn-slave | 1.6.0 | YARN 从属项所需的 Apache Spark 库。 | 
| webserver | 2.4 | Apache HTTP 服务器。 | 
| zeppelin-server | 0.5.5-incubating-amzn-1 | 支持交互式数据分析的基于 Web 的 Notebook。 | 

## 4.3.0 配置分类
<a name="emr-430-class"></a>

配置分类允许您自定义应用程序。这些通常与应用程序的配置 XML 文件（例如 `hive-site.xml`）相对应。有关更多信息，请参阅[配置应用程序](emr-configure-apps.md)。


**emr-4.3.0 分类**  

| 分类 | 说明 | 
| --- | --- | 
| capacity-scheduler | 更改 Hadoop 的 capacity-scheduler.xml 文件中的值。 | 
| core-site | 更改 Hadoop 的 core-site.xml 文件中的值。 | 
| emrfs-site | 更改 EMRFS 设置。 | 
| hadoop-env | 更改适用于所有 Hadoop 组件的 Hadoop 环境中的值。 | 
| hadoop-log4j | 更改 Hadoop 的 log4j.properties 文件中的值。 | 
| hdfs-encryption-zones | 配置 HDFS 加密区域。 | 
| hdfs-site | 更改 HDFS 的 hdfs-site.xml 中的值。 | 
| hive-env | 更改 Hive 环境中的值。 | 
| hive-exec-log4j | 更改 Hive 的 hive-exec-log 4j.properties 文件中的值。 | 
| hive-log4j | 更改 Hive 的 hive-log4j.properties 文件中的值。 | 
| hive-site | 更改 Hive 的 hive-site.xml 文件中的值 | 
| hue-ini | 更改 Hue 的 ini 文件中的值 | 
| httpfs-env | 更改 HTTPFS 环境中的值。 | 
| httpfs-site | 更改 Hadoop 的 httpfs-site.xml 文件中的值。 | 
| hadoop-kms-acls | 更改 Hadoop 的 kms-acls.xml 文件中的值。 | 
| hadoop-kms-env | 更改 Hadoop KMS 环境中的值。 | 
| hadoop-kms-log4j | 更改 Hadoop 的 kms-log4j.properties 文件中的值。 | 
| hadoop-kms-site | 更改 Hadoop 的 kms-site.xml 文件中的值。 | 
| mapred-env | 更改 MapReduce 应用程序环境中的值。 | 
| mapred-site | 更改 MapReduce 应用程序的 mapred-site.xml 文件中的值。 | 
| oozie-env | 更改 Oozie 的环境中的值。 | 
| oozie-log4j | 更改 Oozie 的 oozie-log4j.properties 文件中的值。 | 
| oozie-site | 更改 Oozie 的 oozie-site.xml 文件中的值。 | 
| pig-properties | 更改 Pig 的 pig.properties 文件中的值。 | 
| pig-log4j | 更改 Pig 的 log4j.properties 文件中的值。 | 
| presto-log | 更改 Presto 的 log.properties 文件中的值。 | 
| presto-config | 更改 Presto 的 config.properties 文件中的值。 | 
| presto-connector-hive | 更改 Presto 的 hive.properties 文件中的值。 | 
| spark | 适用于 Apache Spark 的 Amazon EMR 辅助设置。 | 
| spark-defaults | 更改 Spark 的 spark-defaults.conf 文件中的值。 | 
| spark-env | 更改 Spark 环境中的值。 | 
| spark-log4j | 更改 Spark 的 log4j.properties 文件中的值。 | 
| spark-metrics | 更改 Spark 的 metrics.properties 文件中的值。 | 
| yarn-env | 更改 YARN 环境中的值。 | 
| yarn-site | 更改 YARN 的 yarn-site.xml 文件中的值。 | 
| zeppelin-env | 更改 Zeppelin 环境中的值。 | 

# Amazon EMR 发行版 4.2.0
<a name="emr-420-release"></a>

## 4.2.0 应用程序版本
<a name="emr-420-app-versions"></a>

此版本包括以下应用程序：[http://ganglia.info](http://ganglia.info)、[http://hadoop.apache.org/docs/current/](http://hadoop.apache.org/docs/current/)、[http://hive.apache.org/](http://hive.apache.org/)、[http://gethue.com/](http://gethue.com/)、[http://mahout.apache.org/](http://mahout.apache.org/)、[http://oozie.apache.org/](http://oozie.apache.org/)、[http://pig.apache.org/](http://pig.apache.org/)、[https://prestodb.io/](https://prestodb.io/)、[https://spark.apache.org/docs/latest/](https://spark.apache.org/docs/latest/) 和 [https://zeppelin.incubator.apache.org/](https://zeppelin.incubator.apache.org/)。

下表列出了此版本的 Amazon EMR 中提供的应用程序版本以及前三个 Amazon EMR 发行版中的应用程序版本（若适用）。

有关每个发行版的 Amazon EMR 的应用程序版本的全面历史记录，请参见以下主题：
+ [Amazon EMR 7.x 发行版中的应用程序版本](emr-release-app-versions-7.x.md)
+ [Amazon EMR 6.x 发行版中的应用程序版本](emr-release-app-versions-6.x.md)
+ [Amazon EMR 5.x 发行版中的应用程序版本](emr-release-app-versions-5.x.md)
+ [Amazon EMR 4.x 发行版中的应用程序版本](emr-release-app-versions-4.x.md)


**应用程序版本信息**  

|  | emr-4.3.0 | emr-4.2.0 | emr-4.1.0 | emr-4.0.0 | 
| --- | --- | --- | --- | --- | 
| AWS 适用于 Java 的 SDK | 1.10.27 | 1.10.27 | 未跟踪 | 未跟踪 | 
| Python | 未跟踪 | 未跟踪 | 未跟踪 | 未跟踪 | 
| Scala | 未跟踪 | 未跟踪 | 未跟踪 | 未跟踪 | 
| AmazonCloudWatchAgent |  -  |  -  |  -  |  -  | 
| Delta |  -  |  -  |  -  |  -  | 
| Flink |  -  |  -  |  -  |  -  | 
| Ganglia | 3.7.2 | 3.6.0 |  -  |  -  | 
| HBase |  -  |  -  |  -  |  -  | 
| HCatalog |  -  |  -  |  -  |  -  | 
| Hadoop | 2.7.1-amzn-0 | 2.6.0-amzn-2 | 2.6.0-amzn-1 | 2.6.0-amzn-0 | 
| Hive | 1.0.0-amzn-2 | 1.0.0-amzn-1 | 1.0.0-amzn-1 | 1.0.0-amzn-0 | 
| Hudi |  -  |  -  |  -  |  -  | 
| Hue | 3.7.1-amzn-5 | 3.7.1-amzn-5 | 3.7.1-amzn-4 |  -  | 
| Iceberg |  -  |  -  |  -  |  -  | 
| JupyterEnterpriseGateway |  -  |  -  |  -  |  -  | 
| JupyterHub |  -  |  -  |  -  |  -  | 
| Livy |  -  |  -  |  -  |  -  | 
| MXNet |  -  |  -  |  -  |  -  | 
| Mahout | 0.11.0 | 0.11.0 | 0.11.0 | 0.10.0 | 
| Oozie |  -  |  -  |  -  |  -  | 
| Oozie-Sandbox | 4.2.0 | 4.2.0 | 4.0.1 |  -  | 
| Phoenix |  -  |  -  |  -  |  -  | 
| Pig | 0.14.0-amzn-0 | 0.14.0-amzn-0 | 0.14.0-amzn-0 | 0.14.0-amzn-0 | 
| Presto |  -  |  -  |  -  |  -  | 
| Presto-Sandbox | 0.130 | 0.125 | 0.119 |  -  | 
| Spark | 1.6.0 | 1.5.2 | 1.5.0 | 1.4.1 | 
| Sqoop |  -  |  -  |  -  |  -  | 
| Sqoop-Sandbox |  -  |  -  |  -  |  -  | 
| TensorFlow |  -  |  -  |  -  |  -  | 
| Tez |  -  |  -  |  -  |  -  | 
| Trino (PrestoSQL) |  -  |  -  |  -  |  -  | 
| Zeppelin |  -  |  -  |  -  |  -  | 
| Zeppelin-Sandbox | 0.5.5-incubating-amzn-1 | 0.5.5-incubating-amzn-0 | 0.6.0-incubating-SNAPSHOT |  -  | 
| ZooKeeper |  -  |  -  |  -  |  -  | 
| ZooKeeper-Sandbox |  -  |  -  |  -  |  -  | 

## 4.2.0 发布说明
<a name="emr-420-relnotes"></a>

以下发布说明包括有关 Amazon EMR 发行版 4.2.0 的信息。

发布日期：2015 年 11 月 18 日

**功能**
+ 已添加 Ganglia 支持
+ 已升级到 Spark 1.5.2
+ 已升级到 Presto 0.125
+ 已将 Oozie 升级到 4.2.0
+ 已将 Zeppelin 升级到 0.5.5
+ 已将升级 适用于 Java 的 AWS SDK 到 1.10.27

**早期版本中已解决的已知问题**
+ 修复了与 EMRFS CLI 有关的问题，此问题发导致不使用默认元数据表名称。
+ 修复了在 Amazon S3 中使用 ORC 支持的表时遇到的问题。
+ 修复了遇到的 Python 版本在 Spark 配置中不匹配的问题。
+ 修复了 YARN 节点状态因 VPC 中集群的 DNS 问题导致无法报告的问题。
+ 修复了 YARN 停用节点时遇到的问题，该问题会导致应用程序挂起或无法计划新应用程序。
+ 修复了集群终止且状态为 TIMED\$1OUT\$1STARTING 时遇到的问题。
+ 修复了在其它内部版本中包含 EMRFS Scala 依赖项时遇到的问题。Scala 依赖项已被删除。

## 4.2.0 组件版本
<a name="emr-420-components"></a>

下面列出了 Amazon EMR 随此发行版一起安装的组件。一些组件作为大数据应用程序包的一部分安装。其它组件是 Amazon EMR 独有的，并且已为系统流程和功能安装这些组件。它们通常以 `emr` 或 `aws` 开头。最新的 Amazon EMR 发行版中的大数据应用程序包通常是在社区中找到的最新版本。我们会尽快在 Amazon EMR 中提供社区发行版。

Amazon EMR 中的某些组件与社区版本不同。这些组件具有以下形式的 `CommunityVersion-amzn-EmrVersion` 的发行版标注。`EmrVersion` 从 0 开始。例如，假设已对名为 `myapp-component` 的版本 2.2 的开源社区组件进行三次修改，以包含在不同的 Amazon EMR 发行版中，则其发行版将为 `2.2-amzn-2`。


| 组件 | 版本 | 说明 | 
| --- | --- | --- | 
| emr-ddb | 3.0.0 | 适用于 Hadoop 生态系统应用程序的 Amazon DynamoDB 连接器。 | 
| emr-goodies | 2.0.0 | 适用于 Hadoop 生态系统的方便易用的库。 | 
| emr-kinesis | 3.1.0 | 适用于 Hadoop 生态系统应用程序的 Amazon Kinesis 连接器。 | 
| emr-s3-dist-cp | 2.0.0 | 针对 Amazon S3 优化的分布式复制应用程序。 | 
| emrfs | 2.2.0 | 适用于 Hadoop 生态系统应用程序的 Amazon S3 连接器。 | 
| ganglia-monitor | 3.6.0 | 适用于 Hadoop 生态系统应用程序的嵌入式 Ganglia 代理以及 Ganglia 监控代理。 | 
| ganglia-metadata-collector | 3.6.0 | 用于从 Ganglia 监控代理中聚合指标的 Ganglia 元数据收集器。 | 
| ganglia-web | 3.5.10 | 用于查看由 Ganglia 元数据收集器收集的指标的 Web 应用程序。 | 
| hadoop-client | 2.6.0-amzn-2 | Hadoop 命令行客户端，如“hdfs”、“hadoop”或“yarn”。 | 
| hadoop-hdfs-datanode | 2.6.0-amzn-2 | 用于存储数据块的 HDFS 节点级服务。 | 
| hadoop-hdfs-library | 2.6.0-amzn-2 | HDFS 命令行客户端和库 | 
| hadoop-hdfs-namenode | 2.6.0-amzn-2 | 用于跟踪文件名和数据块位置的 HDFS 服务。 | 
| hadoop-httpfs-server | 2.6.0-amzn-2 | 用于 HDFS 操作的 HTTP 终端节点。 | 
| hadoop-kms-server | 2.6.0-amzn-2 | 基于 Hadoop 的 API 的加密密钥管理服务器。 KeyProvider  | 
| hadoop-mapred | 2.6.0-amzn-2 | MapReduce 用于运行 MapReduce 应用程序的执行引擎库。 | 
| hadoop-yarn-nodemanager | 2.6.0-amzn-2 | 用于管理单个节点上的容器的 YARN 服务。 | 
| hadoop-yarn-resourcemanager | 2.6.0-amzn-2 | 用于分配和管理集群资源与分布式应用程序的 YARN 服务。 | 
| hive-client | 1.0.0-amzn-1 | Hive 命令行客户端。 | 
| hive-metastore-server | 1.0.0-amzn-1 | 用于访问 Hive 元存储 (一个用于存储 Hadoop 操作中的 SQL 的元数据的语义存储库) 的服务。 | 
| hive-server | 1.0.0-amzn-1 | 用于将 Hive 查询作为 Web 请求接受的服务。 | 
| hue-server | 3.7.1-amzn-5 | 用于使用 Hadoop 生态系统应用程序分析数据的 Web 应用程序 | 
| mahout-client | 0.11.0 | 用于机器学习的库。 | 
| mysql-server | 5.5 | MySQL 数据库服务器。 | 
| oozie-client | 4.2.0 | Oozie 命令行客户端。 | 
| oozie-server | 4.2.0 | 用于接受 Oozie 工作流请求的服务。 | 
| presto-coordinator | 0.125 | 用于在 presto-worker 之中接受查询并管理查询的服务。 | 
| presto-worker | 0.125 | 用于执行查询的各个部分的服务。 | 
| pig-client | 0.14.0-amzn-0 | Pig 命令行客户端。 | 
| spark-client | 1.5.2 | Spark 命令行客户端。 | 
| spark-history-server | 1.5.2 | 用于查看完整的 Spark 应用程序的生命周期的已记录事件的 Web UI。 | 
| spark-on-yarn | 1.5.2 | 适用于 YARN 的内存中执行引擎。 | 
| spark-yarn-slave | 1.5.2 | YARN 从属项所需的 Apache Spark 库。 | 
| webserver | 2.4 | Apache HTTP 服务器。 | 
| zeppelin-server | 0.5.5-incubating-amzn-0 | 支持交互式数据分析的基于 Web 的 Notebook。 | 

## 4.2.0 配置分类
<a name="emr-420-class"></a>

配置分类允许您自定义应用程序。这些通常与应用程序的配置 XML 文件（例如 `hive-site.xml`）相对应。有关更多信息，请参阅[配置应用程序](emr-configure-apps.md)。


**emr-4.2.0 分类**  

| 分类 | 说明 | 
| --- | --- | 
| capacity-scheduler | 更改 Hadoop 的 capacity-scheduler.xml 文件中的值。 | 
| core-site | 更改 Hadoop 的 core-site.xml 文件中的值。 | 
| emrfs-site | 更改 EMRFS 设置。 | 
| hadoop-env | 更改适用于所有 Hadoop 组件的 Hadoop 环境中的值。 | 
| hadoop-log4j | 更改 Hadoop 的 log4j.properties 文件中的值。 | 
| hdfs-encryption-zones | 配置 HDFS 加密区域。 | 
| hdfs-site | 更改 HDFS 的 hdfs-site.xml 中的值。 | 
| hive-env | 更改 Hive 环境中的值。 | 
| hive-exec-log4j | 更改 Hive 的 hive-exec-log 4j.properties 文件中的值。 | 
| hive-log4j | 更改 Hive 的 hive-log4j.properties 文件中的值。 | 
| hive-site | 更改 Hive 的 hive-site.xml 文件中的值 | 
| hue-ini | 更改 Hue 的 ini 文件中的值 | 
| httpfs-env | 更改 HTTPFS 环境中的值。 | 
| httpfs-site | 更改 Hadoop 的 httpfs-site.xml 文件中的值。 | 
| hadoop-kms-acls | 更改 Hadoop 的 kms-acls.xml 文件中的值。 | 
| hadoop-kms-env | 更改 Hadoop KMS 环境中的值。 | 
| hadoop-kms-log4j | 更改 Hadoop 的 kms-log4j.properties 文件中的值。 | 
| hadoop-kms-site | 更改 Hadoop 的 kms-site.xml 文件中的值。 | 
| mapred-env | 更改 MapReduce 应用程序环境中的值。 | 
| mapred-site | 更改 MapReduce 应用程序的 mapred-site.xml 文件中的值。 | 
| oozie-env | 更改 Oozie 的环境中的值。 | 
| oozie-log4j | 更改 Oozie 的 oozie-log4j.properties 文件中的值。 | 
| oozie-site | 更改 Oozie 的 oozie-site.xml 文件中的值。 | 
| pig-properties | 更改 Pig 的 pig.properties 文件中的值。 | 
| pig-log4j | 更改 Pig 的 log4j.properties 文件中的值。 | 
| presto-log | 更改 Presto 的 log.properties 文件中的值。 | 
| presto-config | 更改 Presto 的 config.properties 文件中的值。 | 
| presto-connector-hive | 更改 Presto 的 hive.properties 文件中的值。 | 
| spark | 适用于 Apache Spark 的 Amazon EMR 辅助设置。 | 
| spark-defaults | 更改 Spark 的 spark-defaults.conf 文件中的值。 | 
| spark-env | 更改 Spark 环境中的值。 | 
| spark-log4j | 更改 Spark 的 log4j.properties 文件中的值。 | 
| spark-metrics | 更改 Spark 的 metrics.properties 文件中的值。 | 
| yarn-env | 更改 YARN 环境中的值。 | 
| yarn-site | 更改 YARN 的 yarn-site.xml 文件中的值。 | 
| zeppelin-env | 更改 Zeppelin 环境中的值。 | 

# Amazon EMR 发行版 4.1.0
<a name="emr-410-release"></a>

## 4.1.0 应用程序版本
<a name="emr-410-app-versions"></a>

此版本包括以下应用程序：[http://hadoop.apache.org/docs/current/](http://hadoop.apache.org/docs/current/)、[http://hive.apache.org/](http://hive.apache.org/)、[http://gethue.com/](http://gethue.com/)、[http://mahout.apache.org/](http://mahout.apache.org/)、[http://oozie.apache.org/](http://oozie.apache.org/)、[http://pig.apache.org/](http://pig.apache.org/)、[https://prestodb.io/](https://prestodb.io/)、[https://spark.apache.org/docs/latest/](https://spark.apache.org/docs/latest/) 和 [https://zeppelin.incubator.apache.org/](https://zeppelin.incubator.apache.org/)。

下表列出了此版本的 Amazon EMR 中提供的应用程序版本以及前三个 Amazon EMR 发行版中的应用程序版本（若适用）。

有关每个发行版的 Amazon EMR 的应用程序版本的全面历史记录，请参见以下主题：
+ [Amazon EMR 7.x 发行版中的应用程序版本](emr-release-app-versions-7.x.md)
+ [Amazon EMR 6.x 发行版中的应用程序版本](emr-release-app-versions-6.x.md)
+ [Amazon EMR 5.x 发行版中的应用程序版本](emr-release-app-versions-5.x.md)
+ [Amazon EMR 4.x 发行版中的应用程序版本](emr-release-app-versions-4.x.md)


**应用程序版本信息**  

|  | emr-4.3.0 | emr-4.2.0 | emr-4.1.0 | emr-4.0.0 | 
| --- | --- | --- | --- | --- | 
| AWS 适用于 Java 的 SDK | 1.10.27 | 1.10.27 | 未跟踪 | 未跟踪 | 
| Python | 未跟踪 | 未跟踪 | 未跟踪 | 未跟踪 | 
| Scala | 未跟踪 | 未跟踪 | 未跟踪 | 未跟踪 | 
| AmazonCloudWatchAgent |  -  |  -  |  -  |  -  | 
| Delta |  -  |  -  |  -  |  -  | 
| Flink |  -  |  -  |  -  |  -  | 
| Ganglia | 3.7.2 | 3.6.0 |  -  |  -  | 
| HBase |  -  |  -  |  -  |  -  | 
| HCatalog |  -  |  -  |  -  |  -  | 
| Hadoop | 2.7.1-amzn-0 | 2.6.0-amzn-2 | 2.6.0-amzn-1 | 2.6.0-amzn-0 | 
| Hive | 1.0.0-amzn-2 | 1.0.0-amzn-1 | 1.0.0-amzn-1 | 1.0.0-amzn-0 | 
| Hudi |  -  |  -  |  -  |  -  | 
| Hue | 3.7.1-amzn-5 | 3.7.1-amzn-5 | 3.7.1-amzn-4 |  -  | 
| Iceberg |  -  |  -  |  -  |  -  | 
| JupyterEnterpriseGateway |  -  |  -  |  -  |  -  | 
| JupyterHub |  -  |  -  |  -  |  -  | 
| Livy |  -  |  -  |  -  |  -  | 
| MXNet |  -  |  -  |  -  |  -  | 
| Mahout | 0.11.0 | 0.11.0 | 0.11.0 | 0.10.0 | 
| Oozie |  -  |  -  |  -  |  -  | 
| Oozie-Sandbox | 4.2.0 | 4.2.0 | 4.0.1 |  -  | 
| Phoenix |  -  |  -  |  -  |  -  | 
| Pig | 0.14.0-amzn-0 | 0.14.0-amzn-0 | 0.14.0-amzn-0 | 0.14.0-amzn-0 | 
| Presto |  -  |  -  |  -  |  -  | 
| Presto-Sandbox | 0.130 | 0.125 | 0.119 |  -  | 
| Spark | 1.6.0 | 1.5.2 | 1.5.0 | 1.4.1 | 
| Sqoop |  -  |  -  |  -  |  -  | 
| Sqoop-Sandbox |  -  |  -  |  -  |  -  | 
| TensorFlow |  -  |  -  |  -  |  -  | 
| Tez |  -  |  -  |  -  |  -  | 
| Trino (PrestoSQL) |  -  |  -  |  -  |  -  | 
| Zeppelin |  -  |  -  |  -  |  -  | 
| Zeppelin-Sandbox | 0.5.5-incubating-amzn-1 | 0.5.5-incubating-amzn-0 | 0.6.0-incubating-SNAPSHOT |  -  | 
| ZooKeeper |  -  |  -  |  -  |  -  | 
| ZooKeeper-Sandbox |  -  |  -  |  -  |  -  | 

## 4.1.0 发布说明
<a name="emr-410-relnotes"></a>

## 4.1.0 组件版本
<a name="emr-410-components"></a>

下面列出了 Amazon EMR 随此发行版一起安装的组件。一些组件作为大数据应用程序包的一部分安装。其它组件是 Amazon EMR 独有的，并且已为系统流程和功能安装这些组件。它们通常以 `emr` 或 `aws` 开头。最新的 Amazon EMR 发行版中的大数据应用程序包通常是在社区中找到的最新版本。我们会尽快在 Amazon EMR 中提供社区发行版。

Amazon EMR 中的某些组件与社区版本不同。这些组件具有以下形式的 `CommunityVersion-amzn-EmrVersion` 的发行版标注。`EmrVersion` 从 0 开始。例如，假设已对名为 `myapp-component` 的版本 2.2 的开源社区组件进行三次修改，以包含在不同的 Amazon EMR 发行版中，则其发行版将为 `2.2-amzn-2`。


| 组件 | 版本 | 说明 | 
| --- | --- | --- | 
| emr-ddb | 3.0.0 | 适用于 Hadoop 生态系统应用程序的 Amazon DynamoDB 连接器。 | 
| emr-goodies | 2.0.0 | 适用于 Hadoop 生态系统的方便易用的库。 | 
| emr-kinesis | 3.1.0 | 适用于 Hadoop 生态系统应用程序的 Amazon Kinesis 连接器。 | 
| emr-s3-dist-cp | 2.0.0 | 针对 Amazon S3 优化的分布式复制应用程序。 | 
| emrfs | 2.1.0 | 适用于 Hadoop 生态系统应用程序的 Amazon S3 连接器。 | 
| hadoop-client | 2.6.0-amzn-1 | Hadoop 命令行客户端，如“hdfs”、“hadoop”或“yarn”。 | 
| hadoop-hdfs-datanode | 2.6.0-amzn-1 | 用于存储数据块的 HDFS 节点级服务。 | 
| hadoop-hdfs-library | 2.6.0-amzn-1 | HDFS 命令行客户端和库 | 
| hadoop-hdfs-namenode | 2.6.0-amzn-1 | 用于跟踪文件名和数据块位置的 HDFS 服务。 | 
| hadoop-httpfs-server | 2.6.0-amzn-1 | 用于 HDFS 操作的 HTTP 终端节点。 | 
| hadoop-kms-server | 2.6.0-amzn-1 | 基于 Hadoop 的 API 的加密密钥管理服务器。 KeyProvider  | 
| hadoop-mapred | 2.6.0-amzn-1 | MapReduce 用于运行 MapReduce 应用程序的执行引擎库。 | 
| hadoop-yarn-nodemanager | 2.6.0-amzn-1 | 用于管理单个节点上的容器的 YARN 服务。 | 
| hadoop-yarn-resourcemanager | 2.6.0-amzn-1 | 用于分配和管理集群资源与分布式应用程序的 YARN 服务。 | 
| hive-client | 1.0.0-amzn-1 | Hive 命令行客户端。 | 
| hive-metastore-server | 1.0.0-amzn-1 | 用于访问 Hive 元存储 (一个用于存储 Hadoop 操作中的 SQL 的元数据的语义存储库) 的服务。 | 
| hive-server | 1.0.0-amzn-1 | 用于将 Hive 查询作为 Web 请求接受的服务。 | 
| hue-server | 3.7.1-amzn-4 | 用于使用 Hadoop 生态系统应用程序分析数据的 Web 应用程序 | 
| mahout-client | 0.11.0 | 用于机器学习的库。 | 
| mysql-server | 5.5 | MySQL 数据库服务器。 | 
| oozie-client | 4.0.1 | Oozie 命令行客户端。 | 
| oozie-server | 4.0.1 | 用于接受 Oozie 工作流请求的服务。 | 
| presto-coordinator | 0.119 | 用于在 presto-worker 之中接受查询并管理查询的服务。 | 
| presto-worker | 0.119 | 用于执行查询的各个部分的服务。 | 
| pig-client | 0.14.0-amzn-0 | Pig 命令行客户端。 | 
| spark-client | 1.5.0 | Spark 命令行客户端。 | 
| spark-history-server | 1.5.0 | 用于查看完整的 Spark 应用程序的生命周期的已记录事件的 Web UI。 | 
| spark-on-yarn | 1.5.0 | 适用于 YARN 的内存中执行引擎。 | 
| spark-yarn-slave | 1.5.0 | YARN 从属项所需的 Apache Spark 库。 | 
| zeppelin-server | 0.6.0-incubating-SNAPSHOT | 支持交互式数据分析的基于 Web 的 Notebook。 | 

## 4.1.0 配置分类
<a name="emr-410-class"></a>

配置分类允许您自定义应用程序。这些通常与应用程序的配置 XML 文件（例如 `hive-site.xml`）相对应。有关更多信息，请参阅[配置应用程序](emr-configure-apps.md)。


**emr-4.1.0 分类**  

| 分类 | 说明 | 
| --- | --- | 
| capacity-scheduler | 更改 Hadoop 的 capacity-scheduler.xml 文件中的值。 | 
| core-site | 更改 Hadoop 的 core-site.xml 文件中的值。 | 
| emrfs-site | 更改 EMRFS 设置。 | 
| hadoop-env | 更改适用于所有 Hadoop 组件的 Hadoop 环境中的值。 | 
| hadoop-log4j | 更改 Hadoop 的 log4j.properties 文件中的值。 | 
| hdfs-encryption-zones | 配置 HDFS 加密区域。 | 
| hdfs-site | 更改 HDFS 的 hdfs-site.xml 中的值。 | 
| hive-env | 更改 Hive 环境中的值。 | 
| hive-exec-log4j | 更改 Hive 的 hive-exec-log 4j.properties 文件中的值。 | 
| hive-log4j | 更改 Hive 的 hive-log4j.properties 文件中的值。 | 
| hive-site | 更改 Hive 的 hive-site.xml 文件中的值 | 
| hue-ini | 更改 Hue 的 ini 文件中的值 | 
| httpfs-env | 更改 HTTPFS 环境中的值。 | 
| httpfs-site | 更改 Hadoop 的 httpfs-site.xml 文件中的值。 | 
| hadoop-kms-acls | 更改 Hadoop 的 kms-acls.xml 文件中的值。 | 
| hadoop-kms-env | 更改 Hadoop KMS 环境中的值。 | 
| hadoop-kms-log4j | 更改 Hadoop 的 kms-log4j.properties 文件中的值。 | 
| hadoop-kms-site | 更改 Hadoop 的 kms-site.xml 文件中的值。 | 
| mapred-env | 更改 MapReduce 应用程序环境中的值。 | 
| mapred-site | 更改 MapReduce 应用程序的 mapred-site.xml 文件中的值。 | 
| oozie-env | 更改 Oozie 的环境中的值。 | 
| oozie-log4j | 更改 Oozie 的 oozie-log4j.properties 文件中的值。 | 
| oozie-site | 更改 Oozie 的 oozie-site.xml 文件中的值。 | 
| pig-properties | 更改 Pig 的 pig.properties 文件中的值。 | 
| pig-log4j | 更改 Pig 的 log4j.properties 文件中的值。 | 
| presto-log | 更改 Presto 的 log.properties 文件中的值。 | 
| presto-config | 更改 Presto 的 config.properties 文件中的值。 | 
| spark | 适用于 Apache Spark 的 Amazon EMR 辅助设置。 | 
| spark-defaults | 更改 Spark 的 spark-defaults.conf 文件中的值。 | 
| spark-env | 更改 Spark 环境中的值。 | 
| spark-log4j | 更改 Spark 的 log4j.properties 文件中的值。 | 
| yarn-env | 更改 YARN 环境中的值。 | 
| yarn-site | 更改 YARN 的 yarn-site.xml 文件中的值。 | 
| zeppelin-env | 更改 Zeppelin 环境中的值。 | 

# Amazon EMR 发行版 4.0.0
<a name="emr-400-release"></a>

## 4.0.0 应用程序版本
<a name="emr-400-app-versions"></a>

此版本包括以下应用程序：[http://hadoop.apache.org/docs/current/](http://hadoop.apache.org/docs/current/)、[http://hive.apache.org/](http://hive.apache.org/)、[http://mahout.apache.org/](http://mahout.apache.org/)、[http://pig.apache.org/](http://pig.apache.org/) 和 [https://spark.apache.org/docs/latest/](https://spark.apache.org/docs/latest/)。

下表列出了此版本的 Amazon EMR 中提供的应用程序版本以及前三个 Amazon EMR 发行版中的应用程序版本（若适用）。

有关每个发行版的 Amazon EMR 的应用程序版本的全面历史记录，请参见以下主题：
+ [Amazon EMR 7.x 发行版中的应用程序版本](emr-release-app-versions-7.x.md)
+ [Amazon EMR 6.x 发行版中的应用程序版本](emr-release-app-versions-6.x.md)
+ [Amazon EMR 5.x 发行版中的应用程序版本](emr-release-app-versions-5.x.md)
+ [Amazon EMR 4.x 发行版中的应用程序版本](emr-release-app-versions-4.x.md)


**应用程序版本信息**  

|  | emr-4.3.0 | emr-4.2.0 | emr-4.1.0 | emr-4.0.0 | 
| --- | --- | --- | --- | --- | 
| AWS 适用于 Java 的 SDK | 1.10.27 | 1.10.27 | 未跟踪 | 未跟踪 | 
| Python | 未跟踪 | 未跟踪 | 未跟踪 | 未跟踪 | 
| Scala | 未跟踪 | 未跟踪 | 未跟踪 | 未跟踪 | 
| AmazonCloudWatchAgent |  -  |  -  |  -  |  -  | 
| Delta |  -  |  -  |  -  |  -  | 
| Flink |  -  |  -  |  -  |  -  | 
| Ganglia | 3.7.2 | 3.6.0 |  -  |  -  | 
| HBase |  -  |  -  |  -  |  -  | 
| HCatalog |  -  |  -  |  -  |  -  | 
| Hadoop | 2.7.1-amzn-0 | 2.6.0-amzn-2 | 2.6.0-amzn-1 | 2.6.0-amzn-0 | 
| Hive | 1.0.0-amzn-2 | 1.0.0-amzn-1 | 1.0.0-amzn-1 | 1.0.0-amzn-0 | 
| Hudi |  -  |  -  |  -  |  -  | 
| Hue | 3.7.1-amzn-5 | 3.7.1-amzn-5 | 3.7.1-amzn-4 |  -  | 
| Iceberg |  -  |  -  |  -  |  -  | 
| JupyterEnterpriseGateway |  -  |  -  |  -  |  -  | 
| JupyterHub |  -  |  -  |  -  |  -  | 
| Livy |  -  |  -  |  -  |  -  | 
| MXNet |  -  |  -  |  -  |  -  | 
| Mahout | 0.11.0 | 0.11.0 | 0.11.0 | 0.10.0 | 
| Oozie |  -  |  -  |  -  |  -  | 
| Oozie-Sandbox | 4.2.0 | 4.2.0 | 4.0.1 |  -  | 
| Phoenix |  -  |  -  |  -  |  -  | 
| Pig | 0.14.0-amzn-0 | 0.14.0-amzn-0 | 0.14.0-amzn-0 | 0.14.0-amzn-0 | 
| Presto |  -  |  -  |  -  |  -  | 
| Presto-Sandbox | 0.130 | 0.125 | 0.119 |  -  | 
| Spark | 1.6.0 | 1.5.2 | 1.5.0 | 1.4.1 | 
| Sqoop |  -  |  -  |  -  |  -  | 
| Sqoop-Sandbox |  -  |  -  |  -  |  -  | 
| TensorFlow |  -  |  -  |  -  |  -  | 
| Tez |  -  |  -  |  -  |  -  | 
| Trino (PrestoSQL) |  -  |  -  |  -  |  -  | 
| Zeppelin |  -  |  -  |  -  |  -  | 
| Zeppelin-Sandbox | 0.5.5-incubating-amzn-1 | 0.5.5-incubating-amzn-0 | 0.6.0-incubating-SNAPSHOT |  -  | 
| ZooKeeper |  -  |  -  |  -  |  -  | 
| ZooKeeper-Sandbox |  -  |  -  |  -  |  -  | 

## 4.0.0 发布说明
<a name="emr-400-relnotes"></a>

## 4.0.0 组件版本
<a name="emr-400-components"></a>

下面列出了 Amazon EMR 随此发行版一起安装的组件。一些组件作为大数据应用程序包的一部分安装。其它组件是 Amazon EMR 独有的，并且已为系统流程和功能安装这些组件。它们通常以 `emr` 或 `aws` 开头。最新的 Amazon EMR 发行版中的大数据应用程序包通常是在社区中找到的最新版本。我们会尽快在 Amazon EMR 中提供社区发行版。

Amazon EMR 中的某些组件与社区版本不同。这些组件具有以下形式的 `CommunityVersion-amzn-EmrVersion` 的发行版标注。`EmrVersion` 从 0 开始。例如，假设已对名为 `myapp-component` 的版本 2.2 的开源社区组件进行三次修改，以包含在不同的 Amazon EMR 发行版中，则其发行版将为 `2.2-amzn-2`。


| 组件 | 版本 | 说明 | 
| --- | --- | --- | 
| emr-ddb | 3.0.0 | 适用于 Hadoop 生态系统应用程序的 Amazon DynamoDB 连接器。 | 
| emr-goodies | 2.0.0 | 适用于 Hadoop 生态系统的方便易用的库。 | 
| emr-kinesis | 3.0.0 | 适用于 Hadoop 生态系统应用程序的 Amazon Kinesis 连接器。 | 
| emr-s3-dist-cp | 2.0.0 | 针对 Amazon S3 优化的分布式复制应用程序。 | 
| emrfs | 2.0.0 | 适用于 Hadoop 生态系统应用程序的 Amazon S3 连接器。 | 
| hadoop-client | 2.6.0-amzn-0 | Hadoop 命令行客户端，如“hdfs”、“hadoop”或“yarn”。 | 
| hadoop-hdfs-datanode | 2.6.0-amzn-0 | 用于存储数据块的 HDFS 节点级服务。 | 
| hadoop-hdfs-namenode | 2.6.0-amzn-0 | 用于跟踪文件名和数据块位置的 HDFS 服务。 | 
| hadoop-httpfs-server | 2.6.0-amzn-0 | 用于 HDFS 操作的 HTTP 终端节点。 | 
| hadoop-mapred | 2.6.0-amzn-0 | MapReduce 用于运行 MapReduce 应用程序的执行引擎库。 | 
| hadoop-yarn-nodemanager | 2.6.0-amzn-0 | 用于管理单个节点上的容器的 YARN 服务。 | 
| hadoop-yarn-resourcemanager | 2.6.0-amzn-0 | 用于分配和管理集群资源与分布式应用程序的 YARN 服务。 | 
| hive-client | 1.0.0-amzn-0 | Hive 命令行客户端。 | 
| hive-metastore-server | 1.0.0-amzn-0 | 用于访问 Hive 元存储 (一个用于存储 Hadoop 操作中的 SQL 的元数据的语义存储库) 的服务。 | 
| hive-server | 1.0.0-amzn-0 | 用于将 Hive 查询作为 Web 请求接受的服务。 | 
| mahout-client | 0.10.0 | 用于机器学习的库。 | 
| mysql-server | 5.5 | MySQL 数据库服务器。 | 
| pig-client | 0.14.0-amzn-0 | Pig 命令行客户端。 | 
| spark-client | 1.4.1 | Spark 命令行客户端。 | 
| spark-history-server | 1.4.1 | 用于查看完整的 Spark 应用程序的生命周期的已记录事件的 Web UI。 | 
| spark-on-yarn | 1.4.1 | 适用于 YARN 的内存中执行引擎。 | 
| spark-yarn-slave | 1.4.1 | YARN 从属项所需的 Apache Spark 库。 | 

## 4.0.0 配置分类
<a name="emr-400-class"></a>

配置分类允许您自定义应用程序。这些通常与应用程序的配置 XML 文件（例如 `hive-site.xml`）相对应。有关更多信息，请参阅[配置应用程序](emr-configure-apps.md)。


**emr-4.0.0 分类**  

| 分类 | 说明 | 
| --- | --- | 
| capacity-scheduler | 更改 Hadoop 的 capacity-scheduler.xml 文件中的值。 | 
| core-site | 更改 Hadoop 的 core-site.xml 文件中的值。 | 
| emrfs-site | 更改 EMRFS 设置。 | 
| hadoop-env | 更改适用于所有 Hadoop 组件的 Hadoop 环境中的值。 | 
| hadoop-log4j | 更改 Hadoop 的 log4j.properties 文件中的值。 | 
| hdfs-site | 更改 HDFS 的 hdfs-site.xml 中的值。 | 
| hive-env | 更改 Hive 环境中的值。 | 
| hive-exec-log4j | 更改 Hive 的 hive-exec-log 4j.properties 文件中的值。 | 
| hive-log4j | 更改 Hive 的 hive-log4j.properties 文件中的值。 | 
| hive-site | 更改 Hive 的 hive-site.xml 文件中的值 | 
| httpfs-env | 更改 HTTPFS 环境中的值。 | 
| httpfs-site | 更改 Hadoop 的 httpfs-site.xml 文件中的值。 | 
| mapred-env | 更改 MapReduce 应用程序环境中的值。 | 
| mapred-site | 更改 MapReduce 应用程序的 mapred-site.xml 文件中的值。 | 
| pig-properties | 更改 Pig 的 pig.properties 文件中的值。 | 
| pig-log4j | 更改 Pig 的 log4j.properties 文件中的值。 | 
| spark | 适用于 Apache Spark 的 Amazon EMR 辅助设置。 | 
| spark-defaults | 更改 Spark 的 spark-defaults.conf 文件中的值。 | 
| spark-env | 更改 Spark 环境中的值。 | 
| spark-log4j | 更改 Spark 的 log4j.properties 文件中的值。 | 
| yarn-env | 更改 YARN 环境中的值。 | 
| yarn-site | 更改 YARN 的 yarn-site.xml 文件中的值。 | 