

本文為英文版的機器翻譯版本，如內容有任何歧義或不一致之處，概以英文版為準。

# Amazon EMR 4.3.0 版
<a name="emr-430-release"></a>

## 4.3.0 應用程式版本
<a name="emr-430-app-versions"></a>

此版本包含下列應用程式：[http://ganglia.info](http://ganglia.info)、[http://hadoop.apache.org/docs/current/](http://hadoop.apache.org/docs/current/)、[http://hive.apache.org/](http://hive.apache.org/)、[http://gethue.com/](http://gethue.com/)[http://mahout.apache.org/](http://mahout.apache.org/)、[http://oozie.apache.org/](http://oozie.apache.org/)、[http://pig.apache.org/](http://pig.apache.org/)、[https://prestodb.io/](https://prestodb.io/)、[https://spark.apache.org/docs/latest/](https://spark.apache.org/docs/latest/)、 和 [https://zeppelin.incubator.apache.org/](https://zeppelin.incubator.apache.org/)。

下表列出此 Amazon EMR 版本中提供的應用程式版本，以及前三個 Amazon EMR 版本 (如果適用) 中的應用程式版本。

如需完整了解各 Amazon EMR 版之應用程式版本的完整歷史記錄，請參閱以下主題：
+ [Amazon EMR 7.x 版中的應用程式版本](emr-release-app-versions-7.x.md)
+ [Amazon EMR 6.x 版之應用程式版本](emr-release-app-versions-6.x.md)
+ [Amazon EMR 5.x 版之應用程式版本](emr-release-app-versions-5.x.md)
+ [Amazon EMR 4.x 版之應用程式版本](emr-release-app-versions-4.x.md)


**應用程式版本資訊**  

|  | emr-4.3.0 | emr-4.2.0 | emr-4.1.0 | emr-4.0.0 | 
| --- | --- | --- | --- | --- | 
| AWS 適用於 Java 的 SDK | 1.10.27 | 1.10.27 | 未追蹤 | 未追蹤 | 
| Python | 未追蹤 | 未追蹤 | 未追蹤 | 未追蹤 | 
| Scala | 未追蹤 | 未追蹤 | 未追蹤 | 未追蹤 | 
| AmazonCloudWatchAgent |  -  |  -  |  -  |  -  | 
| Delta |  -  |  -  |  -  |  -  | 
| Flink |  -  |  -  |  -  |  -  | 
| Ganglia | 3.7.2 | 3.6.0 |  -  |  -  | 
| HBase |  -  |  -  |  -  |  -  | 
| HCatalog |  -  |  -  |  -  |  -  | 
| Hadoop | 2.7.1-amzn-0 | 2.6.0-amzn-2 | 2.6.0-amzn-1 | 2.6.0-amzn-0 | 
| Hive | 1.0.0-amzn-2 | 1.0.0-amzn-1 | 1.0.0-amzn-1 | 1.0.0-amzn-0 | 
| Hudi |  -  |  -  |  -  |  -  | 
| Hue | 3.7.1-amzn-5 | 3.7.1-amzn-5 | 3.7.1-amzn-4 |  -  | 
| Iceberg |  -  |  -  |  -  |  -  | 
| JupyterEnterpriseGateway |  -  |  -  |  -  |  -  | 
| JupyterHub |  -  |  -  |  -  |  -  | 
| Livy |  -  |  -  |  -  |  -  | 
| MXNet |  -  |  -  |  -  |  -  | 
| Mahout | 0.11.0 | 0.11.0 | 0.11.0 | 0.10.0 | 
| Oozie |  -  |  -  |  -  |  -  | 
| Oozie-Sandbox | 4.2.0 | 4.2.0 | 4.0.1 |  -  | 
| Phoenix |  -  |  -  |  -  |  -  | 
| Pig | 0.14.0-amzn-0 | 0.14.0-amzn-0 | 0.14.0-amzn-0 | 0.14.0-amzn-0 | 
| Presto |  -  |  -  |  -  |  -  | 
| Presto-Sandbox | 0.130 | 0.125 | 0.119 |  -  | 
| Spark | 1.6.0 | 1.5.2 | 1.5.0 | 1.4.1 | 
| Sqoop |  -  |  -  |  -  |  -  | 
| Sqoop-Sandbox |  -  |  -  |  -  |  -  | 
| TensorFlow |  -  |  -  |  -  |  -  | 
| Tez |  -  |  -  |  -  |  -  | 
| Trino (PrestoSQL) |  -  |  -  |  -  |  -  | 
| Zeppelin |  -  |  -  |  -  |  -  | 
| Zeppelin-Sandbox | 0.5.5-incubating-amzn-1 | 0.5.5-incubating-amzn-0 | 0.6.0-incubating-SNAPSHOT |  -  | 
| ZooKeeper |  -  |  -  |  -  |  -  | 
| ZooKeeper-Sandbox |  -  |  -  |  -  |  -  | 

## 4.3.0 版本備註
<a name="emr-430-relnotes"></a>

以下版本備註包含 Amazon EMR 4.3.0 版的資訊。

版本日期：2016 年 1 月 19 日

**功能**
+ 升級至 Hadoop 2.7.1
+ 升級至 Spark 1.6.0
+ 升級至 Ganglia 3.7.2 
+ 升級至 Presto 0.130
+ Amazon EMR 針對 `spark.dynamicAllocation.enabled` 設定為 true 時做了些變更；預設值為 false。設定為 true 時，會影響由 `maximizeResourceAllocation` 設定所設定的預設值。
  + 如果 `spark.dynamicAllocation.enabled` 設定為 true，則 `spark.executor.instances` 不會由 `maximizeResourceAllocation` 設定。
  + `spark.driver.memory` 設定現在是以叢集中的執行個體類型為基礎來設定，類似 `spark.executors.memory` 的設定方式。然而，由於 Spark 驅動程式應用程式可能會在主執行個體或其中一個核心執行個體上執行 (例如分別在 YARN 用戶端和叢集模式)，`spark.driver.memory` 設定會以這兩種執行個體群組中較小型的執行個體類型為依據來設定。
  + `spark.default.parallelism` 現在設定為 YARN 容器可用 CPU 核心數量的兩倍。在先前的版本中，設定值為該值的一半。
  + 為預留給 Spark YARN 程序而計算出來的記憶體總量會調整得更加精確，使 Spark 可用的記憶體 (即 `spark.executor.memory`) 總數小幅增加。

**解決先前版本的已知問題**
+ YARN 記錄彙整現在預設為啟用。
+ 修正 YARN 記錄彙整啟用時日誌不會被推送至叢集的 Amazon S3 日誌儲存貯體的問題。
+ YARN 容器大小現在於所有節點類型的新訂下限值為 32。
+ 修正 Ganglia 中造成大型叢集之主節點出現過多磁碟 I/O 的問題。
+ 修正叢集關閉時應用程式日誌無法推送至 Amazon S3 的問題。
+ 修正 EMRFS CLI 中造成特定命令失敗的問題。
+ 修正 Zeppelin 中相依性無法載入基礎 SparkContext 的問題。
+ 修正提出調整規模嘗試新增執行個體時產生的問題。
+ 修正 Hive 中 CREATE TABLE AS SELECT 對 Amazon S3 執行過多列出呼叫的問題。
+ 修正 Hue、Oozie、Ganglia 安裝時大型叢集無法正常佈建的問題。
+ 修正 s3-dist-cp 中即使因錯誤而失敗仍會傳回零為結束代碼的問題。

## 4.3.0 元件版本
<a name="emr-430-components"></a>

Amazon EMR 在此版本安裝的元件列出如下。其中有一些屬於大數據應用程式套件。其他的則為 Amazon EMR 獨有，並安裝為系統程序和功能。這些通常會以 `emr` 或 `aws` 開頭。在最新 Amazon EMR 版本中的大數據應用程式套件，通常也是社群中可找到的最新版本。我們致力盡快提供 Amazon EMR 的社群版本。

Amazon EMR 中的某些元件與社群版本不同。這些元件具有版本標籤，格式為 `CommunityVersion-amzn-EmrVersion`。`EmrVersion` 從 0 開始。例如，假設有一個名為 `myapp-component` 的開放原始碼社群元件 2.2 版為了包含在不同 Amazon EMR 發行版本中而修改過三次，則其發行版本會列為 `2.2-amzn-2`。


| 元件 | 版本 | Description | 
| --- | --- | --- | 
| emr-ddb | 3.0.0 | 適用於 Hadoop 生態系統應用程式的 Amazon DynamoDB 連接器。 | 
| emr-goodies | 2.0.0 | 適用 Hadoop 生態系統的超便利程式庫。 | 
| emr-kinesis | 3.1.0 | 適用於 Hadoop 生態系統應用程式的 Amazon Kinesis 連接器。 | 
| emr-s3-dist-cp | 2.1.0 | 針對 Amazon S3 最佳化的分散式複製應用程式。 | 
| emrfs | 2.3.0 | 適用於 Hadoop 生態系統應用程式的 Amazon S3 連接器。 | 
| ganglia-monitor | 3.7.2 | Hadoop 生態系統應用程式內嵌 Ganglia 代理程式以及 Ganglia 監控代理程式。 | 
| ganglia-metadata-collector | 3.7.2 | Ganglia 監控代理程式的彙總指標 Ganglia 中繼資料收集器。 | 
| ganglia-web | 3.7.1 | 由 Ganglia 中繼資料收集器收集，以檢視指標的 Web 應用程式。 | 
| hadoop-client | 2.7.1-amzn-0 | Hadoop 命令列用戶端，例如「hdfs」、「Hadoop」或「yarn」。 | 
| hadoop-hdfs-datanode | 2.7.1-amzn-0 | 用於存放區塊的 HDFS 節點層級服務。 | 
| hadoop-hdfs-library | 2.7.1-amzn-0 | HDFS 命令列用戶端和程式庫 | 
| hadoop-hdfs-namenode | 2.7.1-amzn-0 | 用於追蹤檔案名稱和區塊位置的 HDFS 服務。 | 
| hadoop-httpfs-server | 2.7.1-amzn-0 | HDFS 操作的 HTTP 端點。 | 
| hadoop-kms-server | 2.7.1-amzn-0 | 以 Hadoop 金鑰供應商 API 為基礎的加密金鑰管理伺服器。 | 
| hadoop-mapred | 2.7.1-amzn-0 | 執行 MapReduce 應用程式的 MapReduce 執行引擎程式庫。 | 
| hadoop-yarn-nodemanager | 2.7.1-amzn-0 | 在個別節點用於管理容器的 YARN 服務。 | 
| hadoop-yarn-resourcemanager | 2.7.1-amzn-0 | 用於分配和管理叢集資源，以及分散式應用程式的 YARN 服務。 | 
| hive-client | 1.0.0-amzn-2 | Hive 命令列用戶端。 | 
| hive-metastore-server | 1.0.0-amzn-2 | 為 Hadoop 操作的 SQL 提供存取 Hive 中繼儲存、存放中繼資料語意儲存庫的服務。 | 
| hive-server | 1.0.0-amzn-2 | 依 Web 請求接受 Hive 查詢的服務。 | 
| hue-server | 3.7.1-amzn-5 | 使用 Hadoop 生態系統應用程式分析資料的 Web 應用程式 | 
| mahout-client | 0.11.0 | 機器學習程式庫。 | 
| mysql-server | 5.5 | MySQL 資料庫伺服器。 | 
| oozie-client | 4.2.0 | Oozie 命令列用戶端。 | 
| oozie-server | 4.2.0 | 接受 Oozie 工作流程要求的服務。 | 
| presto-coordinator | 0.130 | 在 presto-workers 之間接受查詢和執行管理查詢的服務。 | 
| presto-worker | 0.130 | 執行查詢各部分的服務。 | 
| pig-client | 0.14.0-amzn-0 | Pig 命令列用戶端。 | 
| spark-client | 1.6.0 | Spark 命令列用戶端。 | 
| spark-history-server | 1.6.0 | 用於檢視完整 Spark 應用程式生命週期記錄事件的 Web 使用者介面。 | 
| spark-on-yarn | 1.6.0 | 適用於 YARN 的記憶體內執行引擎。 | 
| spark-yarn-slave | 1.6.0 | YARN 從屬所需的 Apache Spark 程式庫。 | 
| webserver | 2.4 | Apache HTTP 伺服器。 | 
| zeppelin-server | 0.5.5-incubating-amzn-1 | 能進行互動式資料分析，以 Web 為基礎的筆記型電腦。 | 

## 4.3.0 組態分類
<a name="emr-430-class"></a>

組態分類可讓您自訂應用程式。這些檔案通常對應於應用程式的組態 XML 檔案，例如 `hive-site.xml`。如需詳細資訊，請參閱[設定應用程式](emr-configure-apps.md)。


**emr-4.3.0 分類**  

| 分類 | Description | 
| --- | --- | 
| capacity-scheduler | 變更 Hadoop 中 capacity-scheduler.xml 檔案的值。 | 
| core-site | 變更 Hadoop 中 core-site.xml 檔案的值。 | 
| emrfs-site | 變更 EMRFS 設定。 | 
| hadoop-env | 在 Hadoop 環境中變更所有 Hadoop 元件的值。 | 
| hadoop-log4j | 變更 Hadoop 中 log4j.properties 檔案的值。 | 
| hdfs-encryption-zones | 設定 HDFS 加密區域。 | 
| hdfs-site | 變更 HDFS 的 hdfs-site.xml 中的值。 | 
| hive-env | 變更 Hive 環境中的值。 | 
| hive-exec-log4j | 變更 Hive 的 hive-exec-log4j.properties 檔案中的值。 | 
| hive-log4j | 變更 Hive 的 hive-log4j.properties 檔案中的值。 | 
| hive-site | 變更 Hive 的 hive-site.xml 檔案中的值 | 
| hue-ini | 變更 Hue 的 ini 檔案中的值 | 
| httpfs-env | 變更 HTTPFS 環境中的值。 | 
| httpfs-site | 變更 Hadoop 中 httpfs-site.xml 檔案的值。 | 
| hadoop-kms-acls | 變更 Hadoop 中 kms-acls.xml 檔案的值。 | 
| hadoop-kms-env | 變更 Hadoop KMS 環境中的值。 | 
| hadoop-kms-log4j | 變更 Hadoop 的 kms-log4j.properties 檔案中的值。 | 
| hadoop-kms-site | 變更 Hadoop 中 kms-site.xml 檔案的值。 | 
| mapred-env | 變更 MapReduce 應用程式環境中的值。 | 
| mapred-site | 變更 MapReduce 應用程式 mapred-site.xml 檔案中的值。 | 
| oozie-env | 變更 Oozie 環境中的值。 | 
| oozie-log4j | 變更 Oozie 的 oozie-log4j.properties 檔案中的值。 | 
| oozie-site | 變更 Oozie 的 oozie-site.xml 檔案中的值。 | 
| pig-properties | 變更 Pig 的 pig.properties 檔案中的值。 | 
| pig-log4j | 變更 Pig 的 log4j.properties 檔案中的值。 | 
| presto-log | 變更 Presto 的 log.properties 檔案中的值。 | 
| presto-config | 變更 Presto 的 config.properties 檔案中的值。 | 
| presto-connector-hive | 變更 Presto 的 hive.properties 檔案中的值。 | 
| spark | Apache Spark 的 Amazon EMR 彙整設定。 | 
| spark-defaults | 變更 Spark 的 spark-defaults.conf 檔案中的值。 | 
| spark-env | 變更 Spark 環境中的值。 | 
| spark-log4j | 變更 Spark 中 log4j.properties 檔案的值。 | 
| spark-metrics | 變更 Spark 中 metrics.properties 檔案的值。 | 
| yarn-env | 變更 YARN 環境中的值。 | 
| yarn-site | 變更 YARN 的 yarn-site.xml 檔案中的值。 | 
| zeppelin-env | 變更 Zeppelin 環境中的值。 | 