本文属于机器翻译版本。若本译文内容与英语原文存在差异，则一律以英文原文为准。 # Amazon EMR 中的引导失败错误代码以下各节提供引导失败错误代码的问题排查信息。 **Topics** + [BOOTSTRAP\$1FAILURE\$1PRIMARY\$1WITH\$1NON\$1ZERO\$1CODE](BOOTSTRAP_FAILURE_PRIMARY_WITH_NON_ZERO_CODE.md) + [BOOTSTRAP\$1FAILURE\$1BA\$1DOWNLOAD\$1FAILED\$1PRIMARY](BOOTSTRAP_FAILURE_BA_DOWNLOAD_FAILED_PRIMARY.md) + [BOOTSTRAP\$1FAILURE\$1FILE\$1NOT\$1FOUND\$1PRIMARY](BOOTSTRAP_FAILURE_FILE_NOT_FOUND_PRIMARY.md) + [BOOTSTRAP\$1FAILURE\$1INSUFFICIENT\$1DISK\$1SPACE\$1PRIMARY](BOOTSTRAP_FAILURE_INSUFFICIENT_DISK_SPACE_PRIMARY.md) + [BOOTSTRAP\$1FAILURE\$1INSUFFICIENT\$1DISK\$1SPACE\$1WORKER](BOOTSTRAP_FAILURE_INSUFFICIENT_DISK_SPACE_WORKER.md) + [BOOTSTRAP\$1FAILURE\$1HIVE\$1METASTORE\$1CONNECTION\$1ERROR\$1PRIMARY](BOOTSTRAP_FAILURE_HIVE_METASTORE_CONNECTION_ERROR_PRIMARY.md) + [BOOTSTRAP\$1FAILURE\$1HIVE\$1METASTORE\$1CONNECTION\$1ERROR\$1WORKER](BOOTSTRAP_FAILURE_HIVE_METASTORE_CONNECTION_ERROR_WORKER.md) # BOOTSTRAP\$1FAILURE\$1PRIMARY\$1WITH\$1NON\$1ZERO\$1CODE ## 概述当集群因 `BOOTSTRAP_FAILURE_PRIMARY_WITH_NON_ZERO_CODE` 错误而终止时，主实例中的引导操作已失败。有关引导操作的更多信息，请参阅 [创建引导操作以使用 Amazon EMR 集群安装其他软件](emr-plan-bootstrap.md)。 ## 解决方案要解决此错误，请查看 API 错误中返回的详细信息、修改您的引导操作脚本，然后使用更新的引导操作创建新集群。要对出现故障的 EMR 集群进行故障排除，请参阅和返回`ErrorDetail`的信息。`DescribeCluster` `ListClusters` APIs有关更多信息，请参阅 [Amazon EMR 中包含 ErrorDetail 信息的错误代码](emr-troubleshoot-error-errordetail.md)。`ErrorDetail` 中的 `ErrorData` 数组返回此错误代码的以下信息： **`primary-instance-id`** 引导操作失败的主实例的 ID。 **`bootstrap-action`** 失败的引导操作的序号。`bootstrap-action` 值为 `1` 的脚本是在实例上运行的第一个引导操作。 **`return-code`** 失败的引导操作返回码。 **`amazon-s3-path`** 失败的引导操作的 Amazon S3 位置。 **`public-doc`** 错误代码文档的公有 URL。 ## 完成步骤执行以下步骤以确定和修复引导操作错误的根本原因。然后启动新集群。 1. 查看 Amazon S3 中的引导操作日志文件，确定失败的根本原因。要了解有关如何查看 Amazon EMR 日志的更多信息，请参阅 [查看 Amazon EMR 日志文件](emr-manage-view-web-log-files.md)。 1. 如果您在创建实例时开启了集群日志，请参阅 `stdout` 日志以了解更多信息。您可以在以下 Amazon S3 位置找到引导操作的 `stdout` 日志： ``` s3://amzn-s3-demo-bucket/logs/Your_Cluster_Id/node/Primary_Instance_Id/bootstrap-actions/Failed_Bootstrap_Action_Number/stdout.gz ``` 有关集群的更多信息，请参阅 [配置 Amazon EMR 集群日志记录和调试](emr-plan-debugging.md)。 1. 要确定引导操作失败，请查看 `stdout` 日志中的异常以及 `ErrorData` 中的`return-code` 值。 1. 使用上一步中的发现来修改您的引导操作，使其避免异常或在异常发生时可以正常地处理异常。 1. 使用更新的引导操作启动新集群。 # BOOTSTRAP\$1FAILURE\$1BA\$1DOWNLOAD\$1FAILED\$1PRIMARY ## 概述当主实例无法从您指定的 Amazon S3 位置下载引导操作脚本时，集群终止并出现 `BOOTSTRAP_FAILURE_BA_DOWNLOAD_FAILED_PRIMARY` 错误。典型的原因包括： + 引导操作脚本文件不在指定的 Amazon S3 位置。 + 集群上的 Amazon EC2 实例的服务角色（也称为 *Amazon EMR 的 EC2 实例配置文件*）无权访问引导操作脚本所在的 Amazon S3 存储桶。有关服务角色的更多信息，请参阅 [集群 EC2 实例（EC2 实例配置文件）的服务角色](emr-iam-role-for-ec2.md)。有关引导操作的更多信息，请参阅 [创建引导操作以使用 Amazon EMR 集群安装其他软件](emr-plan-bootstrap.md)。 ## 解决方案要解决此错误，请确保您的主实例具有对引导操作脚本的适当访问权限。要对出现故障的 EMR 集群进行故障排除，请参阅和返回`ErrorDetail`的信息。`DescribeCluster` `ListClusters` APIs有关更多信息，请参阅 [Amazon EMR 中包含 ErrorDetail 信息的错误代码](emr-troubleshoot-error-errordetail.md)。`ErrorDetail` 中的 `ErrorData` 数组返回此错误代码的以下信息： **`primary-instance-id`** 引导操作失败的主实例的 ID。 **`bootstrap-action`** 失败的引导操作的序号。`bootstrap-action` 值为 `1` 的脚本是在实例上运行的第一个引导操作。 **`amazon-s3-path`** 失败的引导操作的 Amazon S3 位置。 **`public-doc`** 错误代码文档的公有 URL。 ## 完成步骤执行以下步骤以确定和修复引导操作错误的根本原因。然后启动新集群。 **故障排除步骤** 1. 使用 `ErrorData` 数组中的 `amazon-s3-path` 值在 Amazon S3 中查找相关的引导操作脚本。 1. 如果您在创建实例时开启了集群日志，请参阅 `stdout` 日志以了解更多信息。您可以在以下 Amazon S3 位置找到引导操作的 `stdout` 日志： ``` s3://amzn-s3-demo-bucket/logs/Your_Cluster_Id/node/Primary_Instance_Id/bootstrap-actions/Failed_Bootstrap_Action_Number/stdout.gz ``` 有关集群的更多信息，请参阅 [配置 Amazon EMR 集群日志记录和调试](emr-plan-debugging.md)。 1. 要确定引导操作失败，请查看 `stdout` 日志中的异常以及 `ErrorData` 中的`return-code` 值。 1. 使用上一步中的发现来修改您的引导操作，使其避免异常或在异常发生时可以正常地处理异常。 1. 使用更新的引导操作启动新集群。 # BOOTSTRAP\$1FAILURE\$1FILE\$1NOT\$1FOUND\$1PRIMARY ## 概述该 `BOOTSTRAP_FAILURE_FILE_NOT_FOUND_PRIMARY` 错误表示主实例找不到该实例刚刚从指定的 Amazon S3 存储桶下载的引导操作脚本。 ## 解决方案要解决此错误，请确保您的主实例具有对引导操作脚本的适当访问权限。要对出现故障的 EMR 集群进行故障排除，请参阅和返回`ErrorDetail`的信息。`DescribeCluster` `ListClusters` APIs有关更多信息，请参阅 [Amazon EMR 中包含 ErrorDetail 信息的错误代码](emr-troubleshoot-error-errordetail.md)。`ErrorDetail` 中的 `ErrorData` 数组返回此错误代码的以下信息： **`primary-instance-id`** 引导操作失败的主实例的 ID。 **`bootstrap-action`** 失败的引导操作的序号。`bootstrap-action` 值为 `1` 的脚本是在实例上运行的第一个引导操作。 **`amazon-s3-path`** 失败的引导操作的 Amazon S3 位置。 **`public-doc`** 错误代码文档的公有 URL。 ## 完成步骤执行以下步骤以确定和修复引导操作错误的根本原因。然后启动新集群。 1. 要在 Amazon S3 中查找相关的引导操作脚本，请使用 `ErrorData` 数组中的 `amazon-s3-path` 值。 1. 查看 Amazon S3 中的引导操作日志文件，确定失败的根本原因。要了解有关如何查看 Amazon EMR 日志的更多信息，请参阅 [查看 Amazon EMR 日志文件](emr-manage-view-web-log-files.md)。 **注意** 如果您没有为集群开启日志，则必须使用相同的配置和引导操作创建一个新集群。要确保集群日志已开启，请参阅 [配置 Amazon EMR 集群日志记录和调试](emr-plan-debugging.md)。 1. 查看 `stdout` 日志以了解您的引导操作，并确认没有自定义流程可以删除主实例上 `/emr/instance-controller/lib/bootstrap-actions` 文件夹中的文件。您可以在以下 Amazon S3 位置找到引导操作的 `stdout` 日志： ``` s3://amzn-s3-demo-bucket/logs/Your_Cluster_Id/node/Primary_Instance_Id/bootstrap-actions/Failed_Bootstrap_Action_Number/stdout.gz ``` 1. 使用更新的引导操作启动新集群。 # BOOTSTRAP\$1FAILURE\$1INSUFFICIENT\$1DISK\$1SPACE\$1PRIMARY ## 概述 `BOOTSTRAP_FAILURE_INSUFFICIENT_DISK_SPACE_PRIMARY` 错误表明在安装必要的软件时，主实例的磁盘空间不足。 ## 解决方案要解决此错误，请确认您的主实例的根卷上有足够的磁盘空间。要对出现故障的 EMR 集群进行故障排除，请参阅和返回`ErrorDetail`的信息。`DescribeCluster` `ListClusters` APIs有关更多信息，请参阅 [Amazon EMR 中包含 ErrorDetail 信息的错误代码](emr-troubleshoot-error-errordetail.md)。`ErrorDetail` 中的 `ErrorData` 数组返回此错误代码的以下信息： **`primary-instance-id`** 磁盘空间不足的主实例的 ID。 **`public-doc`** 错误代码文档的公有 URL。 ## 完成步骤 1. 查看集群的 EBS 根设备卷的最佳实践。请参阅《Amazon EMR Management Guide》**中的 [自定义 Amazon EBS 根设备卷](emr-custom-ami-root-volume-size.md)。 1. 启动一个具有更大 EBS 根设备卷大小的新集群。 # BOOTSTRAP\$1FAILURE\$1INSUFFICIENT\$1DISK\$1SPACE\$1WORKER ## 概述 `BOOTSTRAP_FAILURE_INSUFFICIENT_DISK_SPACE_WORKER` 错误表明在安装必要的软件时，一个或多个工作线程实例的磁盘空间不足。 ## 解决方案要解决此错误，请确认您的工作线程实例的根卷上有足够的磁盘空间。要对出现故障的 EMR 集群进行故障排除，请参阅和返回`ErrorDetail`的信息。`DescribeCluster` `ListClusters` APIs有关更多信息，请参阅 [Amazon EMR 中包含 ErrorDetail 信息的错误代码](emr-troubleshoot-error-errordetail.md)。`ErrorDetail` 中的 `ErrorData` 数组返回此错误代码的以下信息： **`worker-instance-ids`** 磁盘空间不足的工作器实例中的。 IDs **`public-doc`** 错误代码文档的公有 URL。 ## 完成步骤 1. 查看集群的 EBS 根设备卷的最佳实践。请参阅《Amazon EMR Management Guide》**中的 [自定义 Amazon EBS 根设备卷](emr-custom-ami-root-volume-size.md)。 1. 启动一个具有更大 EBS 根设备卷大小的新集群。 # BOOTSTRAP\$1FAILURE\$1HIVE\$1METASTORE\$1CONNECTION\$1ERROR\$1PRIMARY ## 概述 `BOOTSTRAP_FAILURE_HIVE_METASTORE_CONNECTION_ERROR_PRIMARY` 错误表示主实例无法与配置的外部 Hive 元存储建立连接。 ## 解决方案要解决此错误，请确保您的外部 Hive 元存储配置正确，并且允许主实例与其连接。要对出现故障的 EMR 集群进行故障排除，请参阅和返回`ErrorDetail`的信息。`DescribeCluster` `ListClusters` APIs有关更多信息，请参阅 [Amazon EMR 中包含 ErrorDetail 信息的错误代码](emr-troubleshoot-error-errordetail.md)。`ErrorDetail` 中的 `ErrorData` 数组返回此错误代码的以下信息： **`primary-instance-id`** 无法与配置的外部 Hive 元存储建立连接的主实例的 ID。 **`public-doc`** 错误代码文档的公有 URL。 ## 完成步骤 1. 查看为 Hive 配置外部元存储的最佳实践。请参阅[为 Hive 配置外部元存储](https://docs.aws.amazon.com/emr/latest/ReleaseGuide/emr-metastore-external-hive.html)。 1. 使用更新的集群配置启动新集群。 # BOOTSTRAP\$1FAILURE\$1HIVE\$1METASTORE\$1CONNECTION\$1ERROR\$1WORKER ## 概述 `BOOTSTRAP_FAILURE_HIVE_METASTORE_CONNECTION_ERROR_WORKER` 错误表示一个或多个工作线程实例无法与配置的外部 Hive 元存储建立连接。 ## 解决方案要解决此错误，请确保您的外部 Hive 元存储配置正确，并且允许工作线程实例与其连接。要对出现故障的 EMR 集群进行故障排除，请参阅和返回`ErrorDetail`的信息。`DescribeCluster` `ListClusters` APIs有关更多信息，请参阅 [Amazon EMR 中包含 ErrorDetail 信息的错误代码](emr-troubleshoot-error-errordetail.md)。`ErrorDetail` 中的 `ErrorData` 数组返回此错误代码的以下信息： **`worker-instance-ids`** 无法与配置 IDs 的外部 Hive Metastore 建立连接的工作器实例。 **`public-doc`** 错误代码文档的公有 URL。 ## 完成步骤 1. 查看为 Hive 配置外部元存储的最佳实践。请参阅[为 Hive 配置外部元存储](https://docs.aws.amazon.com/emr/latest/ReleaseGuide/emr-metastore-external-hive.html)。 1. 使用更新的集群配置启动新集群。