

本文属于机器翻译版本。若本译文内容与英语原文存在差异，则一律以英文原文为准。

# 将数据目录连接到 Hive 元存储的先决条件
<a name="hms-prerequisites"></a>

要将 AWS Glue Data Catalog 连接到外部 Apache Hive 元数据仓并设置数据访问权限，您需要完成以下要求：
**注意**  
我们建议 Lake Formation 管理员部署 AWS SAM 应用程序，并且只有特权用户才能使用 Hive 元数据仓连接来创建相应的联合数据库。

1. 

**创建 IAM 角色。**

**部署 AWS SAM 应用程序**
   + 创建具有部署资源（Lambda 函数 Amazon API Gateway、IAM 角色和 AWS Glue 连接）所需的必要权限的角色，以创建与 Hive 元数据仓的连接。

**创建联合数据库**

   需要以下资源权限：
   + `glue:CreateDatabase on resource arn:aws:glue:region:account-id:database/gluedatabasename`
   + `glue:PassConnection on resource arn:aws:glue:region:account-id:connection/hms_connection`

1. 

**在 Lake Formation 中注册 Amazon S3 位置。**

   要使用 Lake Formation 管理和保护数据湖中的数据，您必须在 Lake Formation 中注册含有 Hive 元存储中表数据的 Amazon S3 位置。通过这样做，Lake Formation可以向Athena、Redshift Spectrum和Amazon EMR等 AWS 分析服务机构出售证书。

   有关注册 Amazon S3 位置的更多信息，请参阅[向数据湖添加 Amazon S3 位置](register-data-lake.md)。

   注册 Amazon S3 位置时，请选中**启用数据目录联合身份验证**复选框以允许 Lake Formation 代入访问联合数据库中表的角色。  
![注册 AWS Lake Formation 带有 Amazon S3 路径和 IAM 角色选项的位置表。](http://docs.aws.amazon.com/zh_cn/lake-formation/latest/dg/images/hms-register-s3.png)

   有关在 Lake Formation 中注册数据位置的更多信息，请参阅[为您的数据湖配置 Amazon S3 位置](initial-lf-config.md#register-s3-location)。

1. 

**使用正确的 Amazon EMR 版本。**

   要将 Amazon EMR 与联合 Hive 元存储数据库配合使用，您需要拥有 Hive 3.x 版或更高版本以及 Amazon EMR 6.x 版或更高版本。