

本文属于机器翻译版本。若本译文内容与英语原文存在差异，则一律以英文原文为准。

# 在 Amazon EMR 上配置 Trino
<a name="emr-trino-config"></a>

**Topics**
+ [

## 为 Trino 配置连接器
](#emr-trino-config-connector)
+ [

## 监控
](#emr-trino-monitoring)

## 为 Trino 配置连接器
<a name="emr-trino-config-connector"></a>

### 以 Hive AWS 元存储的身份连接到 Glue
<a name="emr-trino-config-connector-hive"></a>

在使用 Trino 运行查询时，您可以将 AWS Glue 数据目录配置为 Hive 元数据库，这一点既重要又有用。有关更多信息，包括设置带有 Hive 元数据仓的集群的步骤，请参阅[使用 Gl AWS ue 数据目录作为 Hive 的元数据库](https://docs.aws.amazon.com/emr/latest/ReleaseGuide/emr-hive-metastore-glue.html)。



有关将 EKS 上的 EMR 与 Glue 集成的信息 AWS ，请参阅以下最佳实践：[EMR 容器与 Glue 集成](https://aws.github.io/aws-emr-containers-best-practices/metastore-integrations/docs/aws-glue/)。 AWS 

### 将 Trino 与 Amazon EMR 结合使用时连接到 Iceberg 表
<a name="emr-trino-config-connector-iceberg"></a>

Iceberg 是一种适用于分析表的开放表格式。它是为 Spark 和 Trino 等引擎创建的，以便使用 SQL 查询从相同的表中查询大数据。例如，它包括隔离数据读取和写入等功能，以便读取方可以避免查询已部分更新的数据。它还支持状态功能（例如快照）。它通过使用元数据和清单文件提供了一个抽象层。它们描述了表架构，使得查询数据变得容易，而无需了解有关如何设置数据格式或组织数据的很多详细信息。连接后，您既可以读取表中的数据、更新数据，也可以将新数据写入底层文件。

有一个研讨会向你展示如何使用 Amazon EMR 和 AWS Glue 配置 Iceberg 表。有关更多信息，请参阅 [Analytics Workshop - Set Up and Use Apache Iceberg Tables on Your Data Lake](https://youtu.be/SZDYmWIStUo?si=sW35AjSWIcHu5x_p)。

### 与客户端连接
<a name="emr-trino-config-connector-jdbc"></a>

您可以使用可用的 JDBC 驱动程序与 Trino 连接。有关更多信息，请参阅 *Trino 文档*中的 [JDBC driver](https://trino.io/docs/current/client/jdbc.html)。

## 监控
<a name="emr-trino-monitoring"></a>

您可以通过监控 Amazon EMR 集群。 AWS 管理控制台有关更多信息，请参阅[在 Amazon EMR 集群执行工作时查看和监控](https://docs.aws.amazon.com/emr/latest/ManagementGuide/emr-manage-view.html)。Amazon EMR 还会将其监控指标发送到 Amazon CloudWatch。有关监控 Amazon EMR 集群的更多信息，请参阅[来自 Amazon EMR 的Amazon CloudWatch 事件和指标]()。