

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

# Trino로 Amazon EMR 클러스터 시작
<a name="emr-trino-getting-started-launch"></a>

다음은 Trino를 사용하여 클러스터를 생성할 때 올바른 구성 선택에 대해 설명합니다.

## Hive 커넥터를 사용하여 쿼리에 데이터를 사용할 수 있도록 설정
<a name="emr-trino-getting-started-connect-hive"></a>

클러스터에서 메타스토어 데이터를 쿼리할 목적으로 Hive 메타스토어에 대한 Trino 커넥터를 구성할 수 있습니다. 메타스토어는 파일 기반 콘텐츠 또는 데이터를 테이블로 사용할 수 있도록 하는 추상화 계층이므로 쿼리하기 쉽습니다. 클러스터에서 Hive 메타스토어 테이블을 사용할 수 있도록 Amazon EMR에서 커넥터를 구성합니다. 다음 절차에서는 이 작업을 수행하는 방법을 보여 줍니다.

1. 콘솔에서 AWS Glue를 선택하고 Amazon S3의 소스 데이터를 기반으로 테이블을 생성합니다. AWS Glue 데이터 카탈로그의 테이블은 데이터에 대한 메타데이터 정의입니다. 이 컨텍스트에서는 테이블을 수동으로 생성하여 소스 데이터에서 원하는 대로 열을 생성하는 것이 좋습니다. Amazon S3의 반정형 데이터에서 AWS Glue의 테이블을 생성하는 방법에 대한 자세한 내용은 *AWS Glue 사용 설명서*의 [콘솔을 사용하여 테이블 생성을](https://docs.aws.amazon.com/glue/latest/dg/tables-described.html#console-tables) 참조하세요.

1. 클러스터 생성의 일부로 구성을 설정합니다. **구성** 탭을 선택합니다. 구성은 클러스터의 선택적 사양입니다. 구성을 입력할 때 다음 샘플과 같이 JSON을 추가합니다.이 샘플은 Trino에게 Glue 데이터 카탈로그를 테이블 메타데이터에 대한 외부 Hive AWS 메타스토어로 사용하도록 지시합니다.

   ```
   {
       "classification": "trino-connector-hive",
       "properties": {
           "hive.metastore": "glue"
       }
   }
   ```

   또는 클러스터를 생성할 때 **소프트웨어 설정** 섹션에서 구성을 적용할 수 있습니다.

   또한 Apache Iceberg 연결과 같은 다른 커넥터 유형을 설정할 수 있습니다. 자세한 내용은 *Amazon EMR 릴리스 안내서*의 [Trino에서 Iceberg 클러스터 사용](https://docs.aws.amazon.com/emr/latest/ReleaseGuide/emr-iceberg-use-trino-cluster.html)을 참조하세요. 추가 설정 구성은 선택 사항입니다.

시작하기 단계를 계속하려면 [Amazon EMR 클러스터의 프라이머리 노드에 연결하고 쿼리를 실행합니다.](emr-trino-getting-started-connect.md) 섹션을 참조하세요.

## Trino로 클러스터 생성
<a name="emr-trino-getting-started-launch-cluster-settings"></a>

다음은 Trino와 함께 사용할 클러스터를 생성할 때 올바른 구성 선택에 대해 설명합니다.

**중요**  
클러스터를 생성하기 전에 Glue 데이터 카탈로그 구성을 Hive AWS 메타스토어로 완료합니다.이 구성을 시작하는 것이 좋습니다. 자세한 내용은 [Hive 커넥터를 사용하여 쿼리에 데이터를 사용할 수 있도록 설정](#emr-trino-getting-started-connect-hive) 단원을 참조하십시오.

1.  AWS 콘솔의 서비스에서 Amazon EMR을 선택합니다. Amazon EMR을 선택하면 기존 클러스터가 있는 경우 **EC2 클러스터의 EMR**이 나열됩니다.

1. **클러스터 생성**을 선택합니다. 여기에서 클러스터 빌드 프로세스를 시작합니다.

1. 클러스터에 이름을 지정하고 **Amazon EMR 릴리스**를 선택합니다. 자습서의 최신 릴리스를 선택할 수 있습니다.

1. **Trino** 애플리케이션이 미리 선택된 Trino 번들을 선택합니다. 번들은 클러스터의 목적을 미리 알고 있을 때 편의를 위해 설정됩니다. 그렇지 않으면 Trino의 확인란을 선택하기만 하면 됩니다.

1. **클러스터 구성**에서 **균일한 인스턴스 그룹**을 선택합니다. 계속해서 추가 인스턴스 그룹을 제거합니다.

1. **인스턴스 유형**을 선택합니다. 일반적으로 메모리가 16GiB 이상인 인스턴스 유형을 선택하는 것이 좋습니다. 또한 **클러스터 조정 및 프로비저닝**에서 **클러스터 크기 수동 설정**을 선택합니다.

1. 이때 Glue를 가리키도록 Hive AWS 메타스토어 구성을 설정합니다. 자세한 내용은 섹션을 참조하세요[Hive 커넥터를 사용하여 쿼리에 데이터를 사용할 수 있도록 설정](#emr-trino-getting-started-connect-hive). 클러스터를 빌드하기 전에 이 작업을 완료합니다.

1. **클러스터 생성**을 선택합니다. 이 과정을 완료하는 데 몇 분 정도 소요될 수 있습니다.

   이 단계에서는 모든 구성 단계를 자세히 다루지는 않습니다. 클러스터 설정에 대한 자세한 내용은 [Amazon EMR 클러스터 계획, 구성 및 시작](https://docs.aws.amazon.com/emr/latest/ManagementGuide/emr-plan.html)에서 확인할 수 있습니다.

**참고**  
동일한 클러스터에서 사용할 Presto와 Trino를 모두 선택하지 마세요. 이들을 함께 실행하는 것은 지원되지 않습니다. Trino를 실행하는 경우 Spark와 같은 다른 애플리케이션을 클러스터에서 실행하지 않는 것이 좋습니다.