

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

# Connect al nodo primario per il cluster Amazon EMR ed esegui query
<a name="emr-trino-getting-started-connect"></a>

## Fornisci i dati di test e configura le autorizzazioni
<a name="emr-trino-getting-started-pre-data"></a>

Puoi testare Amazon EMR con Trino utilizzando AWS Glue Data Catalog e il suo metastore Hive. Questi passaggi preliminari descrivono come configurare i dati di test, se non l'hai ancora fatto:

1. Crea una chiave SSH da utilizzare per la crittografia delle comunicazioni, se non l'hai già fatto.

1. È possibile scegliere tra diversi file system per archiviare dati e file di registro. Per iniziare, crea un bucket Amazon S3. Assegna al bucket un nome univoco. Quando lo crei, specifica la chiave di crittografia che hai creato.
**Nota**  
Scegli la stessa regione per creare sia il tuo bucket di storage che il cluster Amazon EMR.

1. Scegli il bucket che hai creato. Scegli **Crea cartella** e assegna alla cartella un nome memorabile. Quando crei la cartella, scegli una configurazione di sicurezza. È possibile scegliere le impostazioni di sicurezza per il genitore o rendere le impostazioni di sicurezza più specializzate.

1. Aggiungi i dati di test alla tua cartella. Ai fini di questo tutorial, l'utilizzo di un file in formato.csv di record separati da virgole è utile per completare questo caso d'uso.

1. Dopo aver aggiunto dati a un bucket Amazon S3, configura una tabella in AWS Glue per fornire un livello di astrazione per l'interrogazione dei dati.

## Connect ed esegui query
<a name="emr-trino-getting-started-run"></a>

Di seguito viene descritto come connettersi ed eseguire le query su un cluster che esegue Trino. Prima di farlo, assicuratevi di aver configurato il connettore Hive metastore, descritto nella procedura precedente, in modo che le tabelle dei metastore siano visibili.

1. Ti consigliamo di utilizzare EC2 Instance Connect per connetterti al tuo cluster, perché fornisce una connessione sicura. Scegli **Connect to the Primary node using SSH** dal riepilogo del cluster. La connessione richiede che il gruppo di sicurezza disponga di una regola in entrata per consentire le connessioni attraverso la porta 22 ai client nella sottorete. È inoltre necessario utilizzare l'utente **hadoop** durante la connessione.

1. Avvia la CLI di Trino eseguendo. `trino-cli` Ciò consente di eseguire comandi e interrogare i dati con Trino.

1. Esegui `show catalogs;`. Verificate che il catalogo **hive** sia elencato. Ciò fornisce un elenco di cataloghi disponibili, che contengono archivi di dati o impostazioni di sistema.

1. Per vedere gli schemi disponibili, esegui. `show schemas in hive;` Da qui, puoi eseguire `use schema-name;` e includere il nome del tuo schema. Quindi puoi correre `show tables;` per elencare le tabelle.

1. Interroga una tabella eseguendo un comando come`SELECT * FROM table-name`, ad esempio, utilizzando il nome di una tabella nello schema. Se hai già eseguito l'`USE`istruzione per connetterti a uno schema specifico, non devi usare una notazione in due parti come. *schema* *table*.