As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.
Configurar o Trino no Amazon EMR
Configurar conectores para o Trino
Conectando-se ao AWS Glue como sua metastore do Hive
É importante e útil entender que você pode configurar o AWS Glue Data Catalog como seu metastore do Hive ao executar consultas com o Trino. Para obter informações adicionais, incluindo etapas para configurar um cluster com um metastore do Hive, consulte Usando o AWS Glue Data Catalog como metastore do Hive.
Para obter informações sobre a integração do EMR no EKS com o AWS Glue, consulte as seguintes melhores práticas: integração de contêineres do EMR
Conexão com tabelas do Iceberg ao usar o Trino com o Amazon EMR
O Iceberg é um formato de tabela aberta para tabelas analíticas. Ele foi criado para mecanismos como o Spark e o Trino consultarem big data das mesmas tabelas usando consultas SQL. Ele inclui recursos como isolamento de leituras e gravações de dados, para que um leitor possa evitar consultar dados parcialmente atualizados, por exemplo. Ele também oferece suporte a recursos de estado, como snapshots. Ele fornece uma camada de abstração por meio do uso de metadados e arquivos de manifesto. Estes últimos descrevem o esquema da tabela e facilitam a consulta de dados sem precisar saber muitos detalhes sobre como são formatados ou organizados. Quando você está conectado, pode ler dados de tabelas, atualizar dados ou gravar novos dados nos arquivos subjacentes.
Há um workshop disponível que mostra como configurar tabelas Iceberg com o Amazon EMR e o Glue AWS . Para obter mais informações, consulte Workshop de analytics - configurar e usar tabelas do Apache Iceberg no seu data lake
Estabelecer conexões com clientes
Você pode se conectar ao Trino usando um driver JDBC disponível. Para obter mais informações, consulte o driver JDBC
Monitoramento
Você pode monitorar clusters do Amazon EMR por meio do. Console de gerenciamento da AWS Para obter mais informações, consulte Visualizar e monitorar um cluster do Amazon EMR enquanto ele executa trabalhos. O Amazon EMR também envia suas métricas de monitoramento para o Amazon CloudWatch. Para obter mais informações sobre como monitorar um cluster do Amazon EMR, consulte Eventos e métricas do Amazon CloudWatch a partir do Amazon EMR.