Praticas recomendadas para o Trino no Amazon EMR - Amazon EMR

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Praticas recomendadas para o Trino no Amazon EMR

A arquitetura do Trino foi projetada para consultas SQL rápidas e distribuídas em grandes conjuntos de dados em várias fontes de dados, seguindo um modelo de coordenador/trabalhador em que cada componente tem um papel específico na execução de consultas. Há algumas áreas ou categorias nas quais você pode se concentrar para configurar seu cluster do Amazon EMR executando o Trino para obter a melhor performance. Incluindo o seguinte:

  • Ajustar as configurações do cluster para otimização da memória.

  • Otimizar as configurações para particionamento e distribuição de dados.

  • Usar a filtragem dinâmica para reduzir a contagem de resultados de consultas.

Algumas dessas configurações são ajustadas automaticamente quando o Trino é usado com o Amazon EMR. Outras podem ser definidas manualmente por meio do console ou de comandos da CLI. Os tópicos desta seção ajudam a configurar seus dados e o cluster da maneira ideal.