View a markdown version of this page

Coleta e utilização de estatísticas de tabelas - Amazon EMR

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Coleta e utilização de estatísticas de tabelas

A coleta de estatísticas de tabelas permite que o otimizador baseado em custos do Trino tome decisões embasadas sobre ordens de junção, imposição de filtros e remoção de partições, resultando em melhor performance.

Você pode usar o comando ANALYZE para coletar estatísticas de tabelas do Hive ou Iceberg:

ANALYZE sales;

Coletar estatísticas em tabelas amplas pode sobrecarregar recursos. Recomendamos especificar um subconjunto de colunas usadas em junções, filtros ou operações de agrupamento.

Esse é outro comando útil. Ele exibe as estatísticas atuais de uma tabela para verificar se as estatísticas estão atualizadas.

show stats for table_name;