SVCS_S3QUERY_SUMMARY

Use a visualização SVCS_S3QUERY_SUMMARY para obter um resumo de todas as consultas de data lake que foram executadas no sistema. Um segmento pode executar uma varredura de tabela externa.

nota

Visualizações do sistema com o prefixo SVCS fornecem detalhes sobre consultas nos clusters principal e de escalabilidade da simultaneidade. As visualizações são semelhantes às visualizações com o prefixo SVL, exceto que as visualizações SVL fornecem informações somente para consultas executadas no cluster principal.

SVCS_S3QUERY_SUMMARY é visível para todos os usuários. Os superusuários podem ver todas as linhas; usuários regulares podem ver somente seus próprios dados. Para obter mais informações, consulte Visibilidade de dados em tabelas e visualizações de sistema.

Para obter informações sobre SVL_S3QUERY, consulte SVL_S3QUERY.

Colunas da tabela

Nome da coluna	Tipo de dados	Descrição
userid	integer	O ID do usuário que gerou determinada entrada.
consultar	integer	O ID da consulta. Este valor pode ser usado para unir várias outras tabelas e exibições do sistema.
xid	bigint	O ID da transação.
pid	integer	O ID do processo.
segment	integer	O número do segmento. Uma consulta consiste em vários segmentos e cada segmento consiste em uma ou mais etapas.
etapa	integer	A etapa da consulta que foi executada.
starttime	timestamp	A hora em UTC em que a consulta do Redshift Spectrum neste segmento começou a ser executada. Um segmento pode ter uma varredura de tabela externa.
endtime	timestamp	A hora em UTC que a consulta do Redshift Spectrum neste segmento foi concluída. Um segmento pode ter uma varredura de tabela externa.
elapsed	integer	O tempo que a consulta do Redshift Spectrum levou para ser executada neste segmento (em microssegundos).
aborted	integer	Se uma consulta for interrompida pelo sistema ou cancelada pelo usuário, essa coluna terá o valor `1`. Se a consulta foi executada até o final, essa coluna conterá `0`.
external_table_name	char(136)	O formato interno do nome externo da tabela para a varredura da tabela externa.
file_format	character(16)	O formato de arquivo dos dados da tabela externa.
is_partitioned	char(1)	O valor true (`t`) indica que a tabela externa está particionada.
is_rrscan	char(1)	O valor true (`t`) indica que uma varredura restrita ao intervalo foi aplicada.
is_nested	varchar(1)	O valor true (`t`) indica que o tipo de dados da coluna aninhada é acessado.
s3_scanned_rows	bigint	O número de linhas digitalizadas do Amazon S3 e enviadas para a camada do Redshift Spectrum. Em clusters RG provisionados, esse é o número total de linhas digitalizadas diretamente do Amazon S3 pelo leitor nativo do cluster em todas as fatias, antes do envio do filtro.
s3_scanned_bytes	bigint	O número de bytes verificados do Amazon S3 e enviados para a camada do Redshift Spectrum, com base em dados compactados. Em clusters RG provisionados, esse é o número total de bytes digitalizados diretamente do Amazon S3 pelo leitor nativo do cluster em todas as fatias, antes do envio do filtro.
s3query_returned_rows	bigint	O número de linhas retornadas da camada do Redshift Spectrum para o cluster. Em clusters RG provisionados, esse é o número total de linhas retornadas pelo leitor nativo do cluster em todas as fatias, antes do envio do filtro.
s3query_returned_bytes	bigint	O número de bytes retornados da camada do Redshift Spectrum para o cluster. Uma grande quantidade de dados retornados ao Amazon Redshift pode afetar a performance do sistema. Em clusters RG provisionados, esse é o número total de bytes retornados pelo leitor nativo do cluster em todas as fatias, antes do envio do filtro.
files	integer	O número de arquivos que foram processados para esta consulta do data lake. Um número pequeno de arquivos limita os benefícios do processamento paralelo.
files_max	integer	O número máximo de arquivos processados em uma fatia.
files_avg	integer	O número médio de arquivos processados em uma fatia.
splits	bigint	O número de divisões processadas para este segmento. O número de divisões processadas nesta fatia. Com arquivos de dados grandes que podem ser divididos, por exemplo, arquivos de dados maiores do que 512 MB, o Redshift Spectrum tenta dividir os arquivos em várias solicitações do S3 para o processamento paralelo.
splits_max	integer	O número máximo de divisões processadas nesta fatia.
splits_avg	bigint	O número médio de divisões processadas nesta fatia.
total_split_size	bigint	O tamanho total de todas as divisões processadas.
max_split_size	bigint	O tamanho máximo da divisão processada, em bytes.
avg_split_size	bigint	O tamanho médio da divisão processada, em bytes.
total_retries	bigint	O número total de novas tentativas para a consulta do Redshift Spectrum neste segmento. Em clusters do tipo de nó RG, essa coluna está obsoleta e contém -1. Para novas tentativas do cliente do Amazon S3 no RG, consulte `STL_S3CLIENT`.
max_retries	integer	O número máximo de novas tentativas para um arquivo individual processado. Em clusters do tipo de nó RG, essa coluna está obsoleta e contém -1. Para novas tentativas do cliente do Amazon S3 no RG, consulte `STL_S3CLIENT`.
max_request_duration	bigint	A duração máxima de uma solicitação de arquivo individual (em microssegundos). As consultas de longa duração podem indicar um gargalo. Em clusters do tipo de nó RG, essa coluna está obsoleta e contém -1.
avg_request_duration	bigint	A duração média das solicitações de arquivos (em microssegundos). Em clusters do tipo de nó RG, essa coluna está obsoleta e contém -1.
max_request_parallelism	integer	O número máximo de solicitações paralelas em uma fatia para esta consulta do Redshift Spectrum. Em clusters do tipo de nó RG, essa coluna está obsoleta e contém -1.
avg_request_parallelism	double precision	O número médio de solicitações paralelas em uma fatia para esta consulta do Redshift Spectrum. Em clusters do tipo de nó RG, essa coluna está obsoleta e contém -1.
total_slowdown_count	bigint	O número total de solicitações do Amazon S3 com um erro de desaceleração ocorrido durante a varredura da tabela externa. Em clusters do tipo de nó RG, essa coluna está obsoleta e contém -1.
max_slowdown_count	integer	O número máximo de solicitações do Amazon S3 com um erro de desaceleração que ocorreu durante a varredura de tabela externa em um slice. Em clusters do tipo de nó RG, essa coluna está obsoleta e contém -1.

Consulta de exemplo

O exemplo a seguir obtém os detalhes da etapa de varredura da última consulta executada.


select query, segment, elapsed, s3_scanned_rows, s3_scanned_bytes, s3query_returned_rows, s3query_returned_bytes, files 
from svcs_s3query_summary 
where query = pg_last_query_id() 
order by query,segment;

query | segment | elapsed | s3_scanned_rows | s3_scanned_bytes | s3query_returned_rows | s3query_returned_bytes | files
------+---------+---------+-----------------+------------------+-----------------------+------------------------+------               
 4587 |       2 |   67811 |               0 |                0 |                     0 |                      0 |     0
 4587 |       2 |  591568 |          172462 |         11260097 |                  8513 |                 170260 |     1
 4587 |       2 |  216849 |               0 |                0 |                     0 |                      0 |     0
 4587 |       2 |  216671 |               0 |                0 |                     0 |                      0 |     0

Atenção O Javascript está desativado ou não está disponível no seu navegador.

Para usar a documentação da AWS, o Javascript deve estar ativado. Consulte as páginas de Ajuda do navegador para obter instruções.

Convenções do documento

SVCS_S3PARTITION_SUMMARY

SVCS_STREAM_SEGS