View a markdown version of this page

SVCS_S3QUERY_SUMMARY - Amazon Redshift

O Amazon Redshift não permitirá mais a criação de UDFs do Python a partir do Patch 198. As UDFs do Python existentes continuarão a funcionar normalmente até 30 de junho de 2026. Para ter mais informações, consulte a publicação de blog .

SVCS_S3QUERY_SUMMARY

Use a visualização SVCS_S3QUERY_SUMMARY para obter um resumo de todas as consultas de data lake que foram executadas no sistema. Um segmento pode executar uma varredura de tabela externa.

nota

Visualizações do sistema com o prefixo SVCS fornecem detalhes sobre consultas nos clusters principal e de escalabilidade da simultaneidade. As visualizações são semelhantes às visualizações com o prefixo SVL, exceto que as visualizações SVL fornecem informações somente para consultas executadas no cluster principal.

SVCS_S3QUERY_SUMMARY é visível para todos os usuários. Os superusuários podem ver todas as linhas; usuários regulares podem ver somente seus próprios dados. Para obter mais informações, consulte Visibilidade de dados em tabelas e visualizações de sistema.

Para obter informações sobre SVL_S3QUERY, consulte SVL_S3QUERY.

Colunas da tabela

Nome da coluna Tipo de dados Descrição
userid integer O ID do usuário que gerou determinada entrada.
consultar integer O ID da consulta. Este valor pode ser usado para unir várias outras tabelas e exibições do sistema.
xid bigint O ID da transação.
pid integer O ID do processo.
segment integer O número do segmento. Uma consulta consiste em vários segmentos e cada segmento consiste em uma ou mais etapas.
etapa integer A etapa da consulta que foi executada.
starttime timestamp A hora em UTC em que a consulta do Redshift Spectrum neste segmento começou a ser executada. Um segmento pode ter uma varredura de tabela externa.
endtime timestamp A hora em UTC que a consulta do Redshift Spectrum neste segmento foi concluída. Um segmento pode ter uma varredura de tabela externa.
elapsed integer O tempo que a consulta do Redshift Spectrum levou para ser executada neste segmento (em microssegundos).
aborted integer Se uma consulta for interrompida pelo sistema ou cancelada pelo usuário, essa coluna terá o valor 1. Se a consulta foi executada até o final, essa coluna conterá 0.
external_table_name char(136) O formato interno do nome externo da tabela para a varredura da tabela externa.
file_format character(16) O formato de arquivo dos dados da tabela externa.
is_partitioned char(1) O valor true (t) indica que a tabela externa está particionada.
is_rrscan char(1) O valor true (t) indica que uma varredura restrita ao intervalo foi aplicada.
is_nested varchar(1) O valor true (t) indica que o tipo de dados da coluna aninhada é acessado.
s3_scanned_rows bigint O número de linhas digitalizadas do Amazon S3 e enviadas para a camada do Redshift Spectrum. Em clusters RG provisionados, esse é o número total de linhas digitalizadas diretamente do Amazon S3 pelo leitor nativo do cluster em todas as fatias, antes do envio do filtro.
s3_scanned_bytes bigint O número de bytes verificados do Amazon S3 e enviados para a camada do Redshift Spectrum, com base em dados compactados. Em clusters RG provisionados, esse é o número total de bytes digitalizados diretamente do Amazon S3 pelo leitor nativo do cluster em todas as fatias, antes do envio do filtro.
s3query_returned_rows bigint O número de linhas retornadas da camada do Redshift Spectrum para o cluster. Em clusters RG provisionados, esse é o número total de linhas retornadas pelo leitor nativo do cluster em todas as fatias, antes do envio do filtro.
s3query_returned_bytes bigint O número de bytes retornados da camada do Redshift Spectrum para o cluster. Uma grande quantidade de dados retornados ao Amazon Redshift pode afetar a performance do sistema. Em clusters RG provisionados, esse é o número total de bytes retornados pelo leitor nativo do cluster em todas as fatias, antes do envio do filtro.
files integer O número de arquivos que foram processados para esta consulta do data lake. Um número pequeno de arquivos limita os benefícios do processamento paralelo.
files_max integer O número máximo de arquivos processados em uma fatia.
files_avg integer O número médio de arquivos processados em uma fatia.
splits bigint O número de divisões processadas para este segmento. O número de divisões processadas nesta fatia. Com arquivos de dados grandes que podem ser divididos, por exemplo, arquivos de dados maiores do que 512 MB, o Redshift Spectrum tenta dividir os arquivos em várias solicitações do S3 para o processamento paralelo.
splits_max integer O número máximo de divisões processadas nesta fatia.
splits_avg bigint O número médio de divisões processadas nesta fatia.
total_split_size bigint O tamanho total de todas as divisões processadas.
max_split_size bigint O tamanho máximo da divisão processada, em bytes.
avg_split_size bigint O tamanho médio da divisão processada, em bytes.
total_retries bigint O número total de novas tentativas para a consulta do Redshift Spectrum neste segmento. Em clusters do tipo de nó RG, essa coluna está obsoleta e contém -1. Para novas tentativas do cliente do Amazon S3 no RG, consulte STL_S3CLIENT.
max_retries integer O número máximo de novas tentativas para um arquivo individual processado. Em clusters do tipo de nó RG, essa coluna está obsoleta e contém -1. Para novas tentativas do cliente do Amazon S3 no RG, consulte STL_S3CLIENT.
max_request_duration bigint A duração máxima de uma solicitação de arquivo individual (em microssegundos). As consultas de longa duração podem indicar um gargalo. Em clusters do tipo de nó RG, essa coluna está obsoleta e contém -1.
avg_request_duration bigint A duração média das solicitações de arquivos (em microssegundos). Em clusters do tipo de nó RG, essa coluna está obsoleta e contém -1.
max_request_parallelism integer O número máximo de solicitações paralelas em uma fatia para esta consulta do Redshift Spectrum. Em clusters do tipo de nó RG, essa coluna está obsoleta e contém -1.
avg_request_parallelism double precision O número médio de solicitações paralelas em uma fatia para esta consulta do Redshift Spectrum. Em clusters do tipo de nó RG, essa coluna está obsoleta e contém -1.
total_slowdown_count bigint O número total de solicitações do Amazon S3 com um erro de desaceleração ocorrido durante a varredura da tabela externa. Em clusters do tipo de nó RG, essa coluna está obsoleta e contém -1.
max_slowdown_count integer O número máximo de solicitações do Amazon S3 com um erro de desaceleração que ocorreu durante a varredura de tabela externa em um slice. Em clusters do tipo de nó RG, essa coluna está obsoleta e contém -1.

Consulta de exemplo

O exemplo a seguir obtém os detalhes da etapa de varredura da última consulta executada.

select query, segment, elapsed, s3_scanned_rows, s3_scanned_bytes, s3query_returned_rows, s3query_returned_bytes, files from svcs_s3query_summary where query = pg_last_query_id() order by query,segment;
query | segment | elapsed | s3_scanned_rows | s3_scanned_bytes | s3query_returned_rows | s3query_returned_bytes | files
------+---------+---------+-----------------+------------------+-----------------------+------------------------+------               
 4587 |       2 |   67811 |               0 |                0 |                     0 |                      0 |     0
 4587 |       2 |  591568 |          172462 |         11260097 |                  8513 |                 170260 |     1
 4587 |       2 |  216849 |               0 |                0 |                     0 |                      0 |     0
 4587 |       2 |  216671 |               0 |                0 |                     0 |                      0 |     0