O Amazon Redshift não permitirá mais a criação de UDFs do Python a partir do Patch 198. As UDFs do Python existentes continuarão a funcionar normalmente até 30 de junho de 2026. Para ter mais informações, consulte a publicação de blog
SVCS_S3QUERY_SUMMARY
Use a visualização SVCS_S3QUERY_SUMMARY para obter um resumo de todas as consultas de data lake que foram executadas no sistema. Um segmento pode executar uma varredura de tabela externa.
nota
Visualizações do sistema com o prefixo SVCS fornecem detalhes sobre consultas nos clusters principal e de escalabilidade da simultaneidade. As visualizações são semelhantes às visualizações com o prefixo SVL, exceto que as visualizações SVL fornecem informações somente para consultas executadas no cluster principal.
SVCS_S3QUERY_SUMMARY é visível para todos os usuários. Os superusuários podem ver todas as linhas; usuários regulares podem ver somente seus próprios dados. Para obter mais informações, consulte Visibilidade de dados em tabelas e visualizações de sistema.
Para obter informações sobre SVL_S3QUERY, consulte SVL_S3QUERY.
Colunas da tabela
| Nome da coluna | Tipo de dados | Descrição |
|---|---|---|
| userid | integer | O ID do usuário que gerou determinada entrada. |
| consultar | integer | O ID da consulta. Este valor pode ser usado para unir várias outras tabelas e exibições do sistema. |
| xid | bigint | O ID da transação. |
| pid | integer | O ID do processo. |
| segment | integer | O número do segmento. Uma consulta consiste em vários segmentos e cada segmento consiste em uma ou mais etapas. |
| etapa | integer | A etapa da consulta que foi executada. |
| starttime | timestamp | A hora em UTC em que a consulta do Redshift Spectrum neste segmento começou a ser executada. Um segmento pode ter uma varredura de tabela externa. |
| endtime | timestamp | A hora em UTC que a consulta do Redshift Spectrum neste segmento foi concluída. Um segmento pode ter uma varredura de tabela externa. |
| elapsed | integer | O tempo que a consulta do Redshift Spectrum levou para ser executada neste segmento (em microssegundos). |
| aborted | integer | Se uma consulta for interrompida pelo sistema ou cancelada pelo usuário, essa coluna terá o valor 1. Se a consulta foi executada até o final, essa coluna conterá 0. |
| external_table_name | char(136) | O formato interno do nome externo da tabela para a varredura da tabela externa. |
| file_format | character(16) | O formato de arquivo dos dados da tabela externa. |
| is_partitioned | char(1) | O valor true (t) indica que a tabela externa está particionada. |
| is_rrscan | char(1) | O valor true (t) indica que uma varredura restrita ao intervalo foi aplicada. |
| is_nested | varchar(1) | O valor true (t) indica que o tipo de dados da coluna aninhada é acessado. |
| s3_scanned_rows | bigint | O número de linhas digitalizadas do Amazon S3 e enviadas para a camada do Redshift Spectrum. Em clusters RG provisionados, esse é o número total de linhas digitalizadas diretamente do Amazon S3 pelo leitor nativo do cluster em todas as fatias, antes do envio do filtro. |
| s3_scanned_bytes | bigint | O número de bytes verificados do Amazon S3 e enviados para a camada do Redshift Spectrum, com base em dados compactados. Em clusters RG provisionados, esse é o número total de bytes digitalizados diretamente do Amazon S3 pelo leitor nativo do cluster em todas as fatias, antes do envio do filtro. |
| s3query_returned_rows | bigint | O número de linhas retornadas da camada do Redshift Spectrum para o cluster. Em clusters RG provisionados, esse é o número total de linhas retornadas pelo leitor nativo do cluster em todas as fatias, antes do envio do filtro. |
| s3query_returned_bytes | bigint | O número de bytes retornados da camada do Redshift Spectrum para o cluster. Uma grande quantidade de dados retornados ao Amazon Redshift pode afetar a performance do sistema. Em clusters RG provisionados, esse é o número total de bytes retornados pelo leitor nativo do cluster em todas as fatias, antes do envio do filtro. |
| files | integer | O número de arquivos que foram processados para esta consulta do data lake. Um número pequeno de arquivos limita os benefícios do processamento paralelo. |
| files_max | integer | O número máximo de arquivos processados em uma fatia. |
| files_avg | integer | O número médio de arquivos processados em uma fatia. |
| splits | bigint | O número de divisões processadas para este segmento. O número de divisões processadas nesta fatia. Com arquivos de dados grandes que podem ser divididos, por exemplo, arquivos de dados maiores do que 512 MB, o Redshift Spectrum tenta dividir os arquivos em várias solicitações do S3 para o processamento paralelo. |
| splits_max | integer | O número máximo de divisões processadas nesta fatia. |
| splits_avg | bigint | O número médio de divisões processadas nesta fatia. |
| total_split_size | bigint | O tamanho total de todas as divisões processadas. |
| max_split_size | bigint | O tamanho máximo da divisão processada, em bytes. |
| avg_split_size | bigint | O tamanho médio da divisão processada, em bytes. |
| total_retries | bigint | O número total de novas tentativas para a consulta do Redshift Spectrum neste segmento. Em clusters do tipo de nó RG, essa coluna está obsoleta e contém -1. Para novas tentativas do cliente do Amazon S3 no RG, consulte STL_S3CLIENT. |
| max_retries | integer | O número máximo de novas tentativas para um arquivo individual processado. Em clusters do tipo de nó RG, essa coluna está obsoleta e contém -1. Para novas tentativas do cliente do Amazon S3 no RG, consulte STL_S3CLIENT. |
| max_request_duration | bigint | A duração máxima de uma solicitação de arquivo individual (em microssegundos). As consultas de longa duração podem indicar um gargalo. Em clusters do tipo de nó RG, essa coluna está obsoleta e contém -1. |
| avg_request_duration | bigint | A duração média das solicitações de arquivos (em microssegundos). Em clusters do tipo de nó RG, essa coluna está obsoleta e contém -1. |
| max_request_parallelism | integer | O número máximo de solicitações paralelas em uma fatia para esta consulta do Redshift Spectrum. Em clusters do tipo de nó RG, essa coluna está obsoleta e contém -1. |
| avg_request_parallelism | double precision | O número médio de solicitações paralelas em uma fatia para esta consulta do Redshift Spectrum. Em clusters do tipo de nó RG, essa coluna está obsoleta e contém -1. |
| total_slowdown_count | bigint | O número total de solicitações do Amazon S3 com um erro de desaceleração ocorrido durante a varredura da tabela externa. Em clusters do tipo de nó RG, essa coluna está obsoleta e contém -1. |
| max_slowdown_count | integer | O número máximo de solicitações do Amazon S3 com um erro de desaceleração que ocorreu durante a varredura de tabela externa em um slice. Em clusters do tipo de nó RG, essa coluna está obsoleta e contém -1. |
Consulta de exemplo
O exemplo a seguir obtém os detalhes da etapa de varredura da última consulta executada.
select query, segment, elapsed, s3_scanned_rows, s3_scanned_bytes, s3query_returned_rows, s3query_returned_bytes, files from svcs_s3query_summary where query = pg_last_query_id() order by query,segment;
query | segment | elapsed | s3_scanned_rows | s3_scanned_bytes | s3query_returned_rows | s3query_returned_bytes | files ------+---------+---------+-----------------+------------------+-----------------------+------------------------+------ 4587 | 2 | 67811 | 0 | 0 | 0 | 0 | 0 4587 | 2 | 591568 | 172462 | 11260097 | 8513 | 170260 | 1 4587 | 2 | 216849 | 0 | 0 | 0 | 0 | 0 4587 | 2 | 216671 | 0 | 0 | 0 | 0 | 0