View a markdown version of this page

SVL_S3QUERY - Amazon Redshift

Amazon Redshift unterstützt ab Patch 198 nicht mehr die Erstellung neuer Python-UDFs. Bestehende Python-UDFs werden bis zum 30. Juni 2026 weiterhin funktionieren. Weitere Informationen finden Sie im Blog-Posting.

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

SVL_S3QUERY

Verwenden Sie die Ansicht SVL_S3QUERY, um Details zu Data-Lake-Abfragen auf Segment- und Node-Slice-Ebene abzurufen.

SVL_S3QUERY ist für alle Benutzer sichtbar. Superuser können alle Zeilen sehen; reguläre Benutzer können nur ihre eigenen Daten sehen. Weitere Informationen finden Sie unter Sichtbarkeit der Daten in Systemtabellen und Ansichten.

Anmerkung

SVL_S3QUERY enthält nur Abfragen, die auf bereitgestellten Haupt-Clustern ausgeführt werden. Abfragen, die auf Parallelitätsskalierungs-Clustern oder in Serverless-Namespaces ausgeführt werden, sind nicht enthalten. Um auf Erklärpläne zuzugreifen, die sowohl auf Haupt-Clustern als auch auf Parallelitätsskalierungs-Clustern und in Serverless-Namespaces ausgeführt werden, empfehlen wir, die SYS-Überwachungsansicht SYS_EXTERNAL_QUERY_DETAIL zu verwenden. Die Daten in der SYS-Überwachungsansicht sind so formatiert, dass sie leichter verwendbar und besser verständlich sind.

Tabellenspalten

Spaltenname Datentyp Beschreibung
userid integer Die ID des Benutzers, der einen bestimmten Eintrag generiert hat.
query integer Die Abfrage-ID.
segment integer Eine Segmentnummer. Eine Abfrage besteht aus mehreren Segmenten, und jedes Segment besteht aus einem oder mehreren Schritten.
Schritt integer Der Abfrage-Schritt, der ausgeführt wurde.
Knoten integer Die Knotennummer.
slice integer Der Daten-Slice, für den ein bestimmtes Segment ausgeführt wurde.
starttime timestamp Zeitpunkt nach UTC, an dem die Ausführung der Abfrage gestartet wurde.
endtime timestamp Zeitpunkt nach UTC, an dem die Ausführung der Abfrage abgeschlossen wurde.
elapsed integer Verstrichene Zeit (in Mikrosekunden)
external_table_name char(136) Internes Format des Namens der externen Tabelle für den s3-scan-Schritt.
is_partitioned char(1) Wenn „true“ (t) zeigt dieser Spaltenwert an, dass die externe Tabelle partitioniert ist.
is_rrscan char(1) Wenn „true“ (t) zeigt dieser Spaltenwert an, dass ein Scan mit Bereichseinschränkung durchgeführt wurde.
s3_scanned_rows bigint Die Anzahl der von Amazon S3 gescannten und an die Redshift-Spectrum-Ebene gesendeten Zeilen. Bei von RG bereitgestellten Clustern ist dies die Anzahl der Zeilen, die vom systemeigenen Reader des Clusters direkt aus Amazon S3 gelesen wurden, bevor der Filter-Pushdown erfolgt.
s3_scanned_bytes bigint Die Anzahl der von Amazon S3 gescannten und an die Redshift-Spectrum-Ebene gesendeten Bytes. Bei von RG bereitgestellten Clustern ist dies die Gesamtgröße des Scanbereichs in Byte, die vom systemeigenen Reader des Clusters verarbeitet wird.
s3query_returned_rows bigint Die Anzahl der von der Redshift Spectrum-Ebene an den Cluster zurückgegebenen Zeilen. Bei von RG bereitgestellten Clustern ist dies die Anzahl der Zeilen, die beim externen Tabellenscan nach dem Filter-Pushdown erzeugt wurden.
s3query_returned_bytes bigint Die Anzahl der von der Redshift Spectrum-Ebene an den Cluster zurückgegebenen Bytes. Auf von RG bereitgestellten Clustern ist dies die Anzahl der Byte, die beim externen Tabellenscan nach dem Filter-Pushdown erzeugt wurden.
files integer Die Anzahl der Dateien, die für diesen S3-Scan-Schritt auf diesem Slice verarbeitet wurden.
splits int Die Anzahl der Aufteilungen, die in diesem Slice verarbeitet wurden. Bei großen aufteilbaren Datendateien versucht Redshift Spectrum beispielsweise bei Dateigrößen über 512 MB, die Dateien zur parallelen Verarbeitung auf mehrere S3-Anforderungen aufzuteilen. Bei von RG bereitgestellten Clustern ist dies die Anzahl der Scanbereiche, die vom systemeigenen Reader des Clusters verwendet werden.
total_split_size bigint Die Gesamtgröße aller Aufteilungen, die in diesem Slice verarbeitet wurden (in Bytes) Bei von RG bereitgestellten Clustern ist dies die Gesamtgröße aller verbrauchten Scanbereiche in Byte.
max_split_size bigint Die maximale Aufteilungsgröße, die in diesem Slice verarbeitet wurden (in Bytes) Bei von RG bereitgestellten Clustern ist dies die Größe des größten verbrauchten Scanbereichs in Byte.
total_retries integer Die Gesamtzahl der erneuten Versuche für die verarbeiteten Dateien. Bei Clustern vom Typ RG-Knoten ist diese Spalte veraltet und enthält -1. Informationen zu Wiederholungen von Amazon S3 S3-Clients auf RG finden Sie unter. STL_S3CLIENT
max_retries integer Die maximale Zahl erneuter Versuche für eine einzelne verarbeitete Datei. Bei Clustern vom Typ RG-Knoten ist diese Spalte veraltet und enthält -1. Informationen zu Wiederholungen von Amazon S3 S3-Clients auf RG finden Sie unter. STL_S3CLIENT
max_request_duration integer Die maximale Dauer einer einzelnen Redshift Spectrum-Anfrage (in Mikrosekunden) Bei Clustern vom Typ RG-Knoten ist diese Spalte veraltet und enthält -1.
avg_request_duration double precision Die durchschnittliche Dauer der Redshift Spectrum-Anfragen (in Mikrosekunden) Bei Clustern vom Typ RG-Knoten ist diese Spalte veraltet und enthält -1.
max_request_parallelism integer Die maximale Anzahl ausstehender Redshift Spectrum-Anfragen auf diesem Slice für diesen S3-Scan-Schritt. Bei Clustern vom Typ RG-Knoten ist diese Spalte veraltet und enthält -1.
avg_request_parallelism double precision Die durchschnittliche Anzahl paralleler Redshift Spectrum-Anfragen auf diesem Slice für diesen S3-Scan-Schritt. Bei Clustern vom Typ RG-Knoten ist diese Spalte veraltet und enthält -1.

Beispielabfrage

Das folgende Beispiel ruft die Scanschritt-Details für die letzte ausgeführte Abfrage ab.

select query, segment, slice, elapsed, s3_scanned_rows, s3_scanned_bytes, s3query_returned_rows, s3query_returned_bytes, files from svl_s3query where query = pg_last_query_id() order by query,segment,slice;
query | segment | slice | elapsed | s3_scanned_rows | s3_scanned_bytes | s3query_returned_rows | s3query_returned_bytes | files
------+---------+-------+---------+-----------------+------------------+-----------------------+------------------------+------
 4587 |       2 |     0 |   67811 |               0 |                0 |                     0 |                      0 |     0
 4587 |       2 |     1 |  591568 |          172462 |         11260097 |                  8513 |                 170260 |     1
 4587 |       2 |     2 |  216849 |               0 |                0 |                     0 |                      0 |     0
 4587 |       2 |     3 |  216671 |               0 |                0 |                     0 |                      0 |     0