Amazon Redshift unterstützt die Verwendung von Python-UDFs nach dem 30. Juni 2026 nicht mehr. Wir werden damit beginnen, es schrittweise durchzusetzen. Weitere Informationen zu den Einzelheiten zum Ende der Lebensdauer und zu den Migrationsoptionen von Python finden Sie in dem Blogbeitrag, der am 30. Juni 2025 veröffentlicht wurde.

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

SVL_S3QUERY

Verwenden Sie die Ansicht SVL_S3QUERY, um Details zu Data-Lake-Abfragen auf Segment- und Node-Slice-Ebene abzurufen.

SVL_S3QUERY ist für alle Benutzer sichtbar. Superuser können alle Zeilen sehen; reguläre Benutzer können nur ihre eigenen Daten sehen. Weitere Informationen finden Sie unter Sichtbarkeit der Daten in Systemtabellen und Ansichten.

Anmerkung

SVL_S3QUERY enthält nur Abfragen, die auf bereitgestellten Haupt-Clustern ausgeführt werden. Abfragen, die auf Parallelitätsskalierungs-Clustern oder in Serverless-Namespaces ausgeführt werden, sind nicht enthalten. Um auf Erklärpläne zuzugreifen, die sowohl auf Haupt-Clustern als auch auf Parallelitätsskalierungs-Clustern und in Serverless-Namespaces ausgeführt werden, empfehlen wir, die SYS-Überwachungsansicht SYS_EXTERNAL_QUERY_DETAIL zu verwenden. Die Daten in der SYS-Überwachungsansicht sind so formatiert, dass sie leichter verwendbar und besser verständlich sind.

Tabellenspalten

Spaltenname	Datentyp	Beschreibung
userid	integer	Die ID des Benutzers, der einen bestimmten Eintrag generiert hat.
query	integer	Die Abfrage-ID.
segment	integer	Eine Segmentnummer. Eine Abfrage besteht aus mehreren Segmenten, und jedes Segment besteht aus einem oder mehreren Schritten.
Schritt	integer	Der Abfrage-Schritt, der ausgeführt wurde.
Knoten	integer	Die Knotennummer.
slice	integer	Der Daten-Slice, für den ein bestimmtes Segment ausgeführt wurde.
starttime	timestamp	Zeitpunkt nach UTC, an dem die Ausführung der Abfrage gestartet wurde.
endtime	timestamp	Zeitpunkt nach UTC, an dem die Ausführung der Abfrage abgeschlossen wurde.
elapsed	integer	Verstrichene Zeit (in Mikrosekunden)
external_table_name	char(136)	Internes Format des Namens der externen Tabelle für den s3-scan-Schritt.
is_partitioned	char(1)	Wenn „true“ (`t`) zeigt dieser Spaltenwert an, dass die externe Tabelle partitioniert ist.
is_rrscan	char(1)	Wenn „true“ (`t`) zeigt dieser Spaltenwert an, dass ein Scan mit Bereichseinschränkung durchgeführt wurde.
s3_scanned_rows	bigint	Die Anzahl der von Amazon S3 gescannten und an die Redshift-Spectrum-Ebene gesendeten Zeilen. Bei von RG bereitgestellten Clustern ist dies die Anzahl der Zeilen, die vom systemeigenen Reader des Clusters direkt aus Amazon S3 gelesen wurden, bevor der Filter-Pushdown erfolgt.
s3_scanned_bytes	bigint	Die Anzahl der von Amazon S3 gescannten und an die Redshift-Spectrum-Ebene gesendeten Bytes. Bei von RG bereitgestellten Clustern ist dies die Gesamtgröße des Scanbereichs in Byte, die vom systemeigenen Reader des Clusters verarbeitet wird.
s3query_returned_rows	bigint	Die Anzahl der von der Redshift Spectrum-Ebene an den Cluster zurückgegebenen Zeilen. Bei von RG bereitgestellten Clustern ist dies die Anzahl der Zeilen, die beim externen Tabellenscan nach dem Filter-Pushdown erzeugt wurden.
s3query_returned_bytes	bigint	Die Anzahl der von der Redshift Spectrum-Ebene an den Cluster zurückgegebenen Bytes. Auf von RG bereitgestellten Clustern ist dies die Anzahl der Byte, die beim externen Tabellenscan nach dem Filter-Pushdown erzeugt wurden.
files	integer	Die Anzahl der Dateien, die für diesen S3-Scan-Schritt auf diesem Slice verarbeitet wurden.
splits	int	Die Anzahl der Aufteilungen, die in diesem Slice verarbeitet wurden. Bei großen aufteilbaren Datendateien versucht Redshift Spectrum beispielsweise bei Dateigrößen über 512 MB, die Dateien zur parallelen Verarbeitung auf mehrere S3-Anforderungen aufzuteilen. Bei von RG bereitgestellten Clustern ist dies die Anzahl der Scanbereiche, die vom systemeigenen Reader des Clusters verwendet werden.
total_split_size	bigint	Die Gesamtgröße aller Aufteilungen, die in diesem Slice verarbeitet wurden (in Bytes) Bei von RG bereitgestellten Clustern ist dies die Gesamtgröße aller verbrauchten Scanbereiche in Byte.
max_split_size	bigint	Die maximale Aufteilungsgröße, die in diesem Slice verarbeitet wurden (in Bytes) Bei von RG bereitgestellten Clustern ist dies die Größe des größten verbrauchten Scanbereichs in Byte.
total_retries	integer	Die Gesamtzahl der erneuten Versuche für die verarbeiteten Dateien. Bei Clustern vom Typ RG-Knoten ist diese Spalte veraltet und enthält -1. Informationen zu Wiederholungen von Amazon S3 S3-Clients auf RG finden Sie unter. `STL_S3CLIENT`
max_retries	integer	Die maximale Zahl erneuter Versuche für eine einzelne verarbeitete Datei. Bei Clustern vom Typ RG-Knoten ist diese Spalte veraltet und enthält -1. Informationen zu Wiederholungen von Amazon S3 S3-Clients auf RG finden Sie unter. `STL_S3CLIENT`
max_request_duration	integer	Die maximale Dauer einer einzelnen Redshift Spectrum-Anfrage (in Mikrosekunden) Bei Clustern vom Typ RG-Knoten ist diese Spalte veraltet und enthält -1.
avg_request_duration	double precision	Die durchschnittliche Dauer der Redshift Spectrum-Anfragen (in Mikrosekunden) Bei Clustern vom Typ RG-Knoten ist diese Spalte veraltet und enthält -1.
max_request_parallelism	integer	Die maximale Anzahl ausstehender Redshift Spectrum-Anfragen auf diesem Slice für diesen S3-Scan-Schritt. Bei Clustern vom Typ RG-Knoten ist diese Spalte veraltet und enthält -1.
avg_request_parallelism	double precision	Die durchschnittliche Anzahl paralleler Redshift Spectrum-Anfragen auf diesem Slice für diesen S3-Scan-Schritt. Bei Clustern vom Typ RG-Knoten ist diese Spalte veraltet und enthält -1.

Beispielabfrage

Das folgende Beispiel ruft die Scanschritt-Details für die letzte ausgeführte Abfrage ab.


select query, segment, slice, elapsed, s3_scanned_rows, s3_scanned_bytes, s3query_returned_rows, s3query_returned_bytes, files 
from svl_s3query 
where query = pg_last_query_id() 
order by query,segment,slice;

query | segment | slice | elapsed | s3_scanned_rows | s3_scanned_bytes | s3query_returned_rows | s3query_returned_bytes | files
------+---------+-------+---------+-----------------+------------------+-----------------------+------------------------+------
 4587 |       2 |     0 |   67811 |               0 |                0 |                     0 |                      0 |     0
 4587 |       2 |     1 |  591568 |          172462 |         11260097 |                  8513 |                 170260 |     1
 4587 |       2 |     2 |  216849 |               0 |                0 |                     0 |                      0 |     0
 4587 |       2 |     3 |  216671 |               0 |                0 |                     0 |                      0 |     0

Warnung JavaScript ist in Ihrem Browser nicht verfügbar oder deaktiviert.

Zur Nutzung der AWS-Dokumentation muss JavaScript aktiviert sein. Weitere Informationen finden auf den Hilfe-Seiten Ihres Browsers.

Dokumentkonventionen

SVL_S3PARTITION_SUMMARY

SVL_S3QUERY_SUMMARY