View a markdown version of this page

Metriken in Amazon Redshift Spectrum - Amazon Redshift

Amazon Redshift unterstützt ab Patch 198 nicht mehr die Erstellung neuer Python-UDFs. Bestehende Python-UDFs werden bis zum 30. Juni 2026 weiterhin funktionieren. Weitere Informationen finden Sie im Blog-Posting.

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Metriken in Amazon Redshift Spectrum

In diesem Thema werden Systemansichten beschrieben, mit denen Sie Data Lake-Abfragen überwachen können.

Sie können Data Lake-Abfragen mithilfe der folgenden Systemansichten überwachen:

  • SVL_S3QUERY

    Verwenden Sie die Ansicht SVL_S3QUERY, um Details zu Data-Lake-Abfragen auf Segment- und Node-Slice-Ebene abzurufen.

  • SVL_S3QUERY_SUMMARY

    Verwenden Sie die Ansicht SVL_S3QUERY_SUMMARY, um eine Zusammenfassung aller Data Lake-Abfragen zu erhalten, die auf dem System ausgeführt wurden.

Nachfolgend finden Sie einige Aspekte, auf die Sie in SVL_S3QUERY_SUMMARY achten sollten:

  • Die Anzahl der Dateien, die von der Redshift Spectrum-Abfrage verarbeitet wurden.

  • Die Anzahl der von Amazon S3 gescannten Bytes. Die Kosten für eine Redshift-Spectrum-Abfrage richten sich nach der Menge der von Amazon S3 gescannten Daten.

  • Die Anzahl der von der Redshift Spectrum-Ebene an den Cluster zurückgegebenen Bytes. Eine große Menge zurückgegebener Daten kann sich auf die Systemleistung auswirken.

  • Die maximale Dauer und durchschnittliche Dauer von Redshift Spectrum-Anfragen. Long-running Anfragen könnten auf einen Engpass hindeuten.

Hinweis zu von RG bereitgestellten Clustern

Auf von RG bereitgestellten Clustern werden Redshift Spectrum-Abfragen auf dem eigenen Computer des Clusters ausgeführt und nicht auf der dedizierten Spectrum-Flotte, die von RA3- und DC2-bereitgestellten Clustern verwendet wird. SVL_S3QUERYund werden SVL_S3QUERY_SUMMARYweiterhin auf RG-Clustern gefüllt. Die folgenden Spalten haben eine andere Semantik oder sind veraltet.

Spalten, die auf von RG bereitgestellten Clustern mit unterschiedlicher Semantik gefüllt sind

Auf von RA3 und DC2 bereitgestellten Clustern beschreiben diese Spalten Zeilen, Bytes und Arbeitseinheiten, die sich zwischen dem Cluster und der Spectrum-Flotte bewegen. Auf von RG bereitgestellten Clustern beschreiben sie die entsprechende Arbeit, die vom systemeigenen Reader des Clusters ausgeführt wird:

  • s3_scanned_rows — Zeilen, die vom nativen Reader des Clusters direkt aus Amazon S3 gelesen werden (Vorfilter).

  • s3_scanned_bytes — Gesamtgröße des Scanbereichs in Byte, verarbeitet vom systemeigenen Reader des Clusters.

  • s3query_returned_rows — Zeilen, die nach dem Herunterfahren des Filters durch den systemeigenen Reader des Clusters erzeugt wurden.

  • s3query_returned_bytes — Byte, die nach einem Filter-Pushdown durch den systemeigenen Reader des Clusters erzeugt wurden.

  • Splits — Anzahl der Scanbereiche, die vom systemeigenen Reader des Clusters verwendet wurden.

  • total_split_size — Gesamtgröße aller verbrauchten Scanbereiche in Byte.

  • max_split_size — Größe des größten verbrauchten Scanbereichs in Byte.

Spalten sind auf von RG bereitgestellten Clustern veraltet

In diesen Spalten werden Spectrum-fleet Konzepte beschrieben, die es auf RG nicht gibt. Auf RG-Clustern werden sie in STL_S3QUERY als -1 protokolliert und erscheinen daher als -1 oder sind in SVL_S3QUERY und SVL_S3QUERY_SUMMARY nicht aussagekräftig:

  • total_retries, max_retries — Auf RG erfolgen Wiederholungen auf Amazon S3 S3-Client-Ebene. Verwenden Sie STL_S3CLIENT und STL_S3CLIENT_ERROR für Details zu Wiederholungsversuchen.

  • max_request_duration, avg_request_duration — RG verwendet das Spectrum-Anforderungsmodell nicht.

  • max_request_parallelism, avg_request_parallelism — RG verwendet keine Spectrum-Anforderungstoken.

  • slowdown_count, max_concurrent_slowdown_count — Auf RG werden Amazon S3 S3-Verlangsamungen in STL_S3CLIENT verfolgt.

Für aggregierte Metriken pro Abfrage für RG-Cluster (Partitionen, gescannte Dateien, zurückgegebene Zeilen und Byte, Dateiformat, Dateispeicherort, Liste und Zeitpunkt des Abrufs von Partitionen) können Sie auch die Überwachungsansicht verwenden. SYS_EXTERNAL_QUERY_DETAIL