View a markdown version of this page

Amazon Redshift Spectrum でのメトリクス - Amazon Redshift

Amazon Redshift は、パッチ 198 以降、新しい Python UDF の作成をサポートしなくなります。既存の Python UDF は、2026 年 6 月 30 日まで引き続き機能します。詳細については、ブログ記事を参照してください。

Amazon Redshift Spectrum でのメトリクス

このトピックでは、データレイククエリのモニタリングに使用できるシステムビューについて説明します。

次のシステムビューを使用して、データレイククエリをモニタリングできます。

  • SVL_S3QUERY

    SVL_S3QUERY ビューを使用して、セグメントおよびノードスライスレベルでデータレイククエリの詳細を確認します。

  • SVL_S3QUERY_SUMMARY

    SVL_S3QUERY_SUMMARY ビューを使用して、システムで実行されたすべてのデータレイククエリ概要を取得します。

以下に、SVL_S3QUERY_SUMMARY の確認事項を示します。

  • Redshift Spectrum クエリで処理されたファイル数。

  • Amazon S3 からスキャンされたバイト数。Redshift Spectrum クエリの料金は、Amazon S3 からスキャンされたデータ量に反映されます。

  • Redshift Spectrum レイヤーからクラスターに返されたバイト数。大量のデータが返されると、システムパフォーマンスに影響が及ぶ可能性があります。

  • Redshift Spectrum リクエストの最長時間と平均時間。実行時間の長いリクエストはボトルネックの可能性があります。

RG でプロビジョニングされたクラスターに関する注意

RG でプロビジョニングされたクラスターでは、Redshift Spectrum クエリは、RA3 および DC2 でプロビジョニングされたクラスターで使用される専用の Spectrum フリートではなく、クラスター独自のコンピューティングで実行されます。SVL_S3QUERY および SVL_S3QUERY_SUMMARY は、引き続き RG クラスターで入力されます。以下の列については、セマンティクスが異なるか、非推奨となっています。

RG でプロビジョニングされたクラスターに異なるセマンティクスが入力された列

RA3 および DC2 でプロビジョニングされたクラスターでは、これらの列はクラスターと Spectrum フリートの間を移動する行、バイト、および作業単位を記述します。RG でプロビジョニングされたクラスターでは、クラスターのネイティブリーダーによって実行される同等の作業を記述します。

  • s3_scanned_rows — クラスターのネイティブリーダー (事前フィルター) によって Amazon S3 から直接読み取られた行数。

  • s3_scanned_bytes — クラスターのネイティブリーダーによって処理された合計スキャン範囲サイズ (バイト単位)。

  • s3query_returned_rows — クラスターのネイティブリーダーによるフィルタープッシュダウン後に生成された行数。

  • s3query_returned_bytes — クラスターのネイティブリーダーによるフィルタープッシュダウン後に生成されたバイト数。

  • splits — クラスターのネイティブリーダーが消費したスキャン範囲の数。

  • total_split_size — 消費されたすべてのスキャン範囲の合計サイズ (バイト単位)。

  • max_split_size — 消費された最大スキャン範囲のサイズ (バイト単位)。

RG でプロビジョニングされたクラスターで非推奨の列

これらの列は、RG に存在しない Spectrum フリートの概念を表しています。RG クラスターでは、これらの列は STL_S3QUERY において -1 としてログに記録されます。そのため、SVL_S3QUERY および SVL_S3QUERY_SUMMARY では -1 と表示されるか、意味のある値を持ちません。

  • total_retriesmax_retries — RG では、再試行は Amazon S3 クライアントレベルで行われます。再試行の詳細については、STL_S3CLIENT と STL_S3CLIENT_ERROR を使用します。

  • max_request_durationavg_request_duration — RG は Spectrum リクエストモデルを使用しません。

  • max_request_parallelismavg_request_parallelism — RG は Spectrum リクエストトークンを使用しません。

  • slowdown_countmax_concurrent_slowdown_count — RG では、Amazon S3 のスローダウンは STL_S3CLIENT で追跡されます。

RG クラスター (パーティション、スキャンされたファイル、返された行とバイト、ファイル形式、ファイルの場所、一覧表示とパーティション取得のタイミング) のクエリごとの集計メトリクスについては、SYS_EXTERNAL_QUERY_DETAIL モニタリングビューを使用することもできます。