Amazon Redshift は、パッチ 198 以降、新しい Python UDF の作成をサポートしなくなります。既存の Python UDF は、2026 年 6 月 30 日まで引き続き機能します。詳細については、ブログ記事
Amazon Redshift Spectrum でのメトリクス
このトピックでは、データレイククエリのモニタリングに使用できるシステムビューについて説明します。
次のシステムビューを使用して、データレイククエリをモニタリングできます。
-
SVL_S3QUERY ビューを使用して、セグメントおよびノードスライスレベルでデータレイククエリの詳細を確認します。
-
SVL_S3QUERY_SUMMARY ビューを使用して、システムで実行されたすべてのデータレイククエリ概要を取得します。
以下に、SVL_S3QUERY_SUMMARY の確認事項を示します。
-
Redshift Spectrum クエリで処理されたファイル数。
-
Amazon S3 からスキャンされたバイト数。Redshift Spectrum クエリの料金は、Amazon S3 からスキャンされたデータ量に反映されます。
-
Redshift Spectrum レイヤーからクラスターに返されたバイト数。大量のデータが返されると、システムパフォーマンスに影響が及ぶ可能性があります。
-
Redshift Spectrum リクエストの最長時間と平均時間。実行時間の長いリクエストはボトルネックの可能性があります。
RG でプロビジョニングされたクラスターに関する注意
RG でプロビジョニングされたクラスターでは、Redshift Spectrum クエリは、RA3 および DC2 でプロビジョニングされたクラスターで使用される専用の Spectrum フリートではなく、クラスター独自のコンピューティングで実行されます。SVL_S3QUERY および SVL_S3QUERY_SUMMARY は、引き続き RG クラスターで入力されます。以下の列については、セマンティクスが異なるか、非推奨となっています。
RG でプロビジョニングされたクラスターに異なるセマンティクスが入力された列
RA3 および DC2 でプロビジョニングされたクラスターでは、これらの列はクラスターと Spectrum フリートの間を移動する行、バイト、および作業単位を記述します。RG でプロビジョニングされたクラスターでは、クラスターのネイティブリーダーによって実行される同等の作業を記述します。
s3_scanned_rows — クラスターのネイティブリーダー (事前フィルター) によって Amazon S3 から直接読み取られた行数。
s3_scanned_bytes — クラスターのネイティブリーダーによって処理された合計スキャン範囲サイズ (バイト単位)。
s3query_returned_rows — クラスターのネイティブリーダーによるフィルタープッシュダウン後に生成された行数。
s3query_returned_bytes — クラスターのネイティブリーダーによるフィルタープッシュダウン後に生成されたバイト数。
splits — クラスターのネイティブリーダーが消費したスキャン範囲の数。
total_split_size — 消費されたすべてのスキャン範囲の合計サイズ (バイト単位)。
max_split_size — 消費された最大スキャン範囲のサイズ (バイト単位)。
RG でプロビジョニングされたクラスターで非推奨の列
これらの列は、RG に存在しない Spectrum フリートの概念を表しています。RG クラスターでは、これらの列は STL_S3QUERY において -1 としてログに記録されます。そのため、SVL_S3QUERY および SVL_S3QUERY_SUMMARY では -1 と表示されるか、意味のある値を持ちません。
total_retries、max_retries — RG では、再試行は Amazon S3 クライアントレベルで行われます。再試行の詳細については、STL_S3CLIENT と STL_S3CLIENT_ERROR を使用します。
max_request_duration、avg_request_duration — RG は Spectrum リクエストモデルを使用しません。
max_request_parallelism、avg_request_parallelism — RG は Spectrum リクエストトークンを使用しません。
slowdown_count、max_concurrent_slowdown_count — RG では、Amazon S3 のスローダウンは STL_S3CLIENT で追跡されます。
RG クラスター (パーティション、スキャンされたファイル、返された行とバイト、ファイル形式、ファイルの場所、一覧表示とパーティション取得のタイミング) のクエリごとの集計メトリクスについては、SYS_EXTERNAL_QUERY_DETAIL モニタリングビューを使用することもできます。