Catatan tentang kluster yang disediakan RG

Metrik dalam Amazon Redshift Spectrum

Topik ini menjelaskan tampilan sistem yang dapat Anda gunakan untuk memantau kueri data lake.

Anda dapat memantau kueri data lake menggunakan tampilan sistem berikut:

SVL_S3QUERY

Gunakan tampilan SVL_S3QUERY untuk mendapatkan detail tentang kueri data lake di segmen dan tingkat irisan node.
SVL_S3QUERY_SUMMARY

Gunakan tampilan SVL_S3QUERY_SUMMARY untuk mendapatkan ringkasan semua kueri data lake yang telah dijalankan di sistem.

Berikut ini adalah beberapa hal yang harus dicari di SVL_S3QUERY_SUMMARY:

Jumlah file yang diproses oleh kueri Redshift Spectrum.
Jumlah byte yang dipindai dari Amazon S3. Biaya kueri Redshift Spectrum tercermin dalam jumlah data yang dipindai dari Amazon S3.
Jumlah byte yang dikembalikan dari lapisan Redshift Spectrum ke cluster. Sejumlah besar data yang dikembalikan dapat mempengaruhi kinerja sistem.
Durasi maksimum dan durasi rata-rata permintaan Redshift Spectrum. Long-running permintaan mungkin menunjukkan kemacetan.

Catatan tentang kluster yang disediakan RG

Pada cluster yang disediakan RG, kueri Redshift Spectrum berjalan pada komputasi cluster sendiri daripada pada armada Spectrum khusus yang digunakan oleh cluster yang disediakan RA3 dan DC2. SVL_S3QUERYdan SVL_S3QUERY_SUMMARYterus dihuni di cluster RG. Kolom berikut memiliki semantik yang berbeda atau tidak digunakan lagi.

Kolom diisi dengan semantik berbeda pada cluster yang disediakan RG

Pada cluster yang disediakan RA3 dan DC2, kolom ini menggambarkan baris, byte, dan unit kerja yang bergerak antara cluster dan armada Spectrum. Pada cluster yang disediakan RG, mereka menggambarkan pekerjaan setara yang dilakukan oleh pembaca asli cluster:

s3_scanned_rows — baris dibaca langsung dari Amazon S3 oleh pembaca asli cluster (pra-filter).
s3_scanned_bytes — total ukuran rentang pemindaian dalam byte yang diproses oleh pembaca asli cluster.
s3query_returned_rows — baris yang dihasilkan setelah filter pushdown oleh pembaca asli cluster.
s3query_returned_bytes — byte yang dihasilkan setelah filter pushdown oleh pembaca asli cluster.
split — jumlah rentang pemindaian yang dikonsumsi oleh pembaca asli cluster.
total_split_size — ukuran total dari semua rentang pemindaian yang dikonsumsi, dalam byte.
max_split_size — ukuran rentang pemindaian terbesar yang dikonsumsi, dalam byte.

Kolom tidak digunakan lagi pada kluster yang disediakan RG

Kolom ini menggambarkan Spectrum-fleet konsep yang tidak ada pada RG. Pada cluster RG mereka dicatat sebagai -1 di STL_S3QUERY, dan karena itu muncul sebagai -1 atau tidak berarti di SVL_S3QUERY dan SVL_S3QUERY_SUMMARY:

total_retries, max_retries - Pada RG, percobaan ulang terjadi di tingkat klien Amazon S3. Gunakan STL_S3CLIENT dan STL_S3CLIENT_ERROR untuk detail coba lagi.
max_request_duration, avg_request_duration - RG tidak menggunakan model permintaan Spectrum.
max_request_parallelism, avg_request_parallelism — RG tidak menggunakan token permintaan Spectrum.
slowdown_count, max_concurrent_slowdown_count — Pada RG, perlambatan Amazon S3 dilacak di STL_S3CLIENT.

Untuk metrik agregat per kueri pada klaster RG (partisi, file yang dipindai, baris dan byte yang dikembalikan, format file, lokasi file, daftar, dan waktu pengambilan partisi), Anda juga dapat menggunakan tampilan pemantauan. SYS_EXTERNAL_QUERY_DETAIL

Awas Javascript dinonaktifkan atau tidak tersedia di browser Anda.

Untuk menggunakan Dokumentasi AWS, Javascript harus diaktifkan. Lihat halaman Bantuan browser Anda untuk petunjuk.

Konvensi Dokumen

Melakukan subquery yang berkorelasi

Pemecahan masalah kueri