Amazon Redshift tidak akan lagi mendukung pembuatan UDF Python baru mulai Patch 198. UDF Python yang ada akan terus berfungsi hingga 30 Juni 2026. Untuk informasi lebih lanjut, lihat posting blog
Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.
Metrik dalam Amazon Redshift Spectrum
Topik ini menjelaskan tampilan sistem yang dapat Anda gunakan untuk memantau kueri data lake.
Anda dapat memantau kueri data lake menggunakan tampilan sistem berikut:
-
Gunakan tampilan SVL_S3QUERY untuk mendapatkan detail tentang kueri data lake di segmen dan tingkat irisan node.
-
Gunakan tampilan SVL_S3QUERY_SUMMARY untuk mendapatkan ringkasan semua kueri data lake yang telah dijalankan di sistem.
Berikut ini adalah beberapa hal yang harus dicari di SVL_S3QUERY_SUMMARY:
-
Jumlah file yang diproses oleh kueri Redshift Spectrum.
-
Jumlah byte yang dipindai dari Amazon S3. Biaya kueri Redshift Spectrum tercermin dalam jumlah data yang dipindai dari Amazon S3.
-
Jumlah byte yang dikembalikan dari lapisan Redshift Spectrum ke cluster. Sejumlah besar data yang dikembalikan dapat mempengaruhi kinerja sistem.
-
Durasi maksimum dan durasi rata-rata permintaan Redshift Spectrum. Long-running permintaan mungkin menunjukkan kemacetan.
Catatan tentang kluster yang disediakan RG
Pada cluster yang disediakan RG, kueri Redshift Spectrum berjalan pada komputasi cluster sendiri daripada pada armada Spectrum khusus yang digunakan oleh cluster yang disediakan RA3 dan DC2. SVL_S3QUERYdan SVL_S3QUERY_SUMMARYterus dihuni di cluster RG. Kolom berikut memiliki semantik yang berbeda atau tidak digunakan lagi.
Kolom diisi dengan semantik berbeda pada cluster yang disediakan RG
Pada cluster yang disediakan RA3 dan DC2, kolom ini menggambarkan baris, byte, dan unit kerja yang bergerak antara cluster dan armada Spectrum. Pada cluster yang disediakan RG, mereka menggambarkan pekerjaan setara yang dilakukan oleh pembaca asli cluster:
s3_scanned_rows — baris dibaca langsung dari Amazon S3 oleh pembaca asli cluster (pra-filter).
s3_scanned_bytes — total ukuran rentang pemindaian dalam byte yang diproses oleh pembaca asli cluster.
s3query_returned_rows — baris yang dihasilkan setelah filter pushdown oleh pembaca asli cluster.
s3query_returned_bytes — byte yang dihasilkan setelah filter pushdown oleh pembaca asli cluster.
split — jumlah rentang pemindaian yang dikonsumsi oleh pembaca asli cluster.
total_split_size — ukuran total semua rentang pemindaian yang dikonsumsi, dalam byte.
max_split_size — ukuran rentang pemindaian terbesar yang dikonsumsi, dalam byte.
Kolom tidak digunakan lagi pada kluster yang disediakan RG
Kolom ini menggambarkan Spectrum-fleet konsep yang tidak ada pada RG. Pada cluster RG mereka dicatat sebagai -1 di STL_S3QUERY, dan karena itu muncul sebagai -1 atau tidak berarti di SVL_S3QUERY dan SVL_S3QUERY_SUMMARY:
total_retries, max_retries - Pada RG, percobaan ulang terjadi di tingkat klien Amazon S3. Gunakan STL_S3CLIENT dan STL_S3CLIENT_ERROR untuk detail coba lagi.
max_request_duration, avg_request_duration - RG tidak menggunakan model permintaan Spectrum.
max_request_parallelism, avg_request_parallelism — RG tidak menggunakan token permintaan Spectrum.
slowdown_count, max_concurrent_slowdown_count — Pada RG, perlambatan Amazon S3 dilacak di STL_S3CLIENT.
Untuk metrik agregat per kueri pada klaster RG (partisi, file yang dipindai, baris dan byte yang dikembalikan, format file, lokasi file, daftar, dan waktu pengambilan partisi), Anda juga dapat menggunakan tampilan pemantauan. SYS_EXTERNAL_QUERY_DETAIL