Amazon Redshift dejará de admitir la creación de nuevas UDF de Python a partir del parche 198. Las UDF de Python existentes seguirán funcionando hasta el 30 de junio de 2026. Para obtener más información, consulte la publicación del blog
Métricas en Amazon Redshift Spectrum
En este tema se describen las vistas del sistema que puede utilizar para supervisar consultas de lago de datos.
Puede supervisar las consultas de lago de datos utilizando las siguientes vistas de sistema:
-
Use la vista SVL_S3QUERY para obtener detalles acerca de las consultas de lago de datos en el segmento y sector del nodo.
-
Use la vista SVL_S3QUERY_SUMMARY para obtener un resumen de todas las consultas de lago de datos que se han ejecutado en el sistema.
Los puntos a continuación son los elementos a tener en cuenta en SVL_S3QUERY_SUMMARY:
-
La cantidad de filas que procesó la consulta de Redshift Spectrum.
-
La cantidad de bytes analizados de Amazon S3. El costo de una consulta de Redshift Spectrum se ve reflejado en la cantidad de datos analizados de Amazon S3.
-
La cantidad de bytes devueltos desde la capa Redshift Spectrum hasta el clúster. Una gran cantidad de datos devueltos podría afectar el rendimiento del sistema.
-
La duración máxima y la duración promedio de las solicitudes de Redshift Spectrum. Si las solicitudes toman demasiado tiempo de ejecución, podría deberse a un cuello de botella.
Nota sobre los clústeres con aprovisionamiento de RG
En los clústeres con aprovisionamiento de RG, las consultas de Redshift Spectrum se ejecutan en la propia computación del clúster y no en la flota de Spectrum dedicada que utilizan los clústeres con aprovisionamiento de RA3 y DC2. SVL_S3QUERY y SVL_S3QUERY_SUMMARY se siguen rellenando en los clústeres de RG. Las siguientes columnas tienen una semántica diferente o están en desuso.
Columnas rellenadas con semánticas diferentes en los clústeres con aprovisionamiento de RG
En los clústeres con aprovisionamiento de RA3 y DC2, estas columnas describen las filas, los bytes y las unidades de trabajo que se mueven entre el clúster y la flota de Spectrum. En los clústeres con aprovisionamiento de RG, describen el trabajo equivalente que realiza el lector nativo del clúster:
s3_scanned_rows: filas leídas directamente desde Amazon S3 por el lector nativo del clúster (prefiltro).
s3_scanned_bytes: tamaño total del rango de análisis en bytes procesado por el lector nativo del clúster.
s3query_returned_rows: filas generadas tras la aplicación del filtro por parte del lector nativo del clúster.
s3query_returned_bytes: bytes generados tras la aplicación del filtro por parte del lector nativo del clúster.
splits: número de rangos de análisis consumidos por el lector nativo del clúster.
total_split_size: tamaño total de todos los rangos de análisis consumidos, en bytes.
max_split_size: tamaño del rango de análisis más grande consumido, en bytes.
Las columnas están en desuso en los clústeres con aprovisionamiento de RG
Estas columnas describen los conceptos de flota de Spectrum que no existen en RG. En los clústeres de RG, se registran como -1 en STL_S3QUERY y, por lo tanto, aparecen como -1 o no son significativos en SVL_S3QUERY y SVL_S3QUERY_SUMMARY:
total_retries, max_retries: en RG, los reintentos se realizan en el cliente de Amazon S3. Utilice STL_S3CLIENT_ERROR y STL_S3CLIENT_ERROR para obtener detalles sobre los reintentos.
max_request_duration, avg_request_duration: RG no usa el modelo de solicitud de Spectrum.
max_request_parallelism, avg_request_parallelism: RG no usa los tokens de solicitud de Spectrum.
slowdown_count, max_concurrent_slowdown_count: en RG, las ralentizaciones de Amazon S3 se registran en STL_S3CLIENT.
Para obtener métricas agregadas por consulta en clústeres de RG (particiones, archivos escaneados, filas y bytes devueltos, formato de archivo, ubicación del archivo, listado y tiempo de recuperación de las particiones), también puede utilizar la vista de supervisión SYS_EXTERNAL_QUERY_DETAIL.