Nota sobre los clústeres con aprovisionamiento de RG

Métricas en Amazon Redshift Spectrum

En este tema se describen las vistas del sistema que puede utilizar para supervisar consultas de lago de datos.

Puede supervisar las consultas de lago de datos utilizando las siguientes vistas de sistema:

SVL_S3QUERY

Use la vista SVL_S3QUERY para obtener detalles acerca de las consultas de lago de datos en el segmento y sector del nodo.
SVL_S3QUERY_SUMMARY

Use la vista SVL_S3QUERY_SUMMARY para obtener un resumen de todas las consultas de lago de datos que se han ejecutado en el sistema.

Los puntos a continuación son los elementos a tener en cuenta en SVL_S3QUERY_SUMMARY:

La cantidad de filas que procesó la consulta de Redshift Spectrum.
La cantidad de bytes analizados de Amazon S3. El costo de una consulta de Redshift Spectrum se ve reflejado en la cantidad de datos analizados de Amazon S3.
La cantidad de bytes devueltos desde la capa Redshift Spectrum hasta el clúster. Una gran cantidad de datos devueltos podría afectar el rendimiento del sistema.
La duración máxima y la duración promedio de las solicitudes de Redshift Spectrum. Si las solicitudes toman demasiado tiempo de ejecución, podría deberse a un cuello de botella.

Nota sobre los clústeres con aprovisionamiento de RG

En los clústeres con aprovisionamiento de RG, las consultas de Redshift Spectrum se ejecutan en la propia computación del clúster y no en la flota de Spectrum dedicada que utilizan los clústeres con aprovisionamiento de RA3 y DC2. SVL_S3QUERY y SVL_S3QUERY_SUMMARY se siguen rellenando en los clústeres de RG. Las siguientes columnas tienen una semántica diferente o están en desuso.

Columnas rellenadas con semánticas diferentes en los clústeres con aprovisionamiento de RG

En los clústeres con aprovisionamiento de RA3 y DC2, estas columnas describen las filas, los bytes y las unidades de trabajo que se mueven entre el clúster y la flota de Spectrum. En los clústeres con aprovisionamiento de RG, describen el trabajo equivalente que realiza el lector nativo del clúster:

s3_scanned_rows: filas leídas directamente desde Amazon S3 por el lector nativo del clúster (prefiltro).
s3_scanned_bytes: tamaño total del rango de análisis en bytes procesado por el lector nativo del clúster.
s3query_returned_rows: filas generadas tras la aplicación del filtro por parte del lector nativo del clúster.
s3query_returned_bytes: bytes generados tras la aplicación del filtro por parte del lector nativo del clúster.
splits: número de rangos de análisis consumidos por el lector nativo del clúster.
total_split_size: tamaño total de todos los rangos de análisis consumidos, en bytes.
max_split_size: tamaño del rango de análisis más grande consumido, en bytes.

Las columnas están en desuso en los clústeres con aprovisionamiento de RG

Estas columnas describen los conceptos de flota de Spectrum que no existen en RG. En los clústeres de RG, se registran como -1 en STL_S3QUERY y, por lo tanto, aparecen como -1 o no son significativos en SVL_S3QUERY y SVL_S3QUERY_SUMMARY:

total_retries, max_retries: en RG, los reintentos se realizan en el cliente de Amazon S3. Utilice STL_S3CLIENT_ERROR y STL_S3CLIENT_ERROR para obtener detalles sobre los reintentos.
max_request_duration, avg_request_duration: RG no usa el modelo de solicitud de Spectrum.
max_request_parallelism, avg_request_parallelism: RG no usa los tokens de solicitud de Spectrum.
slowdown_count, max_concurrent_slowdown_count: en RG, las ralentizaciones de Amazon S3 se registran en STL_S3CLIENT.

Para obtener métricas agregadas por consulta en clústeres de RG (particiones, archivos escaneados, filas y bytes devueltos, formato de archivo, ubicación del archivo, listado y tiempo de recuperación de las particiones), también puede utilizar la vista de supervisión SYS_EXTERNAL_QUERY_DETAIL.

Aviso JavaScript está desactivado o no está disponible en su navegador.

Para utilizar la documentación de AWS, debe estar habilitado JavaScript. Para obtener más información, consulte las páginas de ayuda de su navegador.

Convenciones del documento

Realización de subconsultas correlacionadas

Solución de problemas de consultas