

# Monitoramento e depuração de trabalho
<a name="monitor-profile-glue-job-cloudwatch-metrics"></a>

Você pode coletar métricas sobre trabalhos do AWS Glue e visualizá-las nos consoles do AWS Glue e do Amazon CloudWatch para identificar e corrigir problemas. A criação do perfil dos seus trabalhos do AWS Glue requer as seguintes etapas:

1.  Habilitar métricas: 

   1.  Habilite a opção **Job metrics (Métricas de trabalho)** na definição do trabalho. Você pode habilitar a criação de perfil no console do AWS Glue ou como um parâmetro para o trabalho. Para obter mais informações, consulte [Definir propriedades de trabalho para trabalhos do Spark](add-job.md#create-job) ou [Usar parâmetros de tarefa em tarefas do AWS Glue](aws-glue-programming-etl-glue-arguments.md). 

   1.  Habilite a opção **Métricas de observabilidade do AWS Glue** na definição do trabalho. É possível habilitar a observabilidade no console do AWS Glue ou como parâmetro para o trabalho. Para obter mais informações, consulte [Monitoramento com métricas de observabilidade do AWS Glue](monitor-observability.md). 

1. Confirme se o script do trabalho inicializa um `GlueContext`. Por exemplo, o snippet de script a seguir inicializa um `GlueContext` e mostra onde o código perfilado é colocado no script. Este formato geral é usado nos cenários de depuração a seguir. 

   ```
   import sys
   from awsglue.transforms import *
   from awsglue.utils import getResolvedOptions
   from pyspark.context import SparkContext
   from awsglue.context import GlueContext
   from awsglue.job import Job
   import time
   
   ## @params: [JOB_NAME]
   args = getResolvedOptions(sys.argv, ['JOB_NAME'])
   
   sc = SparkContext()
   glueContext = GlueContext(sc)
   spark = glueContext.spark_session
   job = Job(glueContext)
   job.init(args['JOB_NAME'], args)
   
   ...
   ...
   code-to-profile
   ...
   ...
   
   
   job.commit()
   ```

1. Execute o trabalho.

1. Visualize as métricas:

   1. Visualize as métricas de trabalho no console do AWS Glue e identifique métricas anormais para o driver ou um executor.

   1. Verifique as métricas de observabilidade na página de monitoramento da execução de trabalhos, na página de detalhes da execução de trabalhos ou no Amazon CloudWatch. Para obter mais informações, consulte [Monitoramento com métricas de observabilidade do AWS Glue](monitor-observability.md).

1. Refine a causa raiz usando a métrica identificada.

1. Opcionalmente, confirme a causa raiz usando o fluxo de log do driver identificado ou executor do trabalho.

 **Casos de uso para métricas de observabilidade do AWS Glue** 
+  [Depurar exceções OOM e anomalias de trabalho](monitor-profile-debug-oom-abnormalities.md) 
+  [Depurar estágios exigentes e tarefas de retardatário](monitor-profile-debug-straggler.md) 
+  [Monitorar o progresso de vários trabalhos](monitor-debug-multiple.md) 
+  [Monitorar planejamento de capacidade de DPU](monitor-debug-capacity.md) 
+  [Como usar a observabilidade do AWS Glue para monitorar a utilização de recursos para reduzir custos](https://aws.amazon.com/blogs/big-data/enhance-monitoring-and-debugging-for-aws-glue-jobs-using-new-job-observability-metrics) 