View a markdown version of this page

Monitoraggio di un'integrazione - AWS Glue

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Monitoraggio di un'integrazione

Stati di un'integrazione

I seguenti stati di un'integrazione descrivono l'integrazione:

  • Creating: l'integrazione è in fase di creazione.

  • Active: l'integrazione sta inviando dati transazionali al data warehouse di destinazione.

  • Modifying: l'integrazione è in fase di modifica.

  • Syncing: l'integrazione ha rilevato un errore recuperabile e deve reimpostare i dati.

  • Needs attention: l'integrazione ha rilevato un evento o un errore che richiede un intervento manuale per la risoluzione. Per correggere il problema, seguire le istruzioni nel messaggio di errore nella pagina dei dettagli dell'integrazione.

  • Failed: l'integrazione ha rilevato un evento o un errore irreversibile che non può essere risolto. È necessario eliminare e ricreare l’integrazione.

  • Deleting: l'integrazione è in fase di eliminazione.

Visualizzazione dei CloudWatch log di Amazon per un'integrazione

AWS Glue Le integrazioni zero-ETL generano log CloudWatch Amazon per la visibilità sul movimento dei dati. Gli eventi di registro relativi a ciascun inserimento riuscito o a eventuali errori riscontrati a causa di record di dati problematici all'origine o errori di scrittura dei dati dovuti a modifiche dello schema o autorizzazioni insufficienti vengono emessi a un gruppo di log predefinito creato in un account cliente.

Per ciascuna integrazione creata, gli eventi di log relativi a tale integrazione verranno raccolti in /aws-glue/zeroETL-integrations/logs/ di Amazon CloudWatch. All'interno del gruppo di log, i messaggi di log verranno suddivisi in flussi di log. Ciascuna integrazione creata ha un flusso di log dedicato in cui vengono scritti tutti i log relativi a tale integrazione. Ad esempio, i log per un'integrazione con sono disponibili in /aws- IntegrationArn arn:aws:glue:us-east-1:123456789012:integration:03cabe77-79e7-4b7a-b3da-8c160bea6bbf /03cabe77-79e7-4b7a-b3da-8c160bea6bbf. glue/zeroETL-integrations/logs È possibile fare riferimento a {} dal {integrationARN} generato quando viene creata un'integrazione. IntegrationId

Nota

In uno scenario con più account, i registri di elaborazione di origine vengono emessi nell'account di origine in cui esiste l'integrazione e i registri di elaborazione di destinazione vengono emessi nell'account di destinazione in cui esiste il database di destinazione.

Autorizzazioni IAM necessarie per abilitare la registrazione

Quando si crea l'integrazione, sono necessarie le seguenti autorizzazioni IAM per i ruoli di origine e destinazione per abilitare la registrazione per un'integrazione. CloudWatch AWS Glue Le integrazioni zero-ETL utilizzano queste autorizzazioni fornite nei ruoli di origine e destinazione per inviare log agli account dei clienti. CloudWatch

JSON
{ "Version":"2012-10-17", "Statement": [ { "Effect": "Allow", "Action": [ "logs:CreateLogGroup", "logs:CreateLogStream", "logs:PutLogEvents" ], "Resource": [ "*" ] } ] }

Messaggi di log

Formato di log: le integrazioni Zero-ETL emettono quattro tipi di messaggi di log:

// Ingestion started { "integrationArn": "arn:aws:glue:us-east-2:123456789012:integration/1a012bba-123a-1bba-ab1c-173de3b12345", ... "messageType": "IngestionStarted", "details": { "tableName": "testDDBTable", "message": "Ingestion Job started" } } // Data processing stats on successful table ingestion { ... "messageType": "IngestionProcessingStats", "details": { "tableName": "testDDBTable", "insert_count": 100, "update_count": 10, "delete_count": 10 } } // Ingestion failure logs for failed table-processing { ... "messageType": "IngestionFailed", "details": { "tableName": "testDDBTable", "errorMessage": "Failed to ingest data with error: Target Glue database not found.", "error_code" : "client_error" } } // Ingestion completed notification with lastSyncedTimestamp { ... "messageType": "IngestionCompleted", "details": { "tableName": "testDDBTable", "message": "Ingestion Job completed" "lastSyncedTimestamp": "1132344255745" } }

Visualizzazione dei CloudWatch parametri di Amazon per un'integrazione

Una volta completata l'integrazione, puoi vedere questi parametri di Amazon Cloudwatch generati nel tuo account per ogni processo eseguito: AWS Glue

CloudWatch namespace delle metriche: "/glue/ZeroEtl»AWS

Dimensioni dei parametri:

  • integrationArn

  • loadType

  • tableName

Nomi dei parametri:

  • InsertCount: numero di record inseriti nella tabella Iceberg di destinazione.

  • UpdateCount: numero di record aggiornati nella tabella Iceberg di destinazione.

  • DeleteCount: numero di record eliminati dalla tabella Iceberg di destinazione.

  • IngestionSucceeded: conta 1, se l'ingestione è riuscita per l'integrazione.

  • IngestionFailed: conta 1, se l'ingestione non è riuscita per l'integrazione.

  • LastSyncTimestamp: data e ora fino a quando la sorgente è stata sincronizzata con la destinazione.

Gestione delle notifiche di eventi con Amazon EventBridge

Le integrazioni zero-ETL utilizzano EventBridge Amazon per gestire le notifiche degli eventi e up-to-date tenerti aggiornato sulle modifiche apportate alle integrazioni. Amazon EventBridge è un servizio di bus eventi senza server che puoi utilizzare per connettere le tue applicazioni con dati provenienti da una varietà di fonti. In questo caso, l'origine dell'evento è AWS Glue. Gli eventi, che sono modifiche monitorate in un ambiente, vengono inviati EventBridge AWS Glue automaticamente. Gli eventi vengono distribuiti pressoché in tempo reale.

EventBridge fornisce un ambiente in cui scrivere regole relative agli eventi, che possono specificare le azioni da intraprendere per eventi specifici. È inoltre possibile impostare obiettivi, ovvero risorse a cui EventBridge inviare un evento. Una destinazione può includere una destinazione API, un gruppo di CloudWatch log Amazon e altri. Per ulteriori informazioni sulle regole, consulta le EventBridge regole di Amazon. Per ulteriori informazioni sugli obiettivi, consulta Amazon EventBridge targets.

Per acquisire tutte le notifiche Zero-ETL, creare una regola Eventbridge che corrisponda alla seguente:

{ "source": [{ "prefix": "aws.glue-zero-etl“ }], "detail-type": [{ "prefix": "Glue Zero ETL“ }] }

La tabella seguente illustra gli eventi di integrazione Zero-ETL con metadati aggiuntivi:

Tipo di dettaglio rivolto ai clienti Spiegazione
AWS Glue Ingestione Zero ETL completata L'esecuzione individuale per un'entità è stata completata correttamente.
AWS Glue Ingestione Zero ETL non riuscita L'esecuzione individuale per un'entità non è stata completata correttamente (con un errore del client o del sistema).
AWS Glue Integrazione Zero ETL risincronizzata L'integrazione è stata RISINCRONIZZATA.
AWS Glue Integrazione Zero ETL non riuscita Lo stato dell'integrazione è stato modificato in Non riuscita a causa di un errore.
AWS Glue L'integrazione Zero ETL richiede attenzione Lo stato dell'integrazione è stato modificato in NEEDS_ATTENTION a causa di un errore.
AWS Glue Zero ingestione di ETL in corso L'esecuzione individuale per un'entità ha compiuto progressi parziali verso il completamento.