View a markdown version of this page

Guida introduttiva al contesto aziendale nel Data Catalog - AWS Aderenza

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Guida introduttiva al contesto aziendale nel Data Catalog

Nota

Il contesto aziendale e la ricerca semantica sono disponibili in anteprima AWS Glue e sono soggette a modifiche.

Questo tutorial illustra come creare un glossario, etichettare le risorse e utilizzare la ricerca semantica per scoprire i dati in base al significato.

Prerequisiti

  • Un AWS account con il catalogo AWS Glue dati configurato in una regione supportata.

  • Il AWS CLI installato e configurato.

  • Almeno una tabella registrata nel Data Catalog.

  • Un ruolo o un utente IAM con autorizzazioni per le azioni del AWS Glue Data Catalog.

Allega la seguente policy IAM per concedere le autorizzazioni richieste:

{ "Version": "2012-10-17", "Statement": [{ "Effect": "Allow", "Action": [ "glue:SearchAssets", "glue:PutAsset", "glue:GetAsset", "glue:DeleteAsset", "glue:PutAssetType", "glue:GetAssetType", "glue:DeleteAssetType", "glue:ListAssetTypes", "glue:CreateGlossary", "glue:UpdateGlossary", "glue:GetGlossary", "glue:ListGlossaries", "glue:DeleteGlossary", "glue:CreateGlossaryTerm", "glue:UpdateGlossaryTerm", "glue:GetGlossaryTerm", "glue:ListGlossaryTerms", "glue:DeleteGlossaryTerm", "glue:AssociateGlossaryTerms", "glue:DisassociateGlossaryTerms", "glue:PutFormType", "glue:GetFormType", "glue:DeleteFormType", "glue:ListFormTypes", "glue:PutAttachment", "glue:DeleteAttachment", "glue:ListIterableForms", "glue:BatchGetIterableForms" ], "Resource": "*" }] }

Passaggio 1: crea un glossario e tagga una risorsa

Per creare un glossario

Esegui il comando seguente:

aws glue create-glossary \ --name "Enterprise Data Glossary" \ --description "Standardized business definitions for enterprise data assets."

Output di esempio:

{ "Id": "d7xm3np5rk2w9j", "Name": "Enterprise Data Glossary" }
Per creare un termine di glossario

Sostituisci l'identificatore del glossario con quello Id dell'output precedente.

aws glue create-glossary-term \ --glossary-identifier "d7xm3np5rk2w9j" \ --name "Active User" \ --short-description "A user with at least one login in the last 30 days." \ --long-description "An account that has logged in at least once within the trailing 30-day window."

Output di esempio:

{ "Id": "c2fymbu18rtsx5", "GlossaryId": "d7xm3np5rk2w9j", "Name": "Active User" }
Per associare il termine a una risorsa

Esegui il comando seguente:

aws glue associate-glossary-terms \ --identifier "arn:aws:glue:us-east-1:123456789012:table/mydb/sales_transactions" \ --glossary-term-identifiers "c2fymbu18rtsx5"

Utilizza l'SearchAssetsAPI per trovare risorse in base al significato aziendale.

aws glue search-assets \ --search-text "active users"

Output di esempio:

{ "Items": [ {"Id": "c9vq7sh2fk4t2h", "AssetName": "Customer Sales Transactions", "AssetTypeId": "Table"} ] }

Per filtrare i risultati per tipo di risorsa:

aws glue search-assets \ --search-text "active users" \ --filter-clause '{"AttributeFilter":{"Attribute":"type","Operator":"equals","Value":{"StringValue":"Table"}}}' \ --max-results 10

Per filtrare solo le AWS Glue tabelle (escluse le tabelle di altri sistemi di origine):

aws glue search-assets \ --search-text "active users" \ --filter-clause '{"AndAllFilters":[{"AttributeFilter":{"Attribute":"type","Operator":"equals","Value":{"StringValue":"Table"}}},{"AttributeFilter":{"Attribute":"namespace","Operator":"equals","Value":{"StringValue":"amazon.glue"}}}]}' \ --max-results 10

Utilizzo di agenti AI con il catalogo

MCP-compatible Gli agenti di intelligenza artificiale possono scoprire le risorse del catalogo, recuperare il contesto aziendale e caricare i contenuti delle competenze utilizzando le competenze dell' AWS Agent Toolkit. Puoi acquisire competenze di catalogo nei seguenti modi:

  • In bundle con un plug-in: installa il aws-data-analytics plug-in, che include una serie curata di competenze di catalogo disponibili per l'agente subito dopo l'installazione. Per istruzioni, consultate Installazione dei plugin nella Guida per l'utente di AWS Agent Toolkit.

  • Installate localmente: scaricate le competenze individuali dal AWS repository Agent Toolkit for GitHub e aggiungetele all'elenco delle competenze del vostro agente. Le seguenti competenze supportano i flussi di lavoro del catalogo:

Fasi successive

  • Allega moduli per standardizzare i campi di metadati come la residenza o la politica di conservazione dei dati.

  • Crea risorse di competenze che forniscano agli agenti di intelligenza artificiale un contesto di dominio per i tuoi dati.