Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.
Guida introduttiva al contesto aziendale nel Data Catalog
Nota
Il contesto aziendale e la ricerca semantica sono disponibili in anteprima AWS Glue e sono soggette a modifiche.
Questo tutorial illustra come creare un glossario, etichettare le risorse e utilizzare la ricerca semantica per scoprire i dati in base al significato.
Prerequisiti
Un AWS account con il catalogo AWS Glue dati configurato in una regione supportata.
Il AWS CLI installato e configurato.
Almeno una tabella registrata nel Data Catalog.
Un ruolo o un utente IAM con autorizzazioni per le azioni del AWS Glue Data Catalog.
Allega la seguente policy IAM per concedere le autorizzazioni richieste:
{ "Version": "2012-10-17", "Statement": [{ "Effect": "Allow", "Action": [ "glue:SearchAssets", "glue:PutAsset", "glue:GetAsset", "glue:DeleteAsset", "glue:PutAssetType", "glue:GetAssetType", "glue:DeleteAssetType", "glue:ListAssetTypes", "glue:CreateGlossary", "glue:UpdateGlossary", "glue:GetGlossary", "glue:ListGlossaries", "glue:DeleteGlossary", "glue:CreateGlossaryTerm", "glue:UpdateGlossaryTerm", "glue:GetGlossaryTerm", "glue:ListGlossaryTerms", "glue:DeleteGlossaryTerm", "glue:AssociateGlossaryTerms", "glue:DisassociateGlossaryTerms", "glue:PutFormType", "glue:GetFormType", "glue:DeleteFormType", "glue:ListFormTypes", "glue:PutAttachment", "glue:DeleteAttachment", "glue:ListIterableForms", "glue:BatchGetIterableForms" ], "Resource": "*" }] }
Passaggio 1: crea un glossario e tagga una risorsa
Per creare un glossario
Esegui il comando seguente:
aws glue create-glossary \ --name "Enterprise Data Glossary" \ --description "Standardized business definitions for enterprise data assets."
Output di esempio:
{ "Id": "d7xm3np5rk2w9j", "Name": "Enterprise Data Glossary" }
Per creare un termine di glossario
Sostituisci l'identificatore del glossario con quello Id dell'output precedente.
aws glue create-glossary-term \ --glossary-identifier "d7xm3np5rk2w9j" \ --name "Active User" \ --short-description "A user with at least one login in the last 30 days." \ --long-description "An account that has logged in at least once within the trailing 30-day window."
Output di esempio:
{ "Id": "c2fymbu18rtsx5", "GlossaryId": "d7xm3np5rk2w9j", "Name": "Active User" }
Per associare il termine a una risorsa
Esegui il comando seguente:
aws glue associate-glossary-terms \ --identifier "arn:aws:glue:us-east-1:123456789012:table/mydb/sales_transactions" \ --glossary-term-identifiers "c2fymbu18rtsx5"
Fase 2: Ricerca dei dati utilizzando il contesto aziendale
Utilizza l'SearchAssetsAPI per trovare risorse in base al significato aziendale.
aws glue search-assets \ --search-text "active users"
Output di esempio:
{ "Items": [ {"Id": "c9vq7sh2fk4t2h", "AssetName": "Customer Sales Transactions", "AssetTypeId": "Table"} ] }
Per filtrare i risultati per tipo di risorsa:
aws glue search-assets \ --search-text "active users" \ --filter-clause '{"AttributeFilter":{"Attribute":"type","Operator":"equals","Value":{"StringValue":"Table"}}}' \ --max-results 10
Per filtrare solo le AWS Glue tabelle (escluse le tabelle di altri sistemi di origine):
aws glue search-assets \ --search-text "active users" \ --filter-clause '{"AndAllFilters":[{"AttributeFilter":{"Attribute":"type","Operator":"equals","Value":{"StringValue":"Table"}}},{"AttributeFilter":{"Attribute":"namespace","Operator":"equals","Value":{"StringValue":"amazon.glue"}}}]}' \ --max-results 10
Utilizzo di agenti AI con il catalogo
MCP-compatible Gli agenti di intelligenza artificiale possono scoprire le risorse del catalogo, recuperare il contesto aziendale e caricare i contenuti delle competenze utilizzando le competenze dell' AWS Agent Toolkit. Puoi acquisire competenze di catalogo nei seguenti modi:
In bundle con un plug-in: installa il
aws-data-analyticsplug-in, che include una serie curata di competenze di catalogo disponibili per l'agente subito dopo l'installazione. Per istruzioni, consultate Installazione dei plugin nella Guida per l'utente di AWS Agent Toolkit.Installate localmente: scaricate le competenze individuali dal AWS repository Agent Toolkit for GitHub e aggiungetele all'elenco delle competenze del vostro agente. Le seguenti competenze supportano i flussi di lavoro del catalogo:
Fasi successive
Allega moduli per standardizzare i campi di metadati come la residenza o la politica di conservazione dei dati.
Crea risorse di competenze che forniscano agli agenti di intelligenza artificiale un contesto di dominio per i tuoi dati.