Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.
Erste Schritte mit dem Geschäftskontext im Datenkatalog
Anmerkung
Der Geschäftskontext und die semantische Suche sind in der Vorversion verfügbar AWS Glue und können sich ändern.
In diesem Tutorial erfahren Sie, wie Sie ein Glossar erstellen, Assets taggen und mithilfe der semantischen Suche Daten anhand ihrer Bedeutung ermitteln können.
Voraussetzungen
Ein AWS Konto mit dem AWS Glue Datenkatalog, der in einer unterstützten Region konfiguriert ist.
Das AWS CLI ist installiert und konfiguriert.
Mindestens eine Tabelle ist im Datenkatalog registriert.
Eine IAM-Rolle oder ein IAM-Benutzer mit Berechtigungen für AWS Glue Datenkatalogaktionen.
Fügen Sie die folgende IAM-Richtlinie hinzu, um die erforderlichen Berechtigungen zu gewähren:
{ "Version": "2012-10-17", "Statement": [{ "Effect": "Allow", "Action": [ "glue:SearchAssets", "glue:PutAsset", "glue:GetAsset", "glue:DeleteAsset", "glue:PutAssetType", "glue:GetAssetType", "glue:DeleteAssetType", "glue:ListAssetTypes", "glue:CreateGlossary", "glue:UpdateGlossary", "glue:GetGlossary", "glue:ListGlossaries", "glue:DeleteGlossary", "glue:CreateGlossaryTerm", "glue:UpdateGlossaryTerm", "glue:GetGlossaryTerm", "glue:ListGlossaryTerms", "glue:DeleteGlossaryTerm", "glue:AssociateGlossaryTerms", "glue:DisassociateGlossaryTerms", "glue:PutFormType", "glue:GetFormType", "glue:DeleteFormType", "glue:ListFormTypes", "glue:PutAttachment", "glue:DeleteAttachment", "glue:ListIterableForms", "glue:BatchGetIterableForms" ], "Resource": "*" }] }
Schritt 1: Erstellen Sie ein Glossar und kennzeichnen Sie ein Asset
Um ein Glossar zu erstellen
Führen Sie den folgenden Befehl aus:
aws glue create-glossary \ --name "Enterprise Data Glossary" \ --description "Standardized business definitions for enterprise data assets."
Beispielausgabe:
{ "Id": "d7xm3np5rk2w9j", "Name": "Enterprise Data Glossary" }
Um einen Glossarbegriff zu erstellen
Ersetzen Sie den Glossarbezeichner durch den Id aus der vorherigen Ausgabe.
aws glue create-glossary-term \ --glossary-identifier "d7xm3np5rk2w9j" \ --name "Active User" \ --short-description "A user with at least one login in the last 30 days." \ --long-description "An account that has logged in at least once within the trailing 30-day window."
Beispielausgabe:
{ "Id": "c2fymbu18rtsx5", "GlossaryId": "d7xm3np5rk2w9j", "Name": "Active User" }
Um den Begriff einem Asset zuzuordnen
Führen Sie den folgenden Befehl aus:
aws glue associate-glossary-terms \ --identifier "arn:aws:glue:us-east-1:123456789012:table/mydb/sales_transactions" \ --glossary-term-identifiers "c2fymbu18rtsx5"
Schritt 2: Suchen Sie mithilfe des Geschäftskontextes nach Daten
Verwenden Sie die SearchAssets API, um Ressourcen nach geschäftlicher Bedeutung zu finden.
aws glue search-assets \ --search-text "active users"
Beispielausgabe:
{ "Items": [ {"Id": "c9vq7sh2fk4t2h", "AssetName": "Customer Sales Transactions", "AssetTypeId": "Table"} ] }
So filtern Sie Ergebnisse nach Asset-Typ:
aws glue search-assets \ --search-text "active users" \ --filter-clause '{"AttributeFilter":{"Attribute":"type","Operator":"equals","Value":{"StringValue":"Table"}}}' \ --max-results 10
Um nur nach AWS Glue Tabellen zu filtern (ohne Tabellen aus anderen Quellsystemen):
aws glue search-assets \ --search-text "active users" \ --filter-clause '{"AndAllFilters":[{"AttributeFilter":{"Attribute":"type","Operator":"equals","Value":{"StringValue":"Table"}}},{"AttributeFilter":{"Attribute":"namespace","Operator":"equals","Value":{"StringValue":"amazon.glue"}}}]}' \ --max-results 10
Verwenden von KI-Agenten mit dem Katalog
MCP-compatible KI-Agenten können mithilfe von Skills aus dem AWS Agent Toolkit Katalog-Assets erkennen, Geschäftskontext abrufen und Skillinhalte laden. Sie können sich Katalogkenntnisse auf folgende Weise aneignen:
Im Lieferumfang eines Plug-ins enthalten — Installieren Sie das
aws-data-analyticsPlug-in, das eine Reihe kuratierter Katalog-Skills enthält, die dem Agenten unmittelbar nach der Installation zur Verfügung stehen. Anweisungen finden Sie unter Installation von Plug-ins im AWS Agent Toolkit-Benutzerhandbuch.Lokal installiert — Laden Sie einzelne Skills aus dem Agent Toolkit für das AWS Repository herunter GitHub und fügen Sie sie dem Skills-Verzeichnis Ihres Agenten hinzu. Die folgenden Fähigkeiten unterstützen Katalog-Workflows:
Nächste Schritte
Hängen Sie Formulare an, um Metadatenfelder wie Datenspeicherort oder Aufbewahrungsrichtlinien zu standardisieren.
Erstellen Sie Skill-Assets, die KI-Agenten den Domänenkontext für Ihre Daten bieten.