View a markdown version of this page

Erste Schritte mit dem Geschäftskontext im Datenkatalog - AWS Glue

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Erste Schritte mit dem Geschäftskontext im Datenkatalog

Anmerkung

Der Geschäftskontext und die semantische Suche sind in der Vorversion verfügbar AWS Glue und können sich ändern.

In diesem Tutorial erfahren Sie, wie Sie ein Glossar erstellen, Assets taggen und mithilfe der semantischen Suche Daten anhand ihrer Bedeutung ermitteln können.

Voraussetzungen

  • Ein AWS Konto mit dem AWS Glue Datenkatalog, der in einer unterstützten Region konfiguriert ist.

  • Das AWS CLI ist installiert und konfiguriert.

  • Mindestens eine Tabelle ist im Datenkatalog registriert.

  • Eine IAM-Rolle oder ein IAM-Benutzer mit Berechtigungen für AWS Glue Datenkatalogaktionen.

Fügen Sie die folgende IAM-Richtlinie hinzu, um die erforderlichen Berechtigungen zu gewähren:

{ "Version": "2012-10-17", "Statement": [{ "Effect": "Allow", "Action": [ "glue:SearchAssets", "glue:PutAsset", "glue:GetAsset", "glue:DeleteAsset", "glue:PutAssetType", "glue:GetAssetType", "glue:DeleteAssetType", "glue:ListAssetTypes", "glue:CreateGlossary", "glue:UpdateGlossary", "glue:GetGlossary", "glue:ListGlossaries", "glue:DeleteGlossary", "glue:CreateGlossaryTerm", "glue:UpdateGlossaryTerm", "glue:GetGlossaryTerm", "glue:ListGlossaryTerms", "glue:DeleteGlossaryTerm", "glue:AssociateGlossaryTerms", "glue:DisassociateGlossaryTerms", "glue:PutFormType", "glue:GetFormType", "glue:DeleteFormType", "glue:ListFormTypes", "glue:PutAttachment", "glue:DeleteAttachment", "glue:ListIterableForms", "glue:BatchGetIterableForms" ], "Resource": "*" }] }

Schritt 1: Erstellen Sie ein Glossar und kennzeichnen Sie ein Asset

Um ein Glossar zu erstellen

Führen Sie den folgenden Befehl aus:

aws glue create-glossary \ --name "Enterprise Data Glossary" \ --description "Standardized business definitions for enterprise data assets."

Beispielausgabe:

{ "Id": "d7xm3np5rk2w9j", "Name": "Enterprise Data Glossary" }
Um einen Glossarbegriff zu erstellen

Ersetzen Sie den Glossarbezeichner durch den Id aus der vorherigen Ausgabe.

aws glue create-glossary-term \ --glossary-identifier "d7xm3np5rk2w9j" \ --name "Active User" \ --short-description "A user with at least one login in the last 30 days." \ --long-description "An account that has logged in at least once within the trailing 30-day window."

Beispielausgabe:

{ "Id": "c2fymbu18rtsx5", "GlossaryId": "d7xm3np5rk2w9j", "Name": "Active User" }
Um den Begriff einem Asset zuzuordnen

Führen Sie den folgenden Befehl aus:

aws glue associate-glossary-terms \ --identifier "arn:aws:glue:us-east-1:123456789012:table/mydb/sales_transactions" \ --glossary-term-identifiers "c2fymbu18rtsx5"

Verwenden Sie die SearchAssets API, um Ressourcen nach geschäftlicher Bedeutung zu finden.

aws glue search-assets \ --search-text "active users"

Beispielausgabe:

{ "Items": [ {"Id": "c9vq7sh2fk4t2h", "AssetName": "Customer Sales Transactions", "AssetTypeId": "Table"} ] }

So filtern Sie Ergebnisse nach Asset-Typ:

aws glue search-assets \ --search-text "active users" \ --filter-clause '{"AttributeFilter":{"Attribute":"type","Operator":"equals","Value":{"StringValue":"Table"}}}' \ --max-results 10

Um nur nach AWS Glue Tabellen zu filtern (ohne Tabellen aus anderen Quellsystemen):

aws glue search-assets \ --search-text "active users" \ --filter-clause '{"AndAllFilters":[{"AttributeFilter":{"Attribute":"type","Operator":"equals","Value":{"StringValue":"Table"}}},{"AttributeFilter":{"Attribute":"namespace","Operator":"equals","Value":{"StringValue":"amazon.glue"}}}]}' \ --max-results 10

Verwenden von KI-Agenten mit dem Katalog

MCP-compatible KI-Agenten können mithilfe von Skills aus dem AWS Agent Toolkit Katalog-Assets erkennen, Geschäftskontext abrufen und Skillinhalte laden. Sie können sich Katalogkenntnisse auf folgende Weise aneignen:

  • Im Lieferumfang eines Plug-ins enthalten — Installieren Sie das aws-data-analytics Plug-in, das eine Reihe kuratierter Katalog-Skills enthält, die dem Agenten unmittelbar nach der Installation zur Verfügung stehen. Anweisungen finden Sie unter Installation von Plug-ins im AWS Agent Toolkit-Benutzerhandbuch.

  • Lokal installiert — Laden Sie einzelne Skills aus dem Agent Toolkit für das AWS Repository herunter GitHub und fügen Sie sie dem Skills-Verzeichnis Ihres Agenten hinzu. Die folgenden Fähigkeiten unterstützen Katalog-Workflows:

Nächste Schritte

  • Hängen Sie Formulare an, um Metadatenfelder wie Datenspeicherort oder Aufbewahrungsrichtlinien zu standardisieren.

  • Erstellen Sie Skill-Assets, die KI-Agenten den Domänenkontext für Ihre Daten bieten.