View a markdown version of this page

Verwenden von S3-Vektoren mit Amazon Bedrock Knowledge Bases - Amazon Simple Storage Service

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Verwenden von S3-Vektoren mit Amazon Bedrock Knowledge Bases

S3 Vectors lässt sich in Amazon Bedrock Knowledge Bases und Amazon SageMaker AI Unified Studio integrieren, um die Vektorspeicherung für Retrieval Augmented Generation (RAG) -Anwendungen zu vereinfachen und die Kosten zu senken.

Weitere Informationen zu CLI-Befehlen auf hoher Ebene, die Amazon Bedrock-Einbettungsmodelle in S3 Vectors-Operationen integrieren, finden Sie unter.

Übersicht über die Integration

Wenn Sie eine Wissensdatenbank in Amazon Bedrock erstellen, können Sie S3 Vectors als Ihren Vektorspeicher auswählen. Diese Integration bietet Folgendes:

  • Kosteneinsparungen für RAG-Anwendungen mit großen Vektordatensätzen.

  • Nahtlose Integration mit dem vollständig verwalteten RAG-Workflow von Amazon Bedrock.

  • Automatisches Vektormanagement, das vom Amazon Bedrock-Service abgewickelt wird.

  • Latenz bei kalten Abfragen von weniger als einer Sekunde und Warm-Abfragen von nur 100 Millisekunden bei Vorgängen zum Abrufen von Wissensdatenbanken.

Amazon Bedrock Knowledge Bases bietet einen vollständig verwalteten end-to-end RAG-Workflow. Wenn Sie mit S3 Vectors eine Wissensdatenbank erstellen, ruft Amazon Bedrock automatisch Daten aus Ihrer S3-Datenquelle ab, konvertiert Inhalte in Textblöcke, generiert Einbettungen und speichert sie in Ihrem Vektorindex. Anschließend können Sie die Wissensdatenbank abfragen und Antworten auf der Grundlage von Blöcken generieren, die aus Ihren Quelldaten abgerufen wurden.

Wann sollte diese Integration verwendet werden

Erwägen Sie die Verwendung von S3 Vectors mit Amazon Bedrock Knowledge Bases, wenn Sie Folgendes benötigen:

  • Kostengünstiger Vektorspeicher für große Datensätze, bei denen die Abfragelatenz von weniger als einer Sekunde Ihren Anwendungsanforderungen entspricht.

  • Text- und bildgestützter Abruf von Dokumenten für Anwendungsfälle wie das Durchsuchen von Handbüchern, Richtlinien und visuellen Inhalten.

  • RAG-Anwendungen, die der Optimierung der Speicherkosten Vorrang vor Reaktionen mit extrem niedriger Latenz einräumen.

  • Verwaltete Vektoroperationen, ohne sich direkt mit den Operationen der S3-Vektoren-API vertraut machen zu müssen – Sie können weiterhin die vertrauten Amazon Bedrock-Schnittstellen verwenden.

  • Langfristiger Vektorspeicher mit der Haltbarkeit und Skalierbarkeit von Amazon S3

Diese Integration ist ideal für Unternehmen, die RAG-Anwendungen entwickeln, die geschriebene Inhalte und Bilder durchsuchen und Erkenntnisse daraus gewinnen müssen, wobei die Kostenvorteile von S3 Vectors mit akzeptablen Anforderungen an die Abfrageleistung übereinstimmen müssen.

Unterstützte Einbettungsmodelle

Weitere Informationen zu Vektoreinbettungen finden Sie im Amazon Bedrock-Benutzerhandbuch unter den unterstützten Modellen.

Voraussetzungen und Berechtigungen

Bevor Sie eine Wissensdatenbank mit S3 Vectors erstellen, stellen Sie sicher, dass Sie über Folgendes verfügen:

  • Entsprechende IAM-Berechtigungen für S3 Vectors und Amazon Bedrock Services. Weitere Informationen zu IAM-Berechtigungen für S3 Vectors finden Sie unter Identity and Access Management in Amazon S3 Vectors. Weitere Informationen zu IAM-Berechtigungen für Ihre Amazon Bedrock Knowledge Bases-Servicerolle für den Zugriff auf S3 Vectors finden Sie unter Zugriffsberechtigungen für Ihren Vector Store in Amazon S3 Vectors im Amazon Bedrock-Benutzerhandbuch.

  • Ihre Quelldokumente sind für die Aufnahme in die Wissensdatenbank vorbereitet.

  • Ein Verständnis Ihrer Anforderungen an das Einbettungsmodell.

Bei der Einrichtung von Sicherheitskonfigurationen können Sie eine IAM-Rolle wählen, die Amazon Bedrock die Berechtigung zum Zugriff auf die erforderlichen AWS Dienste gewährt. Sie können die Servicerolle von Amazon Bedrock erstellen lassen oder Ihre eigene benutzerdefinierte Rolle verwenden. Wenn Sie eine benutzerdefinierte Rolle verwenden, konfigurieren Sie eine Vektor-Bucket-Richtlinie, die den Zugriff auf den Vektor-Bucket und den Vektorindex auf die benutzerdefinierte Rolle beschränkt.

Ausführliche Informationen zu den erforderlichen Berechtigungen und IAM-Rollen finden Sie unter Erstellen einer Servicerolle für Amazon Bedrock Knowledge Bases im Amazon Bedrock-Benutzerhandbuch. Die Servicerolle muss außerdem über Berechtigungen für S3-Vektoren und AWS KMS API-Operationen verfügen.

Erstellen einer Wissensdatenbank mit S3 Vectors

Sie können eine Wissensdatenbank, die S3-Vektoren verwendet, auf zwei Arten erstellen.

Methode 1: Verwendung der Amazon Bedrock-Konsole

Wenn Sie eine Wissensdatenbank in der Amazon Bedrock-Konsole erstellen, können Sie „S3-Vektor-Bucket“ als Ihre Option für den Vektorspeicher auswählen. Sie haben zwei Einrichtungsoptionen:

Eine ausführliche step-by-step Anleitung finden Sie unter Erstellen einer Wissensdatenbank durch Herstellen einer Verbindung zu einer Datenquelle in Amazon Bedrock Knowledge Bases im Amazon Bedrock-Benutzerhandbuch.

Methode zwei: Verwenden von Amazon SageMaker Unified Studio

Sie können Wissensdatenbanken auch mit S3 Vectors über Amazon Bedrock in Amazon SageMaker AI Unified Studio erstellen und verwalten. Dies bietet eine einheitliche Entwicklungsumgebung zum Erstellen und Testen von KI-Anwendungen, die Wissensdatenbanken verwenden.

Amazon Bedrock in SageMaker AI Unified Studio wurde für Benutzer entwickelt, die integrierte Notebook-Funktionen benötigen und mit mehreren AWS ML- und Analysediensten arbeiten. Sie können schnell einen S3-Vektor-Bucket erstellen und ihn als Vektorspeicher für Ihre Wissensdatenbanken konfigurieren, wenn Sie generative KI-Anwendungen erstellen.

Informationen zur Verwendung von S3 Vectors mit Amazon Bedrock in SageMaker AI Unified Studio finden Sie unter Hinzufügen einer Datenquelle zu Ihrer Amazon Bedrock-App im SageMaker AI Unified Studio-Benutzerhandbuch.

Verwaltung Ihrer Wissensdatenbank und Abfrage Ihrer Wissensdatenbank

Datensynchronisierung und -verwaltung

Amazon Bedrock Knowledge Bases bietet Ingestion-Job-Operationen, um Ihre Datenquellen- und Vektoreinbettungen synchron zu halten. Wenn Sie Ihre Datenquelle synchronisieren, scannt Amazon Bedrock jedes Dokument und überprüft, ob es im Vector Store indexiert wurde. Mit dieser Operation können Sie Dokumente auch direkt in den Vector Store indizieren. IngestKnowledgeBaseDocuments Es hat sich bewährt, für jede Wissensdatenbank einen eigenen Vektorspeicher zu erstellen, um die Datensynchronisierung sicherzustellen.

Wenn Sie eine Wissensdatenbank oder Datenquelle löschen, bietet Amazon Bedrock zwei Richtlinien zum Löschen von Daten an: Delete (Standard) und Retain. Wenn Sie die Richtlinie Delete auswählen, werden Vektoren im Vektorindex und im Vektor-Bucket automatisch gelöscht.

Abfragen und Abrufen

Nachdem Ihre Wissensdatenbank eingerichtet ist, haben Sie folgende Optionen:

  • Rufen Sie mithilfe der Operation API abrufen-Abschnitte aus Ihren Quelldaten ab.

  • Generieren Sie mithilfe der RetrieveAndGenerateAPI-Operation Antworten auf der Grundlage der abgerufenen Blöcke.

  • Testen Sie Abfragen direkt in der Amazon Bedrock-Konsole.

Die Antworten werden mit Verweisen auf die ursprünglichen Quelldaten zurückgesendet.

Einschränkungen

Wenn Sie S3 Vectors mit Amazon Bedrock Knowledge Bases verwenden, sollten Sie die folgenden Einschränkungen kennen:

  • Nur semantische Suche: S3 Vectors unterstützt die semantische Suche, jedoch keine hybriden Suchfunktionen.

  • Größenbeschränkungen für S3-Vektoren: Jeder Vektor hat eine Gesamtgrößenbeschränkung für Metadaten und eine Größenbeschränkung für filterbare Metadaten, wodurch benutzerdefinierte Metadaten und Filteroptionen eingeschränkt werden können. Wenn Sie S3 Vectors als Vektorspeicher mit Amazon Bedrock Knowledge Bases verwenden, können Sie bis zu 1 KB an benutzerdefinierten Metadaten und 35 Metadatenschlüsseln pro Vektor anhängen.

  • Einschränkungen der Chunking-Strategie: Wenn Sie in Amazon Bedrock Knowledge Bases sehr hohe Token-Zahlen mit hierarchischem Chunking verwenden, können Sie die maximalen Größenbeschränkungen für Metadaten überschreiten, da Eltern-Kind-Chunk-Beziehungen und hierarchischer Kontext als nicht filterbare Metadaten in S3 Vectors gespeichert werden. Weitere Informationen zu den Größenbeschränkungen für Metadaten pro Vektor finden Sie unter. Begrenzungen und Einschränkungen

  • Nur Gleitkomma-Vektoren: Binäre Vektoreinbettungen werden nicht unterstützt.

Umfassende Anleitungen zur Arbeit mit Amazon Bedrock Knowledge Bases finden Sie unter Daten abrufen und KI-Antworten mit Amazon Bedrock Knowledge Bases generieren im Amazon Bedrock User Guide.