

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

# Funktionsweise von Bedrock Data Automation


Mit Bedrock Data Automation (BDA) können Sie die Ausgabe auf der Grundlage Ihrer Verarbeitungsanforderungen für einen bestimmten Datentyp konfigurieren: Dokumente, Bilder, Video oder Audio. BDA kann eine Standardausgabe oder eine benutzerdefinierte Ausgabe generieren. Im Folgenden finden Sie einige wichtige Konzepte zum Verständnis der Funktionsweise von BDA. Wenn Sie noch keine Erfahrung mit BDA haben, beginnen Sie mit den Informationen zur Standardausgabe.
+ Standardausgabe – Wenn eine Datei ohne weitere Informationen an BDA gesendet wird, wird die Standardausgabe zurückgegeben. Diese enthält die basierend auf dem Datentyp am häufigsten benötigten Informationen. Beispiele hierfür sind Audio-Transkriptionen, Szenenzusammenfassungen für Videos und Dokumentzusammenfassungen. Diese Ausgaben können mithilfe von Projekten an Ihren Anwendungsfall angepasst werden. Weitere Informationen finden Sie unter [Standardausgabe in Bedrock Data Automation](bda-standard-output.md).
+ Benutzerdefinierte Ausgabe – Nur für Dokumente, Audio und Bilder. Verwenden Sie die benutzerdefinierte Ausgabe, um genau zu definieren, welche Informationen Sie mithilfe einer Vorlage extrahieren möchten. Eine Vorlage besteht aus einer Liste erwarteter Felder, die Sie aus einer Datei abrufen möchten. Jedes Feld stellt eine Information dar, die extrahiert werden muss, um Ihren spezifischen Anwendungsfall zu erfüllen. Sie können Ihre eigenen Vorlagen erstellen oder vordefinierte Vorlagen aus dem BDA-Vorlagenkatalog auswählen. Weitere Informationen finden Sie unter [Benutzerdefinierte Ausgabe und Vorlagen](bda-custom-output-idp.md).
+ Projekte – Ein Projekt ist eine BDA-Ressource, mit der Sie Ausgabekonfigurationen ändern und organisieren können. Jedes Projekt kann Konfigurationen der Standardausgabe für Dokumente, Bilder, Video und Audio sowie benutzerdefinierte Ausgabevorlagen für Dokumente, Audio und Bilder enthalten. Im `InvokeDataAutomationAsync`-API-Aufruf wird auf Projekte verwiesen, um BDA Anweisungen zur Verarbeitung der Dateien zu geben. Weitere Informationen zu Projekten und Anwendungsfällen finden Sie unter [Projekte in Bedrock Data Automation](bda-projects.md).

# Projekte in Bedrock Data Automation


Eine Möglichkeit, Dateien mit Amazon Bedrock Data Automation (BDA) zu verarbeiten, besteht darin, ein Projekt zu erstellen. Ein Projekt ist eine Gruppierung von Standard- und benutzerdefinierten Ausgabekonfigurationen. Standardausgaben sind in Projekten erforderlich, benutzerdefinierte Ausgaben sind jedoch optional. Wenn Sie die `InvokeDataAutomationAsync`-API mit einem Projekt-ARN aufrufen, wird die Datei automatisch mit den in diesem Projekt definierten Konfigurationseinstellungen verarbeitet. Die Ausgabe wird dann basierend auf der Konfiguration des Projekts generiert.

Einem Projekt kann eine Phase zugewiesen werden, `LIVE` oder `DEVELOPMENT`. Jede Phase ist eine eindeutige und veränderbare Version des Projekts. Das bedeutet, dass Sie die `DEVELOPMENT`-Phase für Bearbeitungen oder Tests verwenden und in der `LIVE`-Phase Kundenanfragen verarbeiten können. `DEVELOPMENT`-Projekte können nicht in der Konsole aufgerufen werden und müssen über die API geändert und aufgerufen werden.

Ein Projekt ermöglicht es Ihnen, eine einzelne Ressource für mehrere Dateitypen zu verwenden. Beispielsweise wird eine Audiodatei, die mit dem Projektnamen „ABC“ an BDA gesendet wird, mit der Standard-Audioausgabekonfiguration des Projekts „ABC“ verarbeitet. Ein Dokument, Das mit dem Projektnamen „ABC“ an BDA gesendet wird, wird mit der Standard-Ausgabekonfiguration für Dokumente des Projekts „ABC“ verarbeitet.

Projekte bieten Ihnen mehr Flexibilität bei der Einrichtung von Standardausgaben. Jede Standardausgabe hat ihre eigenen konfigurierbaren Optionen, z. B. Transkripte oder Zusammenfassungen, und Projekte ermöglichen es Ihnen, diese Optionen so zu ändern, dass sie besser zu Ihrem Anwendungsfall passen. Sie können ein Projekt auch mit Vorlagen für Dokumente, Audio und Bilder konfigurieren, um eine benutzerdefinierte Ausgabe zu definieren. Ein Projekt, das für die Generierung einer benutzerdefinierten Ausgabe konfiguriert ist, generiert automatisch auch eine Standardausgabe.

In den folgenden Abschnitten werden einige Beispiele für die Verwendung von Projekten beschrieben.

## Verwenden von Projekten mit der Standardausgabe


Betrachten Sie einen Anwendungsfall, in dem Sie nur Transkript-Zusammenfassungen Ihrer vollständigen Audio- und Videodateien extrahieren möchten. Wenn Sie Audio- und Videodateien an BDA senden, erhalten Sie standardmäßig die Transkript-Zusammenfassungen zusammen mit vollständigen Transkripten, Zusammenfassungen auf Szenenebene, erkanntem Text und anderen Informationen. Für diesen Anwendungsfall möchten Sie nicht die zusätzliche Zeit und Ressourcen aufwenden, um Informationen zu erfassen, die Sie nicht benötigen. Also können Sie für diesen Anwendungsfall ein Standardausgabeprojekt so konfigurieren, dass nur die Zusammenfassungsfunktion für Audio- und Videodateien aktiviert wird.

Erstellen Sie dazu mithilfe der API oder in der Konsole ein Projekt und ändern Sie die Standardausgabeeinstellungen für Audio und Video. Aktivieren Sie für Videos die Option **Zusammenfassung des gesamten Videos**, stellen Sie jedoch sicher, dass andere Extraktionen (z. B. vollständiges Audio-Transkript, Szenenzusammenfassungen, Inhaltsmoderation usw.) deaktiviert sind. Wiederholen Sie diese Konfiguration für Audioinhalte. Nachdem Sie das Projekt so konfiguriert haben, dass nur Zusammenfassungen generiert werden, speichern Sie das Projekt und notieren Sie sich seinen Amazon-Ressourcennamen (ARN). Dieser ARN kann für die `InvokeDataAutomationAsync`-Operation verwendet werden, um Dateien in großem Umfang zu verarbeiten. Wenn Sie eine Audio- oder Videodatei an BDA übergeben und den Projekt-ARN angeben, erhalten Sie als Ausgabe nur die Zusammenfassungen für jede der Dateien. Beachten Sie, dass in diesem Beispiel keine Konfiguration für Dokumente oder Bilder durchgeführt wurde. Das bedeutet, dass Sie, wenn Sie ein Bild oder Dokument mit diesem Projekt-ARN an BDA übergeben, für diese Dateitypen die Standardausgabe erhalten.

## Verwenden von Projekten mit benutzerdefinierter Ausgabe und Standardausgabe


Gehen wir für diesen Anwendungsfall davon aus, dass Sie Standardausgabe-Zusammenfassungen für Dokumente und Audiodateien generieren und außerdem benutzerdefinierte Felder aus Ihren Dokumenten extrahieren möchten. Nachdem Sie ein Projekt erstellt haben, konfigurieren Sie die Standardausgabe für Audio so, dass **Vollständige Audiozusammenfassung** aktiviert ist, und stellen Sie sicher, dass andere Extraktionen nicht aktiviert sind. Wiederholen Sie diese Konfiguration der Standardausgabe für Dokumente. Anschließend können Sie die benutzerdefinierte Ausgabe für Dokumente konfigurieren, indem Sie eine neue Vorlage oder eine bereits vorhandene Vorlage aus dem globalen BDA-Katalog hinzufügen. Für Dokumente, die mit diesem Projekt-ARN an BDA übergeben werden, werden die Zusammenfassungen des vollständigen Dokuments der Standardausgabe und die Ausgabe der Vorlage für die definierten benutzerdefinierten Felder generiert. Für Audiodateien, die mit diesem Projekt-ARN an BDA übergeben werden, werden vollständige Zusammenfassungen generiert.

Bei der Verarbeitung von Dokumenten sollten Sie möglicherweise mehrere Vorlagen für verschiedene Arten von Dokumenten verwenden, die an Ihr Projekt übergeben werden. An ein Projekt können bis zu 40 Dokumentvorlagen angehängt werden. BDA ordnet Ihre Dokumente automatisch der entsprechenden Vorlage zu, die in Ihrem Projekt konfiguriert ist, und generiert anhand dieser Vorlage eine benutzerdefinierte Ausgabe. Außerdem können Sie auch mehrere Dokumente gleichzeitig übergeben. Wenn Sie eine Datei übergeben, die mehrere Dokumente enthält, können Sie das Dokument bei der Erstellung Ihres Projekts aufteilen. Falls Sie sich dafür entscheiden, scannt BDA die Datei und teilt sie je nach Kontext in einzelne Dokumente auf. Diese einzelnen Dokumente werden dann zur Verarbeitung der passenden Vorlage zugeordnet.

Derzeit wird für Bilder nur eine Vorlagendefinition pro Projekt unterstützt. Die Bilddateitypen JPG und PNG können aufgrund ihres Inhalts als Bilder oder als gescannte Dokumente behandelt werden. Wir empfehlen Ihnen, bei der Verarbeitung der benutzerdefinierten Ausgabe für Dokumente eine benutzerdefinierte Vorlage für Bilder zu erstellen, damit BDA die gewünschte Ausgabe für Bilddateien bereitstellt, die Text enthalten.

Für Audiodateien wird ebenfalls nur eine Vorlagendefinition pro Projekt unterstützt.

# Aufteilen von Dokumenten bei der Verwendung von Projekten


Amazon Bedrock Data Automation (BDA) unterstützt das Teilen von Dokumenten bei Verwendung der Amazon Bedrock API. Wenn diese Option aktiviert ist, kann BDA eine PDF-Datei mit mehreren logischen Dokumenten zur Verarbeitung in separate Dokumente aufteilen. 

Sobald die Aufteilung abgeschlossen ist, wird jedes Segment des geteilten Dokuments unabhängig verarbeitet. Das bedeutet, dass ein Eingabedokument verschiedene Dokumenttypen enthalten kann. Wenn Sie beispielsweise über eine PDF-Datei mit 3 Kontoauszügen und einem W2-Formular verfügen, wird beim Aufteilen versucht, diese in 4 separate Dokumente aufzuteilen, die einzeln verarbeitet werden.

Die automatische Aufteilung in BDA unterstützt Dateien mit bis zu 3 000 Seiten und einzelne Dokumente mit jeweils bis zu 20 Seiten.

Die Option zum Aufteilen von Dokumenten ist standardmäßig deaktiviert, kann aber bei Verwendung der API aktiviert werden. Im Folgenden finden Sie ein Beispiel für die Erstellung eines Projekts, bei dem die Aufteilung aktiviert ist. Die Auslassungspunkte stellen weitere Vorlagen dar, die für das Projekt bereitgestellt wurden.

```
   response = client.create_data_automation_project(
    projectName=project_name,
    projectDescription="Provide a project description",
    projectStage='LIVE',
    standardOutputConfiguration=output_config,
    customOutputConfiguration={
    'blueprints': [
        {
        'blueprintArn': Blueprint ARN,
        'blueprintStage': 'LIVE'
        },
        ...
        ]
        },
         overrideConfiguration={'document': {'splitter': {'state': 'ENABLED'}}}
)
```

Der Teil, der den Aufteilungsprozess ermöglicht, ist die overrideConfiguration-Zeile. Diese Zeile richtet die Aufteilung ein und ermöglicht es Ihnen, mehrere Dokumente innerhalb derselben Datei zu übergeben.

Dokumente werden nach den semantischen Grenzen im Dokument aufgeteilt. 

Die Aufteilung von Dokumenten erfolgt unabhängig von der Anwendung von Vorlagen und aufgeteilte Dokumente werden der passendsten Vorlage zugeordnet. Weitere Informationen zur Zuordnung von Vorlagen durch BDA finden Sie unter [Grundlagen zur Zuordnung von Vorlagen](#bda-blueprint-matching).

## Grundlagen zur Zuordnung von Vorlagen


Die Zuordnung von Vorlagen basiert auf den folgenden Elementen:
+  Name der Vorlage 
+  Beschreibung der Vorlage 
+  Vorlagenfelder 

Bei der Verarbeitung von Dokumenten können Sie mehrere Vorlagen zum Abgleichen angeben. Dies ermöglicht die Verarbeitung verschiedener Dokumenttypen mit entsprechenden Vorlagen. Sie können IDs beim Aufrufen der Datenautomatisierungs-API mehrere Blueprints angeben, und BDA versucht, jedes Dokument dem am besten passenden Blueprint zuzuordnen. Dies ermöglicht die Verarbeitung von gemischten Dokumenttypen in einem einzigen Batch. Dies ist nützlich, wenn zu erwarten ist, dass Dokumente unterschiedliche Typen aufweisen (z. B. Kontoauszüge, Rechnungen, Reisepässe).

Wenn Sie separate Vorlagen benötigen, weil die Dokumentformate sehr unterschiedlich sind oder spezielle Prompts erfordern, kann die Erstellung einer Vorlage pro Dokumenttyp beim Abgleich helfen. Weitere Informationen zum Erstellen hilfreicher Vorlagen finden Sie unter [Best Practices für die Erstellung von Vorlagen](#bda-blueprint-best-practices).

## Best Practices für die Erstellung von Vorlagen


 Halten Sie sich an die folgenden bewährten Methoden, um Ihre Vorlagen optimal zu nutzen: 
+ Geben Sie die Namen und Beschreibungen der Vorlagen explizit und detailliert an, um den Abgleich zu erleichtern. 
+ Durch die Bereitstellung mehrerer relevanter Vorlagen kann BDA die beste Übereinstimmung auswählen. Erstellen Sie separate Vorlagen für deutlich unterschiedliche Dokumentformate. 
+ Erwägen Sie, spezielle Blueprints für jede vendor/document Quelle zu erstellen, wenn Sie maximale Genauigkeit benötigen
+ Nehmen Sie nicht zwei Vorlagen desselben Typs in ein Projekt auf (z. B. zwei W2-Vorlagen). Für die Verarbeitung eines Dokuments werden Informationen aus dem Dokument selbst und aus der Vorlage verwendet. Wenn mehrere Vorlagen desselben Typs in einem Projekt vorhanden sind, führt dies zu einer schlechteren Leistung. 

Durch die Aufteilung von Dokumenten und den Abgleich mit mehreren Vorlagen kann BDA unterschiedliche Dokumentensätze flexibler handhaben und gleichzeitig für jedes Dokument die am besten geeignete Extraktionslogik anwenden.

# Modalitäten für die Deaktivierung und Weiterleitung von Dateitypen


Standardmäßig verarbeiten Projekte in BDA unterstützte Dateitypen, indem sie nach verschiedenen semantischen Modalitäten sortiert werden. Wenn Sie Ihr Projekt erstellen oder bearbeiten, können Sie ändern, welche Modalitäten verarbeitet werden und welche Dateitypen an welche Modalitäten gesendet werden. In diesem Abschnitt werden wir uns mit der Aktivierung und Deaktivierung verschiedener Modalitäten, der Weiterleitung von Dateien an bestimmte Modalitäten und dem Standard-Weiterleitungsverfahren für BDA befassen.

## Deaktivieren der Modalitätsverarbeitung


Wenn Sie ein Projekt erstellen, denken Sie dabei möglicherweise an einen Anwendungsfall, für den nicht alle Arten von Dateien verarbeitet werden müssen. Sie könnten beispielsweise nur Dokumente und Audiodateien verarbeiten wollen. Wenn dies der Fall ist, möchten Sie nicht, dass BDA ein JPEG sendet, das als Bild oder als Video verarbeitet werden MP4 soll. Mit der Modalitätsaktivierung können Sie bestimmte Modalitäten in einem Projekt deaktivieren und so die Antworten der BDA-Verarbeitung kuratieren.

**Deaktivieren von Modalitäten mit der BDA-Konsole**  
Wenn Sie die BDA-Konsole verwenden, erfolgt die Modalitätsaktivierung anhand einer Checkliste, in der Sie einfach jede Modalität aus- oder abwählen, während Sie Ihr Projekt bearbeiten oder erstellen. Diese Optionen befinden sich auf der Registerkarte „Erweiterte Einstellungen“. Für ein Projekt muss mindestens eine Modalität ausgewählt werden.

![\[Modality enablement options with checkboxes for document, image, video, and audio.\]](http://docs.aws.amazon.com/de_de/bedrock/latest/userguide/images/bda/modalityenableconsole.png)


**Deaktivieren von Modalitäten mit der BDA-API**  
Bei Verwendung der BDA-API erfolgt die Modalitätsaktivierung über das `overrideConfiguration`-Anfrageselement, das sich in der `CreateDataAutomation`-Operation befindet. Jede Modalität hat einen zugehörigen Abschnitt, in dem Sie die Modalität `ENABLED` oder `DISABLED` deklarieren können. Im Folgenden finden Sie ein Beispiel für das `overrideConfiguration`-Element, bei dem nur die Dokument- und Audiomodalitäten aktiviert sind. Das Flag `modalityProcessing` ist standardmäßig auf `ENABLED` gesetzt.

```
"overrideConfiguration" : {
    "document": {
        "splitter": {
            "state": ENABLED
        },
        "modalityProcessing": {
            "state": ENABLED
        },
    },
    "image": {
        "modalityProcessing": {
            "state": DISABLED
        }
    },
    "video": {
        "modalityProcessing": {
            "state": DISABLED 
        }
    },
    "audio": {
        "modalityProcessing": {
            "state": ENABLED
        }
    },
    ...
}
```

Die Auslassungspunkte am Ende dieses Abschnitts zeigen, dass das `modalityRouting`-Element entfernt wurde. Darauf werden wir im nächsten Abschnitt näher eingehen.

## Weiterleiten von Dateien an bestimmte Verarbeitungsarten


Bestimmte Dateitypen können auf der Grundlage einer Vielzahl von Faktoren an unterschiedliche Modalitäten weitergeleitet werden. Mit Modalitäts-Routing können Sie festlegen, dass bestimmte Dateitypen manuell an eine bestimmte Modalität weitergeleitet werden. JPEGs und PNGs kann entweder zur Dokument- oder Bildverarbeitung weitergeleitet werden. MP4s und MOVs kann entweder zur Video- oder Audioverarbeitung weitergeleitet werden.

**Weiterleitung mit der BDA-Konsole**  
Wenn Sie sich auf der Registerkarte „Erweiterte Einstellungen“ befinden, können Sie beim Erstellen oder Bearbeiten einer Vorlage wählen, ob Sie eine neue manuelle Modalitätsweiterleitung hinzufügen möchten. Auf diese Weise können Sie einen der 4 verfügbaren Dateitypen auswählen und dann festlegen, an welche Verarbeitungsmodalität er weitergeleitet werden soll. Unten sehen Sie einen Screenshot der Konsole mit einer manuellen Modalitätsweiterleitung, die PNG-Dateien an die Dokumentverarbeitungsmodalität sendet.

**Anmerkung**  
Die Einstellungen für JPEG-Dateien gelten sowohl für „.jpeg“- als auch für „.jpg“-Dateien. Die MP4 Einstellungen gelten für beide „.mp4“ - „.m4v“ -Dateien.

![\[Eine Abbildung der AWS-Konsole mit zwei Dropdown-Menüs für Dateityp und Modalitätsziel. Als Werte sind PNG und Dokument ausgewählt.\]](http://docs.aws.amazon.com/de_de/bedrock/latest/userguide/images/bda/manualrouting.png)


**Weiterleitung mit der BDA-API**  
Ähnlich wie bei der Modalitätsaktivierung erfolgt die Modalitätsweiterleitung über das `overrideConfiguration`-Anfrageselement. Im Folgenden finden Sie ein Beispiel für den `modalityRouting`-Teil von `overrideConfiguration`. In diesem Beispiel wird vorausgesetzt, dass alle Modalitäten aktiviert sind, und es werden JPEG- und PNG-Dateien an die Dokumentmodalität MP4 und MOV-Dateien an die Audiomodalität weitergeleitet.

```
...
   "modalityRouting": {
        "jpeg": DOCUMENT, 
        "png": DOCUMENT,  
        "mp4": AUDIO,     
        "mov": AUDIO      
    }
}
```

Die Auslassungszeichen am Anfang des Beispiels zeigen, dass der Rest von `overrideConfiguration` entfernt wurde. Weitere Informationen finden Sie im Abschnitt zur Aktivierung von Modalitäten und zur Funktion für die Dokumentaufteilung.

## Standard-Routing für die API InvokeDataAutomationAsync


Wenn Sie keine eigenen Weiterleitungsverfahren einrichten, verwendet BDA eine Reihe von Standardprozeduren, die anhand des Dateityps bestimmen, zu welcher Modalität BDA weiterleitet. Die Standardverfahren sind in der folgenden Tabelle aufgeführt.

PNGs und JPEGs listet Semantic Classifer als Standardverhalten auf. Das bedeutet, dass BDA anhand interner Modelle Indikatoren dafür betrachtet, ob es sich bei einer übergebenen Datei um ein Bild oder ein Dokument handelt, und die Weiterleitung automatisch durchführt.


| Dateitypen | Standardverhalten für Weiterleitung | 
| --- | --- | 
|  PNG  |  Semantischer Klassifikator; entweder Bild oder Dokument  | 
|  JPEG  |  Semantischer Klassifikator; entweder Bild oder Dokument  | 
|  PDF, TIFF  |  Dokument  | 
|  MP4, MOV  |  Video  | 
|  AMR, FLAC, M4A, OGG, WEBM MP3, WAV  |  Audio  | 

## InvokeDataAutomation Standard-Routing für die API


Die [InvokeDataAutomation](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_data-automation-runtime_InvokeDataAutomation.html)API berücksichtigt auch anhand interner Modelle Indikatoren dafür, ob es sich bei einer eingereichten PNG- oder JPEG-Datei um ein Bild oder ein Dokument handelt, und führt das Routing automatisch durch. Die Standardverfahren sind in der folgenden Tabelle aufgeführt.

PNGs und JPEGs listet Semantic Classifier als Standardverhalten auf. Das bedeutet, dass BDA anhand interner Modelle Indikatoren dafür betrachtet, ob es sich bei einer übergebenen Datei um ein Bild oder ein Dokument handelt, und die Weiterleitung automatisch durchführt. PDF- und TIFF-Dateien werden zur Verarbeitung an die Modalität Dokumente weitergeleitet. InvokeDataAutomation Die API unterstützt derzeit keine Audio- und Videodateien.


| Dateitypen | Standardverhalten für Weiterleitung | 
| --- | --- | 
|  PNG  |  Semantischer Klassifikator; entweder Bild oder Dokument  | 
|  JPEG  |  Semantischer Klassifikator; entweder Bild oder Dokument  | 
|  PDF, TIFF  |  Dokument  | 