

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

# Ground Truth Streaming-Kennzeichnungsaufträge
<a name="sms-streaming-labeling-job"></a>

Wenn Sie ständig neue Datenobjekte zur Kennzeichnung an Amazon SageMaker Ground Truth senden möchten, verwenden Sie einen Streaming-Labeling-Job. Streaming-Kennzeichnungsaufträge ermöglichen Ihnen Folgendes:
+ Sie können mithilfe eines ständig laufenden Kennzeichnungsauftrags neue Datensatz-Objekte in Echtzeit an Auftragnehmer senden. Auftragnehmer erhalten kontinuierlich neue Datenobjekte zum Beschriften, solange der Kennzeichnungsauftrag aktiv ist und neue Objekte an ihn gesendet werden.
+ Sie können sich einen Überblick über die Anzahl der Objekte verschaffen, die sich in der Warteschlange befinden und darauf warten, beschriftet zu werden. Verwenden Sie diese Informationen, um den Fluss der Datenobjekte zu steuern, die an Ihren Kennzeichnungsauftrag gesendet werden.
+ Sie können Bezeichnungsdaten für einzelne Datenobjekte in Echtzeit erhalten, wenn Auftragnehmer die Bezeichnungen beendet haben. 

Ground Truth Streaming-Kennzeichnungsaufträge bleiben aktiv, bis sie manuell gestoppt werden oder länger als 10 Tage inaktiv waren. Sie können zeitweise neue Datenobjekte an Auftragnehmer senden, solange der Kennzeichnungsauftrag aktiv ist.

Wenn Sie ein neuer Benutzer von Ground Truth Streaming-Kennzeichnungsaufträgen sind, wird empfohlen, [Funktionsweise](#sms-streaming-how-it-works) zu lesen. 

Mithilfe von [Erstellen eines Streaming-Beschriftungsjobs](sms-streaming-create-job.md) erfahren Sie, wie Sie einen Streaming-Kennzeichnungsauftrag erstellen.

**Anmerkung**  
Ground Truth Streaming-Labeling-Jobs werden nur über die SageMaker API unterstützt.

## Funktionsweise
<a name="sms-streaming-how-it-works"></a>

Wenn Sie einen Ground Truth Streaming-Kennzeichnungsauftrag erstellen, bleibt der Auftrag aktiv, bis er manuell gestoppt wird, länger als 10 Tage inaktiv ist oder nicht auf Eingabedatenquellen zugreifen kann. Sie können zeitweise neue Datenobjekte an Auftragnehmer senden, solange der Vorgang aktiv ist. Ein Auftragnehmer kann weiterhin neue Datenobjekte in Echtzeit empfangen, solange die Gesamtzahl der Aufgaben, die dem Auftragnehmer derzeit zur Verfügung stehen, geringer ist als der Wert in [https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_HumanTaskConfig.html#sagemaker-Type-HumanTaskConfig-MaxConcurrentTaskCount](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_HumanTaskConfig.html#sagemaker-Type-HumanTaskConfig-MaxConcurrentTaskCount). Andernfalls wird das Datenobjekt zur späteren Verarbeitung an eine Warteschlange gesendet, die Ground Truth in Ihrem Namen in [Amazon Simple Queue Service](https://docs.aws.amazon.com/AWSSimpleQueueService/latest/SQSDeveloperGuide/welcome.html) (Amazon SQS) erstellt. Diese Aufgaben werden an Auftragnehmer gesendet, sobald die Gesamtzahl der Aufgaben, die einem Auftragnehmer derzeit zur Verfügung stehen, `MaxConcurrentTaskCount` unterschreitet. Wenn ein Datenobjekt nach 14 Tagen nicht an einen Auftragnehmer gesendet wird, läuft es ab. Sie können die Anzahl der ausstehenden Aufgaben in der Warteschlange anzeigen und die Anzahl der Objekte anpassen, die Sie an den Kennzeichnungsauftrag senden. Sie können beispielsweise die Geschwindigkeit verringern, mit der Sie Objekte an den Kennzeichnungsauftrag senden, wenn der Backlog an ausstehenden Objekten einen Schwellenwert überschreitet. 

**Topics**
+ [Funktionsweise](#sms-streaming-how-it-works)
+ [Senden von Daten an einen Streaming-Kennzeichnungsauftrag](sms-streaming-how-it-works-send-data.md)
+ [Verwalten von Kennzeichnungsanfragen mit einer Amazon SQS-Warteschlange](sms-streaming-how-it-works-sqs.md)
+ [Empfangen von Ausgabedaten aus einem Streaming-Kennzeichnungsauftrag](sms-streaming-how-it-works-output-data.md)
+ [Umgang mit doppelten Nachrichten](sms-streaming-impotency.md)

# Senden von Daten an einen Streaming-Kennzeichnungsauftrag
<a name="sms-streaming-how-it-works-send-data"></a>

Sie können optional einmalig Eingabedaten an einen Streaming-Kennzeichnungsauftrag senden, wenn Sie den Kennzeichnungsauftrag mithilfe einer Eingabemanifestdatei erstellen. Sobald der Kennzeichnungsauftrag gestartet wurde und der Status `InProgress` lautet, können Sie mithilfe Ihres Amazon SNS-Eingabethemas und der Amazon-S3-Ereignisbenachrichtigungen in Echtzeit neue Datenobjekte an den Kennzeichnungsauftrag senden. 

***Reichen Sie Datenobjekte ein, wenn Sie den Kennzeichnungsauftrag starten (einmalig):***
+ **Eine Eingabemanifestdatei verwenden** – Sie können optional eine Eingabemanifestdatei mit Amazon-S3-URI in `ManifestS3Uri` angeben, wenn Sie den Streaming-Labeling-Auftrag erstellen. Ground Truth sendet jedes Datenobjekt in der Manifestdatei zur Kennzeichnung an die Mitarbeiter, sobald der Kennzeichnungsauftrag gestartet wird. Weitere Informationen hierzu finden Sie unter [Erstellen Sie eine Manifestdatei (optional)](sms-streaming-manifest.md).

  Nachdem Sie eine Anforderung zur Erstellung des Streaming-Kennzeichnungsauftrags abgesendet haben, lautet der Status `Initializing`. Sobald der Kennzeichnungsauftrag aktiv ist, ändert sich der Status in `InProgress`. Sie können dann Echtzeitoptionen verwenden, um zusätzliche Datenobjekte zur Kennzeichnung zu senden. 

***Datenobjekte in Echtzeit senden:***
+ **Datenobjekte mithilfe von Amazon SNS-Nachrichten** senden – Sie können Ground Truth neue Datenobjekte zur Kennzeichnung senden, indem Sie eine Amazon SNS-Nachricht senden. Sie senden diese Nachricht an ein Amazon SNS-Eingabethema, das Sie bei der Erstellung des Streaming-Kennzeichnungsauftrags erstellen und angeben. Weitere Informationen finden Sie unter [Senden von Datenobjekten mit Amazon SNS](#sms-streaming-how-it-works-sns).
+ **Datenobjekte senden, indem Sie sie in einem Amazon-S3-Bucket platzieren** – Jedes Mal, wenn Sie einem Amazon-S3-Bucket ein neues Datenobjekt hinzufügen, können Sie Ground Truth auffordern, dieses Objekt zur Kennzeichnung zu verarbeiten. Dazu fügen Sie dem Bucket eine Ereignisbenachrichtigung hinzu, sodass Ihr Amazon SNS-Eingabethema jedes Mal benachrichtigt wird, wenn ein neues Objekt zu diesem Bucket hinzugefügt (oder *in diesem erstellt*) wird. Weitere Informationen finden Sie unter [Senden von Datenobjekten mit Amazon S3](#sms-streaming-how-it-works-s3). Diese Option ist nicht für textbasierte Labeling-Aufgaben wie Textklassifizierung und Erkennung benannter Entitäten verfügbar. 
**Wichtig**  
Wenn Sie die Amazon-S3-Konfiguration verwenden, verwenden Sie nicht denselben Amazon-S3-Speicherort für Ihre Eingabedatenkonfiguration und Ihre Ausgabedaten. Sie geben das S3-Präfix für Ihre Ausgabedaten an, wenn Sie einen Kennzeichnungsauftrag erstellen.

## Senden von Datenobjekten mit Amazon SNS
<a name="sms-streaming-how-it-works-sns"></a>

Mit Amazon Simple Notification Service (Amazon SNS) können Sie Datenobjekte an Ihren Streaming-Kennzeichnungsauftrag senden. Amazon SNS ist ein Webservice, der die Zustellung von Nachrichten an und von *Endpunkten* (z. B. eine E-Mail-Adresse oder AWS Lambda Funktion) koordiniert und verwaltet. Ein Amazon SNS-*Thema* fungiert als Kommunikationskanal zwischen zwei oder mehr Endpunkten. Sie verwenden Amazon SNS, um neue Datenobjekte an das im [https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_CreateLabelingJob.html](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_CreateLabelingJob.html)-Parameter `SnsTopicArn` in `InputConfig` angegebene Thema zu senden oder zu *veröffentlichen*. Das Format dieser Nachrichten entspricht dem einer einzelnen Zeile aus einer [Eingabemanifestdatei](https://docs.aws.amazon.com/sagemaker/latest/dg/sms-data-input.html). 

Sie können beispielsweise einen Text an einen aktiven Kennzeichnungsauftrag der Textklassifizierung senden, indem Sie ihn in Ihrem Eingabethema veröffentlichen. Die von Ihnen veröffentlichte Nachricht könnte wie folgt aussehen:

```
{"source": "Lorem ipsum dolor sit amet"}
```

Um ein neues Bildobjekt an einen Kennzeichnungsauftrag der Bildklassifizierung zu senden, könnte Ihre Nachricht wie folgt aussehen:

```
{"source-ref": "s3://amzn-s3-demo-bucket/example-image.jpg"}
```

**Anmerkung**  
Sie können Ihren Amazon SNS SNS-Nachrichten auch benutzerdefinierte IDs Deduplizierungs- und Deduplizierungsschlüssel hinzufügen. Weitere Informationen hierzu finden Sie unter [Umgang mit doppelten Nachrichten](sms-streaming-impotency.md).

Wenn Ground Truth Ihren Streaming-Kennzeichnungsauftrag erstellt, abonniert es Ihr Amazon SNS-Eingabethema. 

## Senden von Datenobjekten mit Amazon S3
<a name="sms-streaming-how-it-works-s3"></a>

Sie können ein oder mehrere neue Datenobjekte an einen Streaming-Kennzeichnungsauftrag senden, indem Sie sie in einem Amazon-S3-Bucket platzieren, der mit einer Amazon SNS-Ereignisbenachrichtigung konfiguriert ist. Sie können ein Ereignis so einrichten, dass Ihr Amazon SNS-Eingabethema jedes Mal benachrichtigt wird, wenn in Ihrem Bucket ein neues Objekt erstellt wird. Sie müssen dasselbe Amazon SNS-Eingabethema im [https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_CreateLabelingJob.html](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_CreateLabelingJob.html)-Parameter `SnsTopicArn` in `InputConfig` angeben.

Jedes Mal, wenn Sie einen Amazon-S3-Bucket so konfigurieren, dass er Benachrichtigungen an Amazon SNS sendet, veröffentlicht Ground Truth ein Testereignis, `"s3:TestEvent"`, um sicherzustellen, dass das Thema existiert und der Besitzer des angegebenen Amazon-S3-Buckets berechtigt ist, zu dem angegebenen Thema zu veröffentlichen. Es wird empfohlen, dass die Amazon-S3-Verbindung mit Amazon SNS einzurichten, bevor Sie einen Streaming-Kennzeichnungsauftrag starten. Wenn Sie dies nicht tun, kann dieses Testereignis als Datenobjekt registriert und zur Kennzeichnung an Ground Truth gesendet werden. 

**Wichtig**  
Wenn Sie die Amazon-S3-Konfiguration verwenden, verwenden Sie nicht denselben Amazon-S3-Speicherort für Ihre Eingabedatenkonfiguration und Ihre Ausgabedaten. Sie geben das S3-Präfix für Ihre Ausgabedaten an, wenn Sie einen Kennzeichnungsauftrag erstellen.  
Bei bildbasierten Kennzeichnungsaufträge verlangt Ground Truth, dass an alle S3-Buckets eine CORS-Richtlinie angefügt wird. Weitere Informationen hierzu finden Sie unter [CORS-Anforderung für Eingabebilddaten](sms-cors-update.md).

Sobald Sie Ihren Amazon-S3-Bucket konfiguriert und Ihren Kennzeichnungsauftrag erstellt haben, können Sie Ihrem Bucket Objekte hinzufügen. Ground Truth sendet dieses Objekt dann entweder an Auftragnehmer oder platziert es in Ihrer Amazon SQS-Warteschlange. 

Weitere Informationen hierzu finden Sie unter [Erstellen von Amazon-S3-basierten Bucket-Ereignisbenachrichtigungen gemäß dem in Ihrem Labeling-Job definierten Amazon SNS](sms-streaming-s3-setup.md).

**Wichtig**  
Diese Option ist nicht für textbasierte Kennzeichnungsaufträge wie Textklassifizierung und Erkennung benannter Entitäten verfügbar.

# Verwalten von Kennzeichnungsanfragen mit einer Amazon SQS-Warteschlange
<a name="sms-streaming-how-it-works-sqs"></a>

Wenn Ground Truth Ihren Streaming-Labeling-Job erstellt, erstellt es eine Amazon SQS SQS-Warteschlange in dem AWS Konto, das zur Erstellung des Labeling-Jobs verwendet wurde. Der Warteschlangenname ist `GroundTruth-labeling_job_name`, wobei `labeling_job_name` der Name Ihres Kennzeichnungsauftrags in Kleinbuchstaben ist. Wenn Sie Datenobjekte an Ihren Kennzeichnungsauftrag senden, sendet Ground Truth die Datenobjekte entweder direkt an Auftragnehmer oder stellt die Aufgabe zur späteren Verarbeitung in Ihre Warteschlange. Wenn ein Datenobjekt nach 14 Tagen nicht an einen Auftragnehmer gesendet wird, läuft es ab und wird aus der Warteschlange entfernt. Sie können in Amazon SQS einen Alarm einrichten, um zu erkennen, wann Objekte ablaufen. Mit diesem Mechanismus können Sie die Menge der Objekte steuern, die Sie an Ihren Kennzeichnungsauftrag senden.

**Wichtig**  
Das Ändern, Löschen oder Senden von Objekten direkt an die Amazon-SQS-Warteschlange, die mit Ihrem Streaming-Kennzeichnungsauftrag verknüpft ist, kann zu Auftragsfehlern führen. 

# Empfangen von Ausgabedaten aus einem Streaming-Kennzeichnungsauftrag
<a name="sms-streaming-how-it-works-output-data"></a>

Ihr Amazon-S3-Ausgabe-Bucket wird regelmäßig mit neuen Ausgabedaten aus Ihrem Streaming-Kennzeichnungsauftrag aktualisiert. Optional können Sie ein Amazon-SNS-Ausgabethema angeben. Jedes Mal, wenn ein Auftragnehmer ein beschriftetes Objekt sendet, wird eine Benachrichtigung mit den Ausgabedaten an dieses Thema gesendet. Sie können einen Endpunkt für Ihr SNS-Ausgabethema abonnieren, um Benachrichtigungen zu erhalten oder Ereignisse auszulösen, wenn Sie Ausgabedaten von einer Labeling-Aufgabe erhalten. Verwenden Sie ein Amazon-SNS-Ausgabethema, wenn Sie in Echtzeit eine Verkettung mit einem anderen Kennzeichnungsauftrag durchführen und jedes Mal, wenn ein Datenobjekt von einem Auftragnehmer gesendet wird, eine Amazon-SNS-Benachrichtigung erhalten möchten.

Weitere Informationen hierzu finden Sie unter [Abonnieren Sie einen Endpunkt für Ihr Amazon SNS-Ausgabe-Thema](sms-create-sns-input-topic.md#sms-streaming-subscribe-output-topic).

# Umgang mit doppelten Nachrichten
<a name="sms-streaming-impotency"></a>

Bei Datenobjekten, die in Echtzeit gesendet werden, garantiert Ground-Truth-Idempotenz, indem sichergestellt wird, dass jedes eindeutige Objekt nur einmal zur Kennzeichnung gesendet wird, auch wenn die auf dieses Objekt bezogene Eingabenachricht mehrfach empfangen wird (doppelte Nachrichten). Zu diesem Zweck wird jedem Datenobjekt, das an einen Streaming-Kennzeichnungsauftrag gesendet wird, eine *Deduplizierungs-ID* zugewiesen, die mit einem *Deduplizierungsschlüssel* identifiziert wird. Wenn Sie Ihre Anfragen zur Kennzeichnung von Datenobjekten direkt über Ihr Amazon SNS SNS-Eingabethema mithilfe von Amazon SNS SNS-Nachrichten senden, können Sie optional einen benutzerdefinierten Deduplizierungsschlüssel und eine Deduplizierung für Ihre Objekte wählen. IDs Weitere Informationen finden Sie unter [Angeben eines Deduplizierungsschlüssels und einer ID in einer Amazon-SNS-Nachricht](sms-streaming-impotency-create.md).

Wenn Sie keinen eigenen Deduplizierungsschlüssel bereitstellen oder die Amazon-S3-Konfiguration verwenden, um Datenobjekte an Ihren Kennzeichnungsauftrag zu senden, verwendet Ground Truth eine der folgenden Optionen für die Deduplizierungs-ID:
+ Für Nachrichten, die direkt an Ihr Amazon-SNS-Eingabethema gesendet werden, verwendet Ground Truth die SNS-Nachrichten-ID. 
+ Für Nachrichten, die aus einer Amazon-S3-Konfiguration stammen, erstellt Ground Truth eine Deduplizierungs-ID, indem es den Amazon-S3-URI des Objekts mit dem [Sequencer-Token](https://docs.aws.amazon.com/AmazonS3/latest/dev/notification-content-structure.html) in der Nachricht kombiniert.

# Angeben eines Deduplizierungsschlüssels und einer ID in einer Amazon-SNS-Nachricht
<a name="sms-streaming-impotency-create"></a>

Wenn Sie mithilfe einer Amazon-SNS-Nachricht ein Datenobjekt an Ihren Streaming-Kennzeichnungsauftrag senden, haben Sie die Möglichkeit, Ihren Deduplizierungsschlüssel und Ihre Deduplizierungs-ID auf eine der folgenden Arten anzugeben. Identifizieren Sie in all diesen Szenarien Ihren Deduplizierungsschlüssel mit `dataset-objectid-attribute-name`.

**Mitbringen eines eigenen Deduplizierungsschlüssels und einer eigenen Deduplizierungs-ID**

Erstellen Sie einen eigenen Deduplizierungsschlüssel und eine eigene Deduplizierungs-ID, indem Sie Ihre Amazon -SNS-Nachricht wie folgt konfigurieren. Ersetzen Sie `byo-key` durch Ihren Schlüssel und `UniqueId` durch die Deduplizierungs-ID für dieses Datenobjekt.

```
{
    "source-ref":"s3://amzn-s3-demo-bucket/prefix/object1", 
    "dataset-objectid-attribute-name":"byo-key",
    "byo-key":"UniqueId" 
}
```

Ihr Deduplizierungsschlüssel kann bis zu 140 Zeichen enthalten. Folgende Muster werden unterstützt: `"^[$a-zA-Z0-9](-*[a-zA-Z0-9])*"`.

Ihre Deduplizierungs-ID kann bis zu 1.024 Zeichen enthalten. Folgende Muster werden unterstützt: `^(https|s3)://([^/]+)/?(.*)$`.

**Verwenden eines vorhandenen Schlüssels als Deduplizierungsschlüssel**

Sie können einen vorhandenen Schlüssel in Ihrer Nachricht als Deduplizierungsschlüssel verwenden. In diesem Fall wird der mit diesem Schlüssel verknüpfte Wert für die Deduplizierungs-ID verwendet. 

Sie können beispielsweise angeben, den `source-ref`-Schlüssel als Deduplizierungsschlüssel zu verwenden, indem Sie Ihre Nachricht wie folgt formatieren: 

```
{
    "source-ref":"s3://amzn-s3-demo-bucket/prefix/object1",
    "dataset-objectid-attribute-name":"source-ref" 
}
```

In diesem Beispiel verwendet Ground Truth `"s3://amzn-s3-demo-bucket/prefix/object1"` als Deduplizierungs-ID.

# Suchen des Deduplizierungsschlüssels und der ID in Ihren Ausgabedaten
<a name="sms-streaming-impotency-output"></a>

Sie können den Deduplizierungsschlüssel und die ID in Ihren Ausgabedaten sehen. Der Deduplizierungsschlüssel wird durch `dataset-objectid-attribute-name` identifiziert. Wenn Sie einen eigenen benutzerdefinierten Deduplizierungsschlüssel verwenden, sieht Ihre Ausgabe ungefähr so aus:

```
"dataset-objectid-attribute-name": "byo-key",
"byo-key": "UniqueId",
```

Wenn Sie keinen Schlüssel angeben, finden Sie die Deduplizierungs-ID, die Ground Truth Ihrem Datenobjekt zugewiesen hat, wie folgt. Der Parameter `$label-attribute-name-object-id` identifiziert Ihre Deduplizierungs-ID. 

```
{
    "source-ref":"s3://bucket/prefix/object1", 
    "dataset-objectid-attribute-name":"$label-attribute-name-object-id"
    "label-attribute-name" :0,
    "label-attribute-name-metadata": {...},
    "$label-attribute-name-object-id":"<service-generated-key>"
}
```

Wenn das Datenobjekt eine Amazon-S3-Konfiguration durchlaufen hat, fügt Ground Truth für `<service-generated-key>` einen eindeutigen Wert hinzu, der vom Service verwendet wird, und gibt ein neues Feld aus, das durch `$sequencer` gekennzeichnet ist, das den verwendeten Amazon-S3-Sequencer anzeigt. Wenn das Objekt direkt an SNS gesendet wurde, verwendet Ground Truth die SNS-Nachrichten-ID.

**Anmerkung**  
Verwenden Sie das `$`-Zeichen nicht im Kennzeichnungsattributnamen. 