

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

# Extrahieren von Textinformationen mithilfe der Erkennung benannter Entitäten
<a name="sms-named-entity-recg"></a>

Um Informationen aus unstrukturiertem Text zu extrahieren und sie in vordefinierte Kategorien zu klassifizieren, verwenden Sie eine Amazon SageMaker Ground Truth Named Entity Recognition (NER) -Labeling-Aufgabe. Traditionell beinhaltet NER das Sichten von Textdaten, um Nominalphrasen zu finden, die als *benannte Entitäten* bezeichnet werden, sowie das Kategorisieren dieser Nominalphrasen mit einer Kennzeichnung wie „Person“, „Organisation“ oder „Marke“. Sie können diese Aufgabe erweitern, um längere Textbereiche zu kennzeichnen und diese Sequenzen mit vordefinierten Kennzeichnungen zu kategorisieren, die von Ihnen angegeben werden. Sie können einen Labeling-Job zur Erkennung benannter Entitäten mithilfe des Ground-Truth-Bereichs der Amazon SageMaker AI-Konsole oder des [https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_CreateLabelingJob.html](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_CreateLabelingJob.html)Vorgangs erstellen.

Wenn Worker mit einem Kennzeichnungsauftrag zur Erkennung benannter Entitäten (Named Entity Recognition, NER) beauftragt werden, wenden sie Ihre Kennzeichnungen auf bestimmte Wörter oder Ausdrücke innerhalb eines größeren Textblocks an. Sie wählen eine Kennzeichnung aus und wenden sie dann an, indem Sie mit dem Cursor den Teil des Textes hervorheben, auf den die Kennzeichnung zutrifft. Das Tool zur Erkennung benannter Entitäten von Ground Truth unterstützt überlappende Anmerkungen, die kontextbezogene Beschriftungsauswahl und die Auswahl mehrerer Beschriftungen für ein einzelnes Highlight. Außerdem können Auftragnehmer ihre Tastaturen verwenden, um schnell Beschriftungen auszuwählen.

**Wichtig**  
Wenn Sie manuell eine Eingabemanifestdatei erstellen, verwenden Sie `"source"`, um den Text zu identifizieren, den Sie beschriften möchten. Weitere Informationen finden Sie unter [Eingabedaten](sms-data-input.md).

## Erstellen einer Named Entity Recognition-Labeling-Aufgabe (Konsole)
<a name="sms-creating-ner-console"></a>

Sie können den Anweisungen folgen[Erstellen eines Kennzeichnungsauftrags (Konsole)](sms-create-labeling-job-console.md), um zu erfahren, wie Sie in der SageMaker AI-Konsole einen Label-Job zur Erkennung benannter Entitäten erstellen. Wählen Sie in Schritt 10 im Dropdown-Menü **Aufgabenkategorie** die Option **Text** und wählen Sie als Aufgabentyp **Named Entity Erkennung ** aus. 

Ground Truth stellt für die Labeling-Aufgaben eine Worker-Benutzeroberfläche ähnlich der folgenden bereit. Wenn Sie die Labeling-Aufgabe mit der Konsole erstellen, müssen Sie Anweisungen bereitstellen, damit die Worker die Aufgabe ausführen können, und Kennzeichnungen, aus denen die Worker auswählen können. 

![\[Ein GIF, das zeigt, wie in der SageMaker AI-Konsole ein Labeling-Job für die Erkennung benannter Entitäten erstellt wird.\]](http://docs.aws.amazon.com/de_de/sagemaker/latest/dg/images/sms/gifs/nertool.gif)


## Erstellen einer Named Entity Recognition-Labeling-Aufgabe (API)
<a name="sms-creating-ner-api"></a>

Um mithilfe der SageMaker API-Operation einen Label-Job zur Erkennung benannter Entitäten zu erstellen`CreateLabelingJob`. Diese API definiert diesen Vorgang für alle AWS SDKs. Eine Liste der sprachspezifischen Sprachen, die für diesen Vorgang SDKs unterstützt werden, **finden Sie im Abschnitt Siehe auch** von. [https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_CreateLabelingJob.html](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_CreateLabelingJob.html)

Befolgen Sie diese Anweisungen unter [Erstellen eines Kennzeichnungsauftrags (API)](sms-create-labeling-job-api.md) und führen Sie die folgenden Schritte aus, während Sie Ihre Anforderung konfigurieren:
+ Vorannotierende Lambda-Features für die Vorannotierung für diesen Aufgabentyp enden mit `PRE-NamedEntityRecognition`. Den Lambda-ARN vor der Anmerkung für Ihre Region finden Sie unter. [PreHumanTaskLambdaArn](https://docs.aws.amazon.com/sagemaker/latest/dg/API_HumanTaskConfig.html#SageMaker-Type-HumanTaskConfig-PreHumanTaskLambdaArn) 
+ Annotations-Konsolidierende Lambda-Features für die Annotationskonsolidierung für diesen Aufgabentyp enden mit `ACS-NamedEntityRecognition`. Den Lambda-ARN zur Annotationskonsolidierung für Ihre Region finden Sie unter. [AnnotationConsolidationLambdaArn](https://docs.aws.amazon.com/sagemaker/latest/dg/API_AnnotationConsolidationConfig.html#SageMaker-Type-AnnotationConsolidationConfig-AnnotationConsolidationLambdaArn) 
+ Sie müssen den folgenden ARN für `[HumanTaskUiArn](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_UiConfig.html#sagemaker-Type-UiConfig-HumanTaskUiArn)` zur Verfügung stellen:

  ```
  arn:aws:sagemaker:aws-region:394669845002:human-task-ui/NamedEntityRecognition
  ```

  Ersetzen Sie `aws-region` durch die AWS-Region, in der Sie den Beschriftungsauftrag erstellen. Verwenden Sie beispielsweise `us-west-1`, wenn Sie einen Beschriftungsauftrag in USA West (Nordkalifornien) erstellen. 
+ Geben Sie mithilfe des `instructions` Parameters Anweisungen für die Auftragnehmer in der Konfigurationsdatei für die Beschriftungskategorie ein. Sie können in den Feldern `shortInstruction` und `fullInstruction` eine String oder eine HTML-Auszeichnungssprache verwenden. Weitere Details finden Sie unter [Stellen Sie Anweisungen für Auftragnehmer in einer Konfigurationsdatei für die Beschriftungskategorie bereit](#worker-instructions-ner).

  ```
  "instructions": {"shortInstruction":"<h1>Add header</h1><p>Add Instructions</p>", "fullInstruction":"<p>Add additional instructions.</p>"}
  ```

Im Folgenden finden Sie ein Beispiel für eine [AWS -Python-SDK-(Boto3)-Anforderung](https://boto3.amazonaws.com/v1/documentation/api/latest/reference/services/sagemaker.html#SageMaker.Client.create_labeling_job) zum Erstellen eines Beschriftungsauftrags in der Region USA Ost (Nord-Virginia). Alle Parameter in Rot sollten durch Ihre Spezifikationen und Ressourcen ersetzt werden. 

```
response = client.create_labeling_job(
    LabelingJobName='example-ner-labeling-job',
    LabelAttributeName='label',
    InputConfig={
        'DataSource': {
            'S3DataSource': {
                'ManifestS3Uri': 's3://bucket/path/manifest-with-input-data.json'
            }
        },
        'DataAttributes': {
            'ContentClassifiers': [
                'FreeOfPersonallyIdentifiableInformation'|'FreeOfAdultContent',
            ]
        }
    },
    OutputConfig={
        'S3OutputPath': 's3://bucket/path/file-to-store-output-data',
        'KmsKeyId': 'string'
    },
    RoleArn='arn:aws:iam::*:role/*',
    LabelCategoryConfigS3Uri='s3://bucket/path/label-categories.json',
    StoppingConditions={
        'MaxHumanLabeledObjectCount': 123,
        'MaxPercentageOfInputDatasetLabeled': 123
    },
    HumanTaskConfig={
        'WorkteamArn': 'arn:aws:sagemaker:region:*:workteam/private-crowd/*',
        'UiConfig': {
            'HumanTaskUiArn': 'arn:aws:sagemaker:us-east-1:394669845002:human-task-ui/NamedEntityRecognition'
        },
        'PreHumanTaskLambdaArn': 'arn:aws:lambda:us-east-1:432418664414:function:PRE-NamedEntityRecognition',
        'TaskKeywords': [
            'Named entity Recognition',
        ],
        'TaskTitle': 'Named entity Recognition task',
        'TaskDescription': 'Apply the labels provided to specific words or phrases within the larger text block.',
        'NumberOfHumanWorkersPerDataObject': 1,
        'TaskTimeLimitInSeconds': 28800,
        'TaskAvailabilityLifetimeInSeconds': 864000,
        'MaxConcurrentTaskCount': 1000,
        'AnnotationConsolidationConfig': {
            'AnnotationConsolidationLambdaArn': 'arn:aws:lambda:us-east-1:432418664414:function:ACS-NamedEntityRecognition'
        },
    Tags=[
        {
            'Key': 'string',
            'Value': 'string'
        },
    ]
)
```

### Stellen Sie Anweisungen für Auftragnehmer in einer Konfigurationsdatei für die Beschriftungskategorie bereit
<a name="worker-instructions-ner"></a>

Sie müssen in der Konfigurationsdatei für die Etikettenkategorie, die Sie mit dem Parameter `LabelCategoryConfigS3Uri` in `CreateLabelingJob` angeben, Anweisungen für die Arbeiter angeben. Mithilfe dieser Anweisungen können Sie Einzelheiten zu der Aufgabe angeben, die Auftragnehmer ausführen sollen, und ihnen helfen, das Tool effizient zu nutzen.

Sie geben kurze und lange Anweisungen mit `shortInstruction` bzw. `fullInstruction` im `instructions` Parameter. Weitere Informationen zu diesen Instruktionstypen finden Sie unter [Erstellen von Anweisungsseiten](sms-creating-instruction-pages.md).

Im Folgenden finden Sie ein Beispiel für eine Konfigurationsdatei für Beschriftungskategorien mit Anweisungen, die für einen Beschriftungsauftrag zur Erkennung benannter Entitäten verwendet werden können.

```
{
  "document-version": "2018-11-28",
  "labels": [
    {
      "label": "label1",
      "shortDisplayName": "L1"
    },
    {
      "label": "label2",
      "shortDisplayName": "L2"
    },
    {
      "label": "label3",
      "shortDisplayName": "L3"
    },
    {
      "label": "label4",
      "shortDisplayName": "L4"
    },
    {
      "label": "label5",
      "shortDisplayName": "L5"
    }
  ],
  "instructions": {
    "shortInstruction": "<p>Enter description of the labels that workers have 
                        to choose from</p><br><p>Add examples to help workers understand the label</p>",
    "fullInstruction": "<ol>
                        <li><strong>Read</strong> the text carefully.</li>
                        <li><strong>Highlight</strong> words, phrases, or sections of the text.</li>
                        <li><strong>Choose</strong> the label that best matches what you have highlighted.</li>
                        <li>To <strong>change</strong> a label, choose highlighted text and select a new label.</li>
                        <li>To <strong>remove</strong> a label from highlighted text, choose the X next to the 
                        abbreviated label name on the highlighted text.</li>
                        <li>You can select all of a previously highlighted text, but not a portion of it.</li>
                        </ol>"
  }
}
```

## Named Entity Recognition-Ausgabedaten
<a name="sms-ner-output-data"></a>

Nach der Erstellung einer Named Entity Erkennung-Bechriftungsauftrag befinden sich die Ausgabedaten bei Verwendung der API in dem vom Parameter `S3OutputPath` angegebenen Amazon-S3-Bucket oder im Feld **Ausgabedatensatz-Speicherort** im Abschnitt **Auftragsübersicht** der Konsole. 

Um mehr über die von Ground Truth erzeugte Ausgabemanifestdatei und die Dateistruktur zu erfahren, die Ground Truth zum Speichern Ihrer Ausgabedaten verwendet, siehe [Ausgabedaten von Kennzeichnungsaufträgen](sms-data-output.md). 