

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

# Anforderungen an Schulungsdaten für Clean Rooms ML
<a name="ml-training-data-requirements"></a>

Um erfolgreich ein Lookalike-Modell zu erstellen, müssen Ihre Trainingsdaten die folgenden Anforderungen erfüllen:
+ Die Trainingsdaten müssen im Parquet-, CSV- oder JSON-Format vorliegen.
**Anmerkung**  
Zstandard (ZSTD) komprimierte Parquet-Daten werden nicht unterstützt.
+ Ihre Trainingsdaten müssen katalogisiert sein. AWS Glue Weitere Informationen finden Sie unter [Erste Schritte mit dem AWS Glue Glue-Datenkatalog](https://docs.aws.amazon.com//glue/latest/dg/start-data-catalog.html) im AWS Glue Entwicklerhandbuch. Wir empfehlen die Verwendung von AWS Glue Crawlern zur Erstellung Ihrer Tabellen, da das Schema automatisch abgeleitet wird.
+ Der Amazon S3 S3-Bucket, der die Trainings- und Startdaten enthält, befindet sich in derselben AWS Region wie Ihre anderen Clean Rooms ML-Ressourcen.
+ Die Trainingsdaten müssen mindestens 100.000 eindeutige Benutzer IDs mit jeweils mindestens zwei Artikelinteraktionen enthalten.
+ Die Trainingsdaten müssen mindestens 1 Million Datensätze enthalten.
+ Das in der [CreateTrainingDataset](https://docs.aws.amazon.com/cleanrooms-ml/latest/APIReference/API_CreateTrainingDataset.html)Aktion angegebene Schema muss mit dem Schema übereinstimmen, das bei der Erstellung der AWS Glue Tabelle definiert wurde.
+ Die erforderlichen Felder, wie sie in der bereitgestellten Tabelle definiert sind, sind in der [CreateTrainingDataset](https://docs.aws.amazon.com/cleanrooms-ml/latest/APIReference/API_CreateTrainingDataset.html)Aktion definiert.    
[\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/de_de/clean-rooms/latest/userguide/ml-training-data-requirements.html)
+ Optional können Sie insgesamt bis zu 10 kategoriale oder numerische Merkmale angeben.

Hier ist ein Beispiel für einen gültigen Trainingsdatensatz im CSV-Format

```
USER_ID,ITEM_ID,TIMESTAMP,EVENT_TYPE(CATEGORICAL FEATURE),EVENT_VALUE (NUMERICAL FEATURE)
196,242,881250949,click,15
186,302,891717742,click,13
22,377,878887116,click,10
244,51,880606923,click,20
166,346,886397596,click,10
```