

Wir aktualisieren den Amazon Machine Learning Learning-Service nicht mehr und akzeptieren auch keine neuen Nutzer mehr dafür. Diese Dokumentation ist für bestehende Benutzer verfügbar, wir aktualisieren sie jedoch nicht mehr. Weitere Informationen finden Sie unter [Was ist Amazon Machine Learning](https://docs.aws.amazon.com/machine-learning/latest/dg/what-is-amazon-machine-learning.html).

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

# Das Datenformat für Amazon ML verstehen
<a name="understanding-the-data-format-for-amazon-ml"></a>

 Eingabedaten sind die Daten, die Sie zur Erstellung einer Datenquelle verwenden. Speichern Sie Ihre Eingabedaten als durch Kommas getrennte Werte (CSV). Jede Zeile in der CSV-Datei ist ein einzelner Datensatz bzw. eine Beobachtung. Jede Spalte in der CSV-Datei enthält ein Attribut der Beobachtung. Die folgende Abbildung zeigt den Inhalt einer CSV-Datei, die vier Beobachtungen enthält, die jeweils in einer eigenen Zeile stehen. Jede Beobachtung enthält acht Attribute, die durch ein Komma getrennt sind. Die Attribute stellen die folgenden Informationen über jede einzelne Person dar, die durch eine Beobachtung repräsentiert wird: customerId, jobId, Bildung, Wohnen, Darlehen, Kampagne, Dauer, Testament. RespondToCampaign

 ![Diagram showing Attributes and Observations sections with sample data entries.](http://docs.aws.amazon.com/de_de/machine-learning/latest/dg/images/image39.png) 

## Attribute
<a name="attributes"></a>

 Amazon ML benötigt Namen für jedes Attribut. Sie können Attributnamen wie folgt angeben: 
+  Einbeziehen der Attributnamen in der ersten Zeile der CSV-Datei (auch als Kopfzeile bezeichnet), die Sie für Eingabedaten verwenden 
+  Einbeziehen der Attributnamen in einer separaten Schemadatei im selben S3-Bucket wie die Eingabedaten 

 Weitere Informationen zur Verwendung von Schemadateien finden Sie unter [Erstellen eines Datenschemas](https://docs.aws.amazon.com/machine-learning/latest/dg/creating-a-data-schema-for-amazon-ml.html). 

 Im folgenden Beispiel für eine CSV-Datei sind die Namen der Attribute in der Kopfzeile enthalten. 

```
customerId,jobId,education,housing,loan,campaign,duration,willRespondToCampaign

1,3,basic.4y,no,no,1,261,0

2,1,high.school,no,no,22,149,0

3,1,high.school,yes,no,65,226,1

4,2,basic.6y,no,no,1,151,0
```

## Anforderungen an das Eingabedateiformat
<a name="csv-format-requirements"></a>

 Die CSV-Datei, die Ihre Eingabedaten enthält, muss die folgenden Anforderungen erfüllen: 
+  Muss reiner Text mit einem Zeichensatz wie z. B. ASCII, Unicode oder EBCDIC sein. 
+  Besteht aus Beobachtungen, eine Beobachtung pro Zeile. 
+  Für jede Beobachtung müssen die Attributwerte durch Komma getrennt werden. 
+  Wenn ein Attributwert ein Komma enthält (das Trennzeichen), muss der gesamte Attributwert in Anführungszeichen gesetzt werden. 
+  Jede Beobachtung muss mit einem Zeilenendezeichen beendet werden. Dabei handelt es sich um ein Sonderzeichen oder eine Zeichenfolge, die das Ende einer Zeile kennzeichnet. 
+  Attributwerte dürfen keine Zeilenendezeichen enthalten, auch wenn der Attributwert in Anführungszeichen eingeschlossen wird. 
+  Jede Beobachtung muss die gleiche Anzahl von Attributen und Folge von Attributen aufweisen. 
+  Jede Beobachtung darf nicht größer als 100 KB sein. Amazon ML lehnt während der Verarbeitung alle Beobachtungen ab, die größer als 100 KB sind. Wenn Amazon ML mehr als 10.000 Beobachtungen zurückweist, lehnt es die gesamte CSV-Datei ab. 

## Verwenden mehrerer Dateien als Dateneingabe für Amazon ML
<a name="using-multiple-files-as-data-input-to-amazon-ml"></a>

 Sie können Ihre Eingabe in Amazon ML als einzelne Datei oder als Sammlung von Dateien bereitstellen. Sammlungen müssen folgende Bedingungen erfüllen: 
+  Alle Dateien müssen dasselbe Datenschema haben. 
+  Alle Dateien müssen sich im selben Amazon Simple Storage Service (Amazon S3) -Präfix befinden, und der Pfad, den Sie für die Sammlung angeben, muss mit einem Schrägstrich ('/') enden. 

 Wenn Ihre Datendateien zum Beispiel input1.csv, input2.csv und input3.csv heißen und Ihr S3-Bucket-Name "s3://examplebucket" lautet, könnten Ihre Dateipfade wie folgt aussehen: 

 s3:////input1.csv examplebucket/path to/data 

 s3://examplebucket/path/to/data/input2.csv 

 s3://examplebucket/path/to/data/input3.csv 

Sie würden den folgenden S3-Speicherort als Eingabe für Amazon ML angeben: 

 's3://examplebucket/path/to/data/' 

## End-of-Line Zeichen im CSV-Format
<a name="end-of-line-characters-in-csv-format"></a>

 Wenn Sie Ihre CSV-Datei erstellen, wird jede Beobachtung mit einem speziellen Zeilenendezeichen beendet. Dieses Zeichen ist nicht sichtbar, wird aber automatisch am Ende jeder Beobachtung eingefügt, wenn Sie die **Eingabetaste** oder die **Enter-Taste** drücken. Das Sonderzeichen, welches das Ende der Zeile kennzeichnet, variiert je nach Betriebssystem. Unix-Systeme, wie z. B. Linux oder OS X, verwenden ein *Zeilenvorschubzeichen*, das durch"\\n" (ASCII-Code 10 in Dezimalcode oder 0x0a in Hexadezimalcode) dargestellt wird. Microsoft Windows verwendet zwei Zeichen namens *Wagenrücklauf* und *Zeilenvorschub*, die mit"\\r\\n" (ASCII-Codes 13 und 10 in Dezimalcode oder 0x0d und 0x0a in Hexadezimalcode) dargestellt werden. 

 Wenn Sie OS X und Microsoft Excel zum Erstellen der CSV-Datei verwenden möchten, führen Sie die im Folgenden beschriebene Vorgangsweise aus. Stellen Sie sicher, dass Sie das richtige Format wählen. 

 **So speichern Sie eine CSV-Datei, wenn Sie OS X und Excel verwenden** 

1.  Beim Speichern der CSV-Datei wählen Sie **Format** und dann **Windows Comma Separated (.csv)**. 

1.  Wählen Sie **Speichern**. 

    ![Save dialog showing Windows Comma Separated format selected from file format dropdown menu.](http://docs.aws.amazon.com/de_de/machine-learning/latest/dg/images/image40b.png) 
**Wichtig**  
 Speichern Sie die CSV-Datei nicht in den Formaten **Comma Separated Values (.csv)** oder **MS-DOS Comma Separated (.csv)**, da Amazon ML sie nicht lesen kann.