Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.
Parameter für Algorithmen Built-in
In der folgenden Tabelle sind die Parameter für jeden der von Amazon SageMaker AI bereitgestellten Algorithmen aufgeführt.
| Name des Algorithmus | Kanalname | Trainingseingabemodus | Dateityp | Instance-Klasse | Parallelisierbar |
|---|---|---|---|---|---|
| AutoGluon-Tabular | "train" und (optional) "validation" | Datei | CSV | CPU oder GPU (nur einzelne Instance) | Nein |
| BlazingText | "train" | Datei oder Pipe | Textdatei (ein Satz pro Zeile mit durch Leerzeichen getrennten Token) | CPU oder GPU (nur einzelne Instance) | Nein |
| CatBoost | "train" und (optional) "validation" | Datei | CSV | CPU (nur einzelne Instance) | Nein |
| DeepAR-Prognosen | "train" und (optional) "test" | Datei | JSON-Lines oder Parquet | CPU oder GPU | Ja |
| Factorization Machines | "train" und (optional) "test" | Datei oder Pipe | aufzeichnen IO-protobuf | CPU (GPU für Daten mit hoher Dichte) | Ja |
| Bildklassifizierung – MXNet | "train" und "validation", (optional) "train_lst", "validation_lst" und "model" | Datei oder Pipe | recordIO oder Bilddateien (JPEG oder PNG) | GPU | Ja |
| Bildklassifizierung - TensorFlow | Training und Validierung | Datei | Bilddateien (.jpg, .jpeg oder .png) | CPU oder GPU | Ja (nur für mehrere GPUs auf einer einzelnen Instance) |
| IP Insights | "train" und (optional) "validation" | Datei | CSV | CPU oder GPU | Ja |
| K-Means | "train" und (optional) "test" | Datei oder Pipe | Datensatz IO-protobuf oder CSV | CPU- oder GPUCommon (einzelnes GPU-Gerät auf einer oder mehreren Instances) | Nein |
| K-Nearest-Neighbors (k-NN) | "train" und (optional) "test" | Datei oder Pipe | Datensatz IO-protobuf oder CSV | CPU- oder GPU (einzelnes GPU-Gerät auf einer oder mehreren Instances) | Ja |
| LDA | "train" und (optional) "test" | Datei oder Pipe | Datensatz IO-protobuf oder CSV | CPU (nur einzelne Instance) | Nein |
| LightGBM | train/training und (optional) Validierung | Datei | CSV | CPU | Ja |
| Lineares Lernen | "train" und (optional) "validation", "test" oder beides | Datei oder Pipe | Datensatz IO-protobuf oder CSV | CPU oder GPU | Ja |
| Neural Topic Modeling | "train" und (optional) "validation", "test" oder beides | Datei oder Pipe | Datensatz IO-protobuf oder CSV | CPU oder GPU | Ja |
| Object2Vec | "train" und (optional) "validation", "test" oder beides | Datei | JSON-Lines | CPU oder GPU (nur einzelne Instance) | Nein |
| Objekterkennung – MXNet | "train" und "validation", (optional) "train_annotation", "validation_annotation" und "model" | Datei oder Pipe | recordIO oder Bilddateien (JPEG oder PNG) | GPU | Ja |
| Objekterkennung - TensorFlow | Training und Validierung | Datei | Bilddateien (.jpg, .jpeg oder .png) | GPU | Ja (nur für mehrere GPUs auf einer einzelnen Instance) |
| PCA | "train" und (optional) "test" | Datei oder Pipe | Datensatz IO-protobuf oder CSV | CPU oder GPU | Ja |
| Random Cut Forest | "train" und (optional) "test" | Datei oder Pipe | Datensatz IO-protobuf oder CSV | CPU | Ja |
| Semantische Segmentierung | "train" und "validation", "train_annotation", "validation_annotation" und (optional) "label_map" und "model" | Datei oder Pipe | Abbildungsdateien | GPU (nur einzelne Instance) | Nein |
| Seq2Seq Modeling | "train", "validation" und "vocab" | Datei | aufzeichnen IO-protobuf | GPU (nur einzelne Instance) | Nein |
| TabTransformer | "train" und (optional) "validation" | Datei | CSV | CPU oder GPU (nur einzelne Instance) | Nein |
| Textklassifizierung - TensorFlow | Training und Validierung | Datei | CSV | CPU oder GPU | Ja (nur für mehrere GPUs auf einer einzelnen Instance) |
| XGBoost (0,90-1, 0,90-2, 1,0-1, 1,2-1, 1,2-21) | "train" und (optional) "validation" | Datei oder Pipe | CSV, LibSVM oder Parquet | CPU (oder GPU für 1.2-1) | Ja |
Algorithmen, die parallelisierbar sind, lassen sich für verteilte Trainings auf mehreren Datenverarbeitungs-Instances bereitstellen.
Die folgenden Themen enthalten Informationen zu Datenformaten, empfohlenen Amazon EC2 EC2-Instance-Typen und CloudWatch Protokollen, die allen von Amazon SageMaker AI bereitgestellten integrierten Algorithmen gemeinsam sind.
Anmerkung
Informationen zum Nachschlagen der Docker-Image-URIs der integrierten Algorithmen, die von SageMaker KI verwaltet werden, finden Sie unter Docker-Registrierungspfade und Beispielcode.