Parameter für Algorithmen Built-in

In der folgenden Tabelle sind die Parameter für jeden der von Amazon SageMaker AI bereitgestellten Algorithmen aufgeführt.

Name des Algorithmus	Kanalname	Trainingseingabemodus	Dateityp	Instance-Klasse	Parallelisierbar
AutoGluon-Tabular	"train" und (optional) "validation"	Datei	CSV	CPU oder GPU (nur einzelne Instance)	Nein
BlazingText	"train"	Datei oder Pipe	Textdatei (ein Satz pro Zeile mit durch Leerzeichen getrennten Token)	CPU oder GPU (nur einzelne Instance)	Nein
CatBoost	"train" und (optional) "validation"	Datei	CSV	CPU (nur einzelne Instance)	Nein
DeepAR-Prognosen	"train" und (optional) "test"	Datei	JSON-Lines oder Parquet	CPU oder GPU	Ja
Factorization Machines	"train" und (optional) "test"	Datei oder Pipe	aufzeichnen IO-protobuf	CPU (GPU für Daten mit hoher Dichte)	Ja
Bildklassifizierung – MXNet	"train" und "validation", (optional) "train_lst", "validation_lst" und "model"	Datei oder Pipe	recordIO oder Bilddateien (JPEG oder PNG)	GPU	Ja
Bildklassifizierung - TensorFlow	Training und Validierung	Datei	Bilddateien (.jpg, .jpeg oder .png)	CPU oder GPU	Ja (nur für mehrere GPUs auf einer einzelnen Instance)
IP Insights	"train" und (optional) "validation"	Datei	CSV	CPU oder GPU	Ja
K-Means	"train" und (optional) "test"	Datei oder Pipe	Datensatz IO-protobuf oder CSV	CPU- oder GPUCommon (einzelnes GPU-Gerät auf einer oder mehreren Instances)	Nein
K-Nearest-Neighbors (k-NN)	"train" und (optional) "test"	Datei oder Pipe	Datensatz IO-protobuf oder CSV	CPU- oder GPU (einzelnes GPU-Gerät auf einer oder mehreren Instances)	Ja
LDA	"train" und (optional) "test"	Datei oder Pipe	Datensatz IO-protobuf oder CSV	CPU (nur einzelne Instance)	Nein
LightGBM	train/training und (optional) Validierung	Datei	CSV	CPU	Ja
Lineares Lernen	"train" und (optional) "validation", "test" oder beides	Datei oder Pipe	Datensatz IO-protobuf oder CSV	CPU oder GPU	Ja
Neural Topic Modeling	"train" und (optional) "validation", "test" oder beides	Datei oder Pipe	Datensatz IO-protobuf oder CSV	CPU oder GPU	Ja
Object2Vec	"train" und (optional) "validation", "test" oder beides	Datei	JSON-Lines	CPU oder GPU (nur einzelne Instance)	Nein
Objekterkennung – MXNet	"train" und "validation", (optional) "train_annotation", "validation_annotation" und "model"	Datei oder Pipe	recordIO oder Bilddateien (JPEG oder PNG)	GPU	Ja
Objekterkennung - TensorFlow	Training und Validierung	Datei	Bilddateien (.jpg, .jpeg oder .png)	GPU	Ja (nur für mehrere GPUs auf einer einzelnen Instance)
PCA	"train" und (optional) "test"	Datei oder Pipe	Datensatz IO-protobuf oder CSV	CPU oder GPU	Ja
Random Cut Forest	"train" und (optional) "test"	Datei oder Pipe	Datensatz IO-protobuf oder CSV	CPU	Ja
Semantische Segmentierung	"train" und "validation", "train_annotation", "validation_annotation" und (optional) "label_map" und "model"	Datei oder Pipe	Abbildungsdateien	GPU (nur einzelne Instance)	Nein
Seq2Seq Modeling	"train", "validation" und "vocab"	Datei	aufzeichnen IO-protobuf	GPU (nur einzelne Instance)	Nein
TabTransformer	"train" und (optional) "validation"	Datei	CSV	CPU oder GPU (nur einzelne Instance)	Nein
Textklassifizierung - TensorFlow	Training und Validierung	Datei	CSV	CPU oder GPU	Ja (nur für mehrere GPUs auf einer einzelnen Instance)
XGBoost (0,90-1, 0,90-2, 1,0-1, 1,2-1, 1,2-21)	"train" und (optional) "validation"	Datei oder Pipe	CSV, LibSVM oder Parquet	CPU (oder GPU für 1.2-1)	Ja

Algorithmen, die parallelisierbar sind, lassen sich für verteilte Trainings auf mehreren Datenverarbeitungs-Instances bereitstellen.

Die folgenden Themen enthalten Informationen zu Datenformaten, empfohlenen Amazon EC2 EC2-Instance-Typen und CloudWatch Protokollen, die allen von Amazon SageMaker AI bereitgestellten integrierten Algorithmen gemeinsam sind.

Anmerkung

Informationen zum Nachschlagen der Docker-Image-URIs der integrierten Algorithmen, die von SageMaker KI verwaltet werden, finden Sie unter Docker-Registrierungspfade und Beispielcode.

Themen

Warnung JavaScript ist in Ihrem Browser nicht verfügbar oder deaktiviert.

Zur Nutzung der AWS-Dokumentation muss JavaScript aktiviert sein. Weitere Informationen finden auf den Hilfe-Seiten Ihres Browsers.

Dokumentkonventionen

Built-in Algorithmen und vortrainierte Modelle

Gängige Datenformate für Trainings