

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

# Algorithmus für lineares Lernen
<a name="linear-learner"></a>

*Lineare Modelle* sind überwachte Lernalgorithmen, die zur Lösung von Klassifizierungs- oder Regressionsproblemen verwendet werden. Für die Eingabe stellen Sie dem Modell Beispiele mit Kennzeichen (*x*, *y*) zur Verfügung. *x* ist ein hochdimensionaler Vektor und *y* ist eine numerische Kennzeichnung. Bei binären Klassifizierungsproblemen muss das Kennzeichen 0 oder 1 sein. Für Mehrklassen-Klassifizierungsprobleme müssen die Kennzeichen zwischen 0 und `num_classes` – 1 liegen. Bei Regressionsproblemen ist *y* eine Realzahl. Der Algorithmus erlernt eine lineare Funktion oder lineare Schwellenwertfunktion bei Klassifizierungsproblemen und weist einen Vektor *x* einer Approximation der Kennzeichnung *y* zu. 

Der lineare Lernalgorithmus von Amazon SageMaker AI bietet eine Lösung sowohl für Klassifizierungs- als auch für Regressionsprobleme. Mit dem SageMaker KI-Algorithmus können Sie gleichzeitig verschiedene Trainingsziele untersuchen und die beste Lösung aus einem Validierungssatz auswählen. Sie können auch eine große Anzahl von Modellen erkunden und das beste auswählen. Das beste Modell optimiert eine der folgenden Größen:
+ Kontinuierliche Ziele wie mittlerer quadratischer Fehler, Kreuz-Entropie-Verlust, absoluter Fehler usw.
+ Diskrete Ziele, die für die Klassifizierung geeignet sind, wie z. B. F1-Maß, Präzision, Abruf und Genauigkeit. 

Im Vergleich zu Methoden, die nur für kontinuierliche Lernziele eine Lösung bieten, bietet der SageMaker KI-Algorithmus für lineare Lernende eine deutliche Geschwindigkeitssteigerung im Vergleich zu naiven Techniken zur Optimierung von Hyperparametern. Außerdem ermöglicht er eine vereinfachte Handhabung. 

Der Algorithmus für lineares Lernen erfordert eine Datenmatrix, deren Zeilen die Beobachtungen und deren Spalten die Dimensionen der Merkmale darstellen. Außerdem ist eine zusätzliche Spalte mit den Kennzeichnungen erforderlich, die den Datenpunkten entsprechen. Amazon SageMaker AI Linear Learner verlangt mindestens, dass Sie die Speicherorte der Eingabe- und Ausgabedaten sowie den Zieltyp (Klassifizierung oder Regression) als Argumente angeben. Die Merkmalsdimension ist ebenfalls erforderlich. Weitere Informationen finden Sie unter [https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_CreateTrainingJob.html](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_CreateTrainingJob.html). Sie können zusätzliche Parameter in der `HyperParameters`-Zeichenfolge des Anforderungstexts angeben. Diese Parameter steuern das Optimierungsverfahren oder geben die Zielfunktion an, für die Sie das Training ausführen. Zu den Beispielen gehören die Anzahl der Epochen, Regularisierung und Verlusttyp. 

Wenn Sie [Managed Spot Training](https://docs.aws.amazon.com/sagemaker/latest/dg/model-managed-spot-training.html) verwenden, unterstützt der lineare Lerneralgorithmus die Verwendung von [Checkpoints, um eine Momentaufnahme des Status des Modells](https://docs.aws.amazon.com/sagemaker/latest/dg/model-checkpoints.html) zu erstellen.

**Topics**
+ [Input/Output-Schnittstelle für den linearen Lernalgorithmus](#ll-input_output)
+ [EC2-Instance-Empfehlung für den Linear Learner-Algorithmus](#ll-instances)
+ [Muster-Notebooks für lineare Lerner](#ll-sample-notebooks)
+ [So funktioniert der lineare Learner](ll_how-it-works.md)
+ [Hyperparameter für den linearen Lerner](ll_hyperparameters.md)
+ [Abstimmen eines linearen Learner-Modells](linear-learner-tuning.md)
+ [Antwortformate von linearen Learnern](LL-in-formats.md)

## Input/Output-Schnittstelle für den linearen Lernalgorithmus
<a name="ll-input_output"></a>

Der lineare Lernalgorithmus von Amazon SageMaker AI unterstützt drei Datenkanäle: Training, Validierung (optional) und Test (optional). Wenn Sie Validierungsdaten bereitstellen, sollte der `S3DataDistributionType` `FullyReplicated` sein. Der Algorithmus protokolliert den Validierungsverlust für jede Epoche und verwendet eine Stichprobe der Validierungsdaten zur Kalibrierung und Auswahl des besten Modells. Wenn Sie keine Validierungsdaten bereitstellen, verwendet der Algorithmus eine Stichprobe der Trainingsdaten, um das Modell zu kalibrieren und auszuwählen. Wenn Sie Testdaten bereitstellen, enthalten die Algorithmusprotokolle das Testergebnis für das endgültige Modell.

**Für Trainings** unterstützt der Algorithmus für lineares Lernen sowohl das – `recordIO-wrapped protobuf`als auch das `CSV`-Format. Für den `application/x-recordio-protobuf`Eingabetyp werden nur Float32-Tensoren unterstützt. Beim Eingabetyp `text/csv` wird angenommen, dass die erste Spalte die Kennzeichnung ist. Dies ist die Zielvariable für eine Prognose. Sie können entweder den Datei- oder den Pipe-Modus zum Trainieren linearer Lernmodelle mit Daten verwenden, die als `recordIO-wrapped-protobuf` oder `CSV` formatiert sind.

**Bei Inferenzen** unterstützt der Algorithmus für lineares Lernen die Formate `application/json`, `application/x-recordio-protobuf` und `text/csv`. Wenn Sie Voraussagen mit neuen Daten treffen, hängt das Format der Antwort von der Art des Modells ab. **Bei der Regression** (`predictor_type='regressor'`) ist `score` die Voraussage des Modells. **Bei der Klassifizierung** (`predictor_type='binary_classifier'` oder `predictor_type='multiclass_classifier'`) gibt das Modell `score` und auch `predicted_label` zurück. `predicted_label` ist die Klasse, die vom Modell vorausgesagt wird, und `score` misst die Stärke der Voraussage. 
+ **Für die binäre Klassifikation** ist `predicted_label` `0` oder `1`, und `score` ist eine einzelne Gleitkommazahl, die angibt, wie stark der Algorithmus glaubt, dass die Bezeichnung 1 sein sollte.
+ **Bei der Mehrklassen-Klassifizierung** ist `predicted_class` eine Ganzzahl von `0` bis `num_classes-1` und `score` entspricht einer Liste mit einer Gleitkommazahl pro Klasse. 

Zur Interpretation von `score` bei Klassifizierungsproblemen müssen Sie die verwendete Verlustfunktion berücksichtigen. Wenn der Hyperparameter-Wert von `loss` bei der binären Klassifizierung `logistic` und bei der Mehrklassen-Klassifizierung `softmax_loss` ist, kann `score` als Wahrscheinlichkeit der entsprechenden Klasse interpretiert werden. Dies sind die Verlustwerte, die vom linearen Lernen verwendet werden, wenn der `loss`-Wert dem Standardwert `auto` entspricht. Wenn der Verlust aber auf `hinge_loss` festgelegt ist, kann die Punktzahl nicht als Wahrscheinlichkeit interpretiert werden. Dies liegt daran, dass "hinge loss" einer Support Vector-Klassifizierung entspricht, die keine Wahrscheinlichkeitsschätzungen vornimmt.

Weitere Informationen zu den Ein- und Ausgabedateiformaten finden Sie unter [Antwortformate von linearen Learnern](LL-in-formats.md). Weitere Informationen zu Inferenzformaten finden Sie unter [Muster-Notebooks für lineare Lerner](#ll-sample-notebooks).

## EC2-Instance-Empfehlung für den Linear Learner-Algorithmus
<a name="ll-instances"></a>

Der lineare Lerneralgorithmus unterstützt sowohl CPU- als auch GPU-Instances für Training und Inferenz. Für GPU unterstützt der lineare Learner-Algorithmus die GPU-Familien P2, P3, G4dn und G5.

Während der Tests haben wir keine wesentlichen Hinweise darauf gefunden, dass Multi-GPU-Instances schneller sind als Single-GPU-Instances. Die Ergebnisse können abhängig vom jeweiligen Anwendungsfall variieren.

## Muster-Notebooks für lineare Lerner
<a name="ll-sample-notebooks"></a>

 In der folgenden Tabelle sind verschiedene Beispielnotizbücher aufgeführt, die sich mit verschiedenen Anwendungsfällen des Amazon SageMaker AI Linear Learner-Algorithmus befassen.


| **Titel des Notebooks** | **Beschreibung** | 
| --- | --- | 
| [Eine Einführung in den MNIST-Datensatz](https://sagemaker-examples.readthedocs.io/en/latest/introduction_to_amazon_algorithms/linear_learner_mnist/linear_learner_mnist.html) |  Mithilfe des MNIST-Datensatzes trainieren wir einen binären Klassifikator, um eine einzelne Ziffer vorherzusagen. | 
| [Wie erstellt man einen Multiklassen-Klassifikator?](https://sagemaker-examples.readthedocs.io/en/latest/scientific_details_of_algorithms/linear_learner_multiclass_classification/linear_learner_multiclass_classification.html) |  Anhand des Covertype-Datensatzes von UCI zeigen wir, wie ein Multiklassen-Klassifikator trainiert wird.  | 
| [Wie erstellt man eine Machine Learning (ML) -Pipeline für Inferenz?](https://sagemaker-examples.readthedocs.io/en/latest/sagemaker-python-sdk/scikit_learn_inference_pipeline/Inference%20Pipeline%20with%20Scikit-learn%20and%20Linear%20Learner.html) |  Anhand eines Scikit-Learn-Containers demonstrieren wir, wie man eine ML-Pipeline erstellt. end-to-end  | 

 Anweisungen zum Erstellen und Zugreifen auf Jupyter-Notebook-Instanzen, mit denen Sie das Beispiel in KI ausführen können, finden Sie unter. SageMaker [SageMaker Amazon-Notebook-Instanzen](nbi.md) Nachdem Sie eine Notebook-Instanz erstellt und geöffnet haben, wählen Sie die Registerkarte **SageMaker KI-Beispiele**, um eine Liste aller KI-Beispiele anzuzeigen. SageMaker Die Beispiel-Notebooks zur Themenmodellierung unter Verwendung des Algorithmus für lineares Lernen finden Sie im Abschnitt **Einführung in die Amazon-Algorithmen**. Zum Öffnen eines Notebooks wählen Sie die Registerkarte **Verwenden** und dann **Kopie erstellen** aus. 