

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

# Erstellen eines ML-Eingabekanals in AWS Clean Rooms ML
<a name="create-ml-input-channel"></a>

**Voraussetzungen: **
+ Und AWS-Konto mit Zugriff auf AWS Clean Rooms
+ Eine Zusammenarbeit, AWS Clean Rooms in der Sie den ML-Eingangskanal erstellen möchten
+ Berechtigungen zum Abfragen von Daten und zum Erstellen von ML-Eingabekanälen in der Kollaboration. 
+ (Optional) Ein vorhandener Modellalgorithmus, der dem ML-Eingabekanal zugeordnet werden soll, oder Berechtigungen zum Erstellen eines neuen
+ (Optional) Tabellen mit Analyseregeln, die für das angegebene Modell ausgeführt werden können. 
+ (Optional) Eine vorhandene SQL-Abfrage- oder Analysevorlage, die für die Generierung des Datensatzes verwendet werden soll
+ (Optional) Eine vorhandene Servicerolle mit entsprechenden Berechtigungen oder Berechtigungen zum Erstellen einer neuen Servicerolle
+ (Optional) Ein benutzerdefinierter AWS KMS Schlüssel, wenn Sie Ihren eigenen Verschlüsselungsschlüssel verwenden möchten
+ Entsprechende Berechtigungen zum Erstellen und Verwalten von ML-Modellen in der Zusammenarbeit

Ein *ML-Eingabekanal* ist ein Datensatz, der anhand einer bestimmten Datenabfrage erstellt wird. Mitglieder mit der Fähigkeit, Daten abzufragen, können ihre Daten für Training und Inferenz vorbereiten, indem sie einen ML-Eingabekanal erstellen. Durch die Erstellung eines ML-Eingangskanals können diese Daten in verschiedenen Trainingsmodellen innerhalb derselben Zusammenarbeit verwendet werden. Sie sollten separate ML-Eingangskanäle für Training und Inferenz erstellen.

Um einen ML-Eingabekanal zu erstellen, müssen Sie die SQL-Abfrage angeben, die zur Abfrage der Eingabedaten verwendet wird, und den ML-Eingabekanal erstellen. Die Ergebnisse dieser Abfrage werden niemals an ein Mitglied weitergegeben und bleiben innerhalb der Grenzen von Clean Rooms ML. Die Referenz Amazon Resource Name (ARN) wird in den nächsten Schritten verwendet, um ein Modell zu trainieren oder Inferenz auszuführen.

------
#### [ Console ]

**Um einen ML-Eingangskanal (Konsole) zu erstellen**

1. Melden Sie sich bei [https://console.aws.amazon.com/cleanrooms](https://console.aws.amazon.com/cleanrooms/home) an AWS-Managementkonsole und öffnen Sie die AWS Clean Rooms Konsole.

1. **Wählen Sie im linken Navigationsbereich Collaborations aus.**

1. Wählen Sie auf der Seite **Collaborations** die Kollaboration aus, für die Sie einen ML-Eingabekanal erstellen möchten.

1. Wählen Sie nach dem Öffnen der Kollaboration die Registerkarte **ML-Modelle** aus.

1. Wählen Sie unter **Benutzerdefinierte ML-Modelle** im Abschnitt **ML-Eingangskanäle** die Option **ML-Eingangskanal erstellen** aus.

1. Gehen Sie auf der Seite „**ML-Eingangskanal erstellen**“ für **Details zum ML-Eingangskanal** wie folgt vor: 

   1. Geben Sie unter **Name** einen eindeutigen Namen für Ihren Kanal ein.

   1. (Optional) Geben Sie unter **Beschreibung** eine Beschreibung Ihres Kanals ein.

   1. Wählen Sie **unter Assoziierter Modellalgorithmus** den zu verwendenden Algorithmus aus.

      Wählen Sie **Modellalgorithmus zuordnen** aus, um einen neuen Modellalgorithmus hinzuzufügen.

1. Wählen Sie für **Datensatz** eine Methode zum Generieren des Trainingsdatensatzes aus:
   + Wählen Sie **SQL-Abfrage**, um die Ergebnisse einer SQL-Abfrage als Trainingsdatensatz zu verwenden. 

     Wenn Sie **SQL-Abfrage** gewählt haben, geben Sie Ihre Abfrage in das **SQL-Abfragefeld** ein.

     (Optional) Um eine Abfrage zu importieren, die Sie kürzlich verwendet haben, wählen Sie **Aus letzten Abfragen importieren aus**. 
   + Wählen Sie **Analysevorlage** aus, um die Ergebnisse einer Analysevorlage als Trainingsdatensatz zu verwenden.
**Warnung**  
Die Generierung synthetischer Daten schützt vor dem Ableiten einzelner Attribute, unabhängig davon, ob bestimmte Personen im ursprünglichen Datensatz vorhanden sind oder Lernattribute dieser Personen vorhanden sind. Es verhindert jedoch nicht, dass wörtliche Werte aus dem ursprünglichen Datensatz, einschließlich persönlich identifizierbarer Informationen (PII), im synthetischen Datensatz erscheinen.  
Wir empfehlen, Werte im Eingabedatensatz zu vermeiden, die nur einer betroffenen Person zugeordnet sind, da diese eine betroffene Person neu identifizieren können. Wenn beispielsweise nur ein Benutzer in einer Postleitzahl wohnt, würde das Vorhandensein dieser Postleitzahl im synthetischen Datensatz bestätigen, dass sich der Benutzer im ursprünglichen Datensatz befand. Techniken wie das Kürzen hochgenauer Werte oder das Ersetzen ungewöhnlicher Kataloge durch *andere* können verwendet werden, um dieses Risiko zu minimieren. Diese Transformationen können Teil der Abfrage sein, die zur Erstellung des ML-Eingabekanals verwendet wird.

   1. Wenn keine Tabellen verknüpft sind, wählen Sie **Tabelle zuordnen** aus, um Tabellen mit einer Analyseregel hinzuzufügen, die für das angegebene Modell ausgeführt werden kann. 

   1. Wählen Sie den **Worker-Typ** aus, der bei der Erstellung dieses Datenkanals verwendet werden soll. Der Standard-Worker-Typ ist **CR.1X.** Geben Sie die **Anzahl der zu verwendenden Worker** an. Die Standardnummer der Arbeiter ist **16.** So geben Sie **Spark-Eigenschaften** an:

      1. Erweitern Sie **Spark-Eigenschaften**.

      1. Wählen Sie **Spark-Eigenschaften hinzufügen**.

      1. Wählen Sie im Dialogfeld „**Spark-Eigenschaften**“ einen **Eigenschaftsnamen** aus der Dropdownliste aus und geben Sie einen **Wert** ein.

      Die folgende Tabelle enthält eine Definition für jede Eigenschaft.

      Weitere Informationen zu Spark-Eigenschaften finden Sie unter [Spark-Eigenschaften](https://spark.apache.org/docs/latest/configuration.html#spark-properties) in der Apache Spark-Dokumentation.     
[\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/de_de/clean-rooms/latest/userguide/create-ml-input-channel.html)

   1. Geben Sie für **Datenspeicherung in Tagen** die Anzahl der Tage ein, für die die Daten aufbewahrt werden sollen.

   1. Wählen Sie als **Ergebnisformat** entweder **CSV** oder **Parquet** als Datenformat, das der ML-Eingangskanal verwenden soll.

1. Wählen Sie für **Dienstzugriff** den **Namen der vorhandenen Servicerolle** aus, der für den Zugriff auf diese Tabelle verwendet werden soll, oder wählen Sie **Neue Servicerolle erstellen und verwenden** aus. 

1. Wählen Sie für **Verschlüsselung** **die Option Geheimnis mit einem benutzerdefinierten KMS-Schlüssel verschlüsseln** aus, um Ihren eigenen KMS-Schlüssel und zugehörige Informationen anzugeben. Andernfalls verwaltet Clean Rooms ML die Verschlüsselung.

1. Wählen Sie „**ML-Eingangskanal erstellen**“. 

   Die Erstellung des ML-Eingangskanals dauert einige Minuten. Auf der Registerkarte **ML-Modelle finden Sie eine Liste der ML-Eingangskanäle**.

**Anmerkung**  
Nachdem der ML-Eingangskanal erstellt wurde, können Sie ihn nicht mehr bearbeiten.

------
#### [ API ]

Um einen ML-Eingangskanal (API) zu erstellen

Führen Sie den folgenden Code mit Ihren spezifischen Parametern aus: 

```
import boto3 
acr_client = boto3.client('cleanroomsml')

acr_client.create_ml_input_channel(
    name="ml_input_channel_name",
    membershipIdentifier='membership_id',
    configuredModelAlgorithmAssociations=[configured_model_algorithm_association_arn],
    retentionInDays=1,
    inputChannel={
        "dataSource": {
            "protectedQueryInputParameters": {
                "sqlParameters": {
                    "queryString": "select * from table",
                    "computeConfiguration": {
                        "worker": {
                            "type": "CR.1X",
                            "number": 16,
                            "properties": {
                                "spark": {
                                    "spark configuration key": "spark configuration value",
                                }
                            }   
                        }
                    },
                    "resultFormat": "PARQUET"
                }
            }
        },
        "roleArn": "arn:aws:iam::111122223333:role/role_name"
    }
)
channel_arn = resp['ML Input Channel ARN']
```

------