

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

# Création d'un groupe de jeux de données Amazon Personalize
<a name="data-prep-ds-group"></a>

Après avoir [créé des fichiers de schéma JSON pour vos données](how-it-works-dataset-schema.md), vous êtes prêt à créer un groupe de jeux de données. Dans Amazon Personalize, un *groupe de jeux de données* est un conteneur pour les ressources Amazon Personalize, notamment les ensembles de données, les recommandations de domaines et les ressources personnalisées. Un groupe de jeux de données organise vos ressources en collections indépendantes, dans lesquelles les ressources d'un groupe de jeux de données ne peuvent influencer les ressources d'aucun autre groupe de jeux de données. 

 Vous créez un groupe de jeux de données pour chacun de vos domaines commerciaux. Par exemple, vous pouvez avoir une application qui fournit des recommandations pour le streaming vidéo et une autre qui fournit des recommandations pour les livres audio. Dans Amazon Personalize, vous devez créer un groupe de jeux de données pour chaque application. Ainsi, les données d'une application n'influencent pas les recommandations qu'Amazon Personalize génère pour l'autre application. 

 Vous pouvez créer un groupe de jeux de données de domaine ou un groupe de jeux de données personnalisé : 
+ Avec un *groupe de jeux de données de domaine*, vous créez des ressources préconfigurées et optimisées pour différents cas d'utilisation. Lorsque vous créez un groupe de jeux de données, vous en faites un groupe de données de domaine en spécifiant un domaine VIDEO\_ON\_DEMAND ou ECOMMERCE.

  Si vous possédez une application de streaming vidéo ou de commerce électronique, nous vous recommandons de créer un groupe de jeux de données de domaine. Vous pouvez toujours ajouter des ressources personnalisées, telles que des solutions et des versions de solutions conçues pour des cas d'utilisation personnalisés. Vous ne pouvez pas créer les meilleures ressources d'action suivantes, notamment les ensembles de données d'actions et d'interactions d'action, dans un groupe de jeux de données de domaine.
+  Un *groupe de jeux de données personnalisé* inclut uniquement des ressources personnalisées que vous configurez en fonction de votre cas d'utilisation. Grâce à des ressources personnalisées, vous formez et déployez des solutions et des versions de solutions configurables (un modèle de recommandation Amazon Personalize formé) en fonction des besoins de votre entreprise. Si vous ne possédez pas d'application VIDEO\_ON\_DEMAND ou de commerce électronique, nous vous recommandons de créer un groupe de jeux de données personnalisé. Dans le cas contraire, nous vous recommandons de commencer par un groupe de jeux de données de domaine et d'ajouter des ressources personnalisées si nécessaire. 

Vous pouvez créer un groupe de jeux de données à l'aide de la console Amazon Personalize, AWS Command Line Interface (AWS CLI) ou AWS SDKs.

**Topics**
+ [Création d'un groupe de jeux de données (console)](#data-prep-creating-ds-group-console)
+ [Création d'un groupe de jeux de données (AWS CLI)](#data-prep-creating-ds-group-cli)
+ [Création d'un groupe de jeux de données (AWS SDKs)](#data-prep-creating-ds-group-sdk)

## Création d'un groupe de jeux de données (console)
<a name="data-prep-creating-ds-group-console"></a>

Créez un groupe de jeux de données en spécifiant le nom du groupe de données dans la console Amazon Personalize.

**Pour créer un groupe de jeux de données**

1. Ouvrez la console Amazon Personalize [https://console.aws.amazon.com/personalize/chez](https://console.aws.amazon.com/personalize/home) vous et connectez-vous à votre compte.

1. Choisissez **Create dataset group (Créer un groupe d'ensembles de données)**.

1. Si c'est la première fois que vous utilisez Amazon Personalize, sur la page **Créer un groupe de jeux de données**, dans **Nouveau groupe de jeux de données**, choisissez **Get started**.

1. Sous **Dataset group details (Informations du groupe d'ensembles de données)**, pour **Dataset group name (Nom du groupe d'ensembles de données)**, spécifiez un nom pour votre groupe d'ensembles de données. 

1. Choisissez votre **domaine** : 
   + Choisissez **E-commerce** pour créer un groupe de jeux de données de domaines ECOMMERCE.
   + Choisissez **Vidéo à la demande** pour créer un groupe de jeux de données de domaine VIDEO\_ON\_DEMAND.
   +  Choisissez **Personnalisé** pour créer un groupe de jeux de données personnalisé contenant uniquement des ressources personnalisées, telles que des solutions, des campagnes et des tâches d'inférence par lots. 

1. Pour les **balises**, ajoutez éventuellement des balises. Pour plus d'informations sur le balisage des ressources Amazon Personalize, consultez[Marquer les ressources Amazon Personalize](tagging-resources.md).

1. Choisissez **Create dataset group (Créer un groupe d'ensembles de données)**. La page **Vue d'ensemble** s'affiche. Vous êtes maintenant prêt à créer un schéma et un jeu de données. Consultez [Création d'un schéma et d'un jeu de données](data-prep-creating-datasets.md).

## Création d'un groupe de jeux de données (AWS CLI)
<a name="data-prep-creating-ds-group-cli"></a>

Pour créer un groupe de jeux de données, utilisez l'`create-dataset-group`opération. Pour créer un groupe de jeux de données de domaine, pour le domaine, spécifiez `ECOMMERCE` ou`VIDEO_ON_DEMAND`. Pour créer un groupe de jeux de données personnalisé, ne spécifiez pas de domaine. Vous pouvez utiliser le paramètre Tags pour étiqueter éventuellement les ressources dans Amazon Personalize. Pour un exemple, voir[Ajouter des tags (AWS CLI)](tags-add.md#add-tag-cli).

Le code suivant crée un groupe de jeux de données de domaine pour le `VIDEO_ON_DEMAND` domaine.

```
aws personalize create-dataset-group \
--name {{dataset-group-name}} \
--domain VIDEO_ON_DEMAND
```

En cas de succès, le groupe de données Amazon Resource Name (ARN) du groupe de données s'affiche comme suit.

```
{
  "datasetGroupArn": "arn:aws:personalize:us-west-2:acct-id:dataset-group/DatasetGroupName"
}
```

Enregistrez cette valeur pour une utilisation future. Pour afficher le groupe de jeux de données que vous avez créé, utilisez la `describe-dataset-group` commande et spécifiez l'ARN du groupe de jeux de données renvoyé.

```
aws personalize describe-dataset-group \
--dataset-group-arn {{dataset group arn}}
```

Le groupe de jeux de données et ses propriétés s'affichent comme suit.

```
{
    "datasetGroup": {
        "name": "DatasetGroupName",
        "datasetGroupArn": "arn:aws:personalize:us-west-2:acct-id:dataset-group/DatasetGroupName",
        "status": "ACTIVE",
        "creationDateTime": 1542392161.262,
        "lastUpdatedDateTime": 1542396513.377
    }
}
```

Lorsque le groupe de jeux de données `status` est ACTIF, vous êtes prêt à créer un schéma et un jeu de données. Consultez [Création d'un schéma et d'un jeu de données](data-prep-creating-datasets.md).

## Création d'un groupe de jeux de données (AWS SDKs)
<a name="data-prep-creating-ds-group-sdk"></a>

Utilisez le code suivant pour créer un groupe de jeux de données de domaine. Donnez un nom au groupe de jeux de données de domaine, et pour`domain`, spécifiez l'un `ECOMMERCE` ou l'autre`VIDEO_ON_DEMAND`. Pour créer un groupe de jeux de données personnalisé, modifiez le code pour supprimer le paramètre de domaine.

 Pour plus d'informations sur le fonctionnement de l'API, consultez [CreateDatasetGroup](API_CreateDatasetGroup.md) la section de référence de l'API. Vous pouvez utiliser le paramètre Tags pour étiqueter éventuellement les ressources dans Amazon Personalize. Pour un exemple, voir[Ajouter des tags (AWS SDKs)](tags-add.md#add-tag-sdk). 

------
#### [ SDK for Python (Boto3) ]

```
import boto3

personalize = boto3.client('personalize')

response = personalize.create_dataset_group(
  name = '{{dataset group name}}',
  domain = '{{business domain}}'
)
dsg_arn = response['datasetGroupArn']

description = personalize.describe_dataset_group(datasetGroupArn = dsg_arn)['datasetGroup']

print('Name: ' + description['name'])
print('ARN: ' + description['datasetGroupArn'])
print('Status: ' + description['status'])
```

------
#### [ SDK for Java 2.x ]

```
public static String createDomainDatasetGroup(PersonalizeClient personalizeClient, 
                                              String datasetGroupName,
                                              String domain) {

    try {
        CreateDatasetGroupRequest createDatasetGroupRequest = CreateDatasetGroupRequest.builder()
                .name(datasetGroupName)
                .domain(domain)
                .build();
        return personalizeClient.createDatasetGroup(createDatasetGroupRequest).datasetGroupArn();
    } catch (PersonalizeException e) {
        System.out.println(e.awsErrorDetails().errorMessage());
    }
    return "";
}
```

------
#### [ SDK for JavaScript v3 ]

```
// Get service clients module and commands using ES6 syntax.
import { CreateDatasetGroupCommand } from "@aws-sdk/client-personalize";
import { personalizeClient } from "./libs/personalizeClients.js";

// Or, create the client here.
// const personalizeClient = new PersonalizeClient({ region: "REGION"});

// Set the domain dataset group parameters.
export const domainDatasetGroupParams = {
  name: "NAME" /* required */,
  domain:
    "DOMAIN" /* required for a domain dsg, specify ECOMMERCE or VIDEO_ON_DEMAND */,
};

export const run = async () => {
  try {
    const response = await personalizeClient.send(
      new CreateDatasetGroupCommand(domainDatasetGroupParams),
    );
    console.log("Success", response);
    return response; // For unit tests.
  } catch (err) {
    console.log("Error", err);
  }
};
run();
```

------

L'[DescribeDatasetGroup](API_DescribeDatasetGroup.md)opération renvoie le `datasetGroupArn` et le statut de l'opération. Lorsque le groupe de jeux de données `status` est ACTIF, vous êtes prêt à créer un schéma et un jeu de données. Consultez [Création d'un schéma et d'un jeu de données](data-prep-creating-datasets.md).