

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

# Étape 1 : ajout de documents à Amazon S3
<a name="tutorial-search-metadata-add-documents"></a>

Avant d'exécuter une tâche d'analyse des entités Amazon Comprehend sur votre ensemble de données, vous devez créer un compartiment Amazon S3 pour héberger les données, les métadonnées et les résultats de l'analyse des entités Amazon Comprehend.

**Topics**
+ [Téléchargement de l'exemple de jeu de données](#tutorial-search-metadata-add-documents-download-extract)
+ [Création d’un compartiment Amazon S3](#tutorial-search-metadata-add-documents-create-bucket)
+ [Création de dossiers de données et de métadonnées dans votre compartiment S3](#tutorial-search-metadata-add-documents-data-metadata)
+ [Téléchargement des données d'entrée](#tutorial-search-metadata-add-documents-upload-data)

## Téléchargement de l'exemple de jeu de données
<a name="tutorial-search-metadata-add-documents-download-extract"></a>

Avant qu'Amazon Comprehend puisse exécuter une tâche d'analyse d'entités sur vos données, vous devez télécharger et extraire le jeu de données, puis le charger dans un compartiment S3.

### Pour télécharger et extraire le jeu de données (console)
<a name="tutorial-search-metadata-download-extract-console"></a>

1. Téléchargez le dossier [tutorial-dataset.zip](https://docs.aws.amazon.com/kendra/latest/dg/samples/tutorial-dataset.zip) sur votre appareil.

1. Extrayez le `tutorial-dataset` dossier pour y accéder. `data`

### Pour télécharger et extraire le jeu de données (Terminal)
<a name="tutorial-search-metadata-download-extract-cli"></a>

1. Pour le télécharger`tutorial-dataset`, exécutez la commande suivante dans une fenêtre de terminal :

------
#### [ Linux ]

   ```
   curl -o path/tutorial-dataset.zip https://docs.aws.amazon.com/kendra/latest/dg/samples/tutorial-dataset.zip
   ```

   Où :
   + *path/*est le chemin du fichier local vers l'emplacement dans lequel vous souhaitez enregistrer le dossier zip.

------
#### [ macOS ]

   ```
   curl -o path/tutorial-dataset.zip https://docs.aws.amazon.com/kendra/latest/dg/samples/tutorial-dataset.zip
   ```

   Où :
   + *path/*est le chemin du fichier local vers l'emplacement dans lequel vous souhaitez enregistrer le dossier zip.

------
#### [ Windows ]

   ```
   curl -o path/tutorial-dataset.zip https://docs.aws.amazon.com/kendra/latest/dg/samples/tutorial-dataset.zip
   ```

   Où :
   + *path/*est le chemin du fichier local vers l'emplacement dans lequel vous souhaitez enregistrer le dossier zip.

------

1. Pour extraire les données du dossier zip, exécutez la commande suivante dans la fenêtre du terminal :

------
#### [ Linux ]

   ```
   unzip path/tutorial-dataset.zip -d path/
   ```

   Où :
   + *path/*est le chemin de fichier local vers le dossier zip que vous avez enregistré.

------
#### [ macOS ]

   ```
   unzip path/tutorial-dataset.zip -d path/
   ```

   Où :
   + *path/*est le chemin de fichier local vers le dossier zip que vous avez enregistré.

------
#### [ Windows ]

   ```
   tar -xf path/tutorial-dataset.zip -C path/
   ```

   Où :
   + *path/*est le chemin de fichier local vers le dossier zip que vous avez enregistré.

------

À la fin de cette étape, vous devriez avoir les fichiers extraits dans un dossier décompressé appelé`tutorial-dataset`. Ce dossier contient un `README` fichier avec une attribution open source Apache 2.0 et un dossier appelé `data` contenant le jeu de données pour ce didacticiel. Le jeu de données se compose de 100 fichiers avec des `.story` extensions.

## Création d’un compartiment Amazon S3
<a name="tutorial-search-metadata-add-documents-create-bucket"></a>

Après avoir téléchargé et extrait le dossier de données d'exemple, vous le stockez dans un compartiment Amazon S3.

**Important**  
Le nom d'un compartiment Amazon S3 doit être unique dans tous les compartiments AWS.

### Pour créer un compartiment S3 (console)
<a name="tutorial-search-metadata-create-bucket-console"></a>

1. Connectez-vous à la console Amazon S3 AWS Management Console et ouvrez-la à l'adresse [https://console.aws.amazon.com/s3/](https://console.aws.amazon.com/s3/).

1. Dans **Buckets**, choisissez **Create bucket.**

1. Pour **Nom de compartiment**, entrez un nom unique.

1. Pour **Région**, choisissez la AWS région dans laquelle vous souhaitez créer le bucket.
**Note**  
Vous devez choisir une région qui prend en charge à la fois Amazon Comprehend et Amazon Kendra. Vous ne pouvez pas modifier la région d'un bucket après l'avoir créé.

1. Conservez les paramètres par défaut pour les paramètres de **blocage de l'accès public pour ce compartiment****, le contrôle de version du** compartiment et les **balises**.

1. Pour le **chiffrement par défaut**, choisissez **Désactiver**.

1. Conservez les paramètres par défaut pour les **paramètres avancés**.

1. Vérifiez la configuration de votre compartiment, puis choisissez **Create bucket**.

### Pour créer un compartiment S3 (AWS CLI)
<a name="tutorial-search-metadata-create-bucket-cli"></a>

1. Pour créer un compartiment S3, utilisez la commande [create-bucket](https://awscli.amazonaws.com/v2/documentation/api/latest/reference/s3control/create-bucket.html) dans le : AWS CLI

------
#### [ Linux ]

   ```
   aws s3api create-bucket \
           --bucket amzn-s3-demo-bucket \
           --region aws-region \
           --create-bucket-configuration LocationConstraint=aws-region
   ```

   Où :
   + amzn-s3-demo-bucket est le nom de votre bucket,
   + *aws-region*est la région dans laquelle vous souhaitez créer votre bucket.

------
#### [ macOS ]

   ```
   aws s3api create-bucket \
           --bucket amzn-s3-demo-bucket \
           --region aws-region \
           --create-bucket-configuration LocationConstraint=aws-region
   ```

   Où :
   + amzn-s3-demo-bucket est le nom de votre bucket,
   + *aws-region*est la région dans laquelle vous souhaitez créer votre bucket.

------
#### [ Windows ]

   ```
   aws s3api create-bucket ^
           --bucket amzn-s3-demo-bucket ^
           --region aws-region ^
           --create-bucket-configuration LocationConstraint=aws-region
   ```

   Où :
   + amzn-s3-demo-bucket est le nom de votre bucket,
   + *aws-region*est la région dans laquelle vous souhaitez créer votre bucket.

------
**Note**  
Vous devez choisir une région qui prend en charge à la fois Amazon Comprehend et Amazon Kendra. Vous ne pouvez pas modifier la région d'un bucket après l'avoir créé.

1. Pour vous assurer que votre bucket a été créé avec succès, utilisez la commande [list](https://awscli.amazonaws.com/v2/documentation/api/latest/reference/s3/ls.html) :

------
#### [ Linux ]

   ```
   aws s3 ls
   ```

------
#### [ macOS ]

   ```
   aws s3 ls
   ```

------
#### [ Windows ]

   ```
   aws s3 ls
   ```

------

## Création de dossiers de données et de métadonnées dans votre compartiment S3
<a name="tutorial-search-metadata-add-documents-data-metadata"></a>

Après avoir créé votre compartiment S3, vous créez des dossiers de données et de métadonnées à l'intérieur de celui-ci.

### Pour créer des dossiers dans votre compartiment S3 (console)
<a name="tutorial-search-metadata-create-folders-console"></a>

1. Ouvrez la console Amazon S3 à l'adresse [https://console.aws.amazon.com/s3/](https://console.aws.amazon.com/s3/).

1. Dans **Buckets**, cliquez sur le nom de votre bucket dans la liste des buckets.

1. Dans l'onglet **Objets**, choisissez **Créer un dossier**.

1. Pour le nouveau nom du dossier, entrez**data**.

1. Pour les paramètres de chiffrement, choisissez **Désactiver**.

1. Choisissez **Créer un dossier**.

1. Répétez les étapes 3 à 6 pour créer un autre dossier destiné à stocker les métadonnées Amazon Kendra et nommez le dossier créé à l'étape 4. **metadata**

### Pour créer des dossiers dans votre compartiment S3 (AWS CLI)
<a name="tutorial-search-metadata-create-folders-cli"></a>

1. Pour créer le `data` dossier dans votre compartiment S3, utilisez la commande [put-object](https://awscli.amazonaws.com/v2/documentation/api/latest/reference/s3api/put-object.html) dans : AWS CLI

------
#### [ Linux ]

   ```
   aws s3api put-object \
           --bucket amzn-s3-demo-bucket \
           --key data/
   ```

   Où :
   + amzn-s3-demo-bucket est le nom de votre bucket.

------
#### [ macOS ]

   ```
   aws s3api put-object \
           --bucket amzn-s3-demo-bucket \
           --key data/
   ```

   Où :
   + amzn-s3-demo-bucket est le nom de votre bucket.

------
#### [ Windows ]

   ```
   aws s3api put-object ^
           --bucket amzn-s3-demo-bucket ^
           --key data/
   ```

   Où :
   + amzn-s3-demo-bucket est le nom de votre bucket.

------

1. Pour créer le `metadata` dossier dans votre compartiment S3, utilisez la commande [put-object](https://awscli.amazonaws.com/v2/documentation/api/latest/reference/s3api/put-object.html) dans : AWS CLI

------
#### [ Linux ]

   ```
   aws s3api put-object \
           --bucket amzn-s3-demo-bucket \
           --key metadata/
   ```

   Où :
   + amzn-s3-demo-bucket est le nom de votre bucket.

------
#### [ macOS ]

   ```
   aws s3api put-object \
           --bucket amzn-s3-demo-bucket \
           --key metadata/
   ```

   Où :
   + amzn-s3-demo-bucket est le nom de votre bucket.

------
#### [ Windows ]

   ```
   aws s3api put-object ^
           --bucket amzn-s3-demo-bucket ^
           --key metadata/
   ```

   Où :
   + amzn-s3-demo-bucket est le nom de votre bucket.

------

1. Pour vous assurer que vos dossiers ont été créés correctement, vérifiez le contenu de votre bucket à l'aide de la commande [list](https://awscli.amazonaws.com/v2/documentation/api/latest/reference/s3/ls.html) :

------
#### [ Linux ]

   ```
   aws s3 ls s3://amzn-s3-demo-bucket/
   ```

   Où :
   + amzn-s3-demo-bucket est le nom de votre bucket.

------
#### [ macOS ]

   ```
   aws s3 ls s3://amzn-s3-demo-bucket/
   ```

   Où :
   + amzn-s3-demo-bucket est le nom de votre bucket.

------
#### [ Windows ]

   ```
   aws s3 ls s3://amzn-s3-demo-bucket/
   ```

   Où :
   + amzn-s3-demo-bucket est le nom de votre bucket.

------

## Téléchargement des données d'entrée
<a name="tutorial-search-metadata-add-documents-upload-data"></a>

Après avoir créé vos dossiers de données et de métadonnées, vous chargez l'exemple de jeu de données dans le `data` dossier.

### Pour télécharger l'exemple de jeu de données dans le dossier de données (console)
<a name="tutorial-search-metadata-upload-data-console"></a>

1. Ouvrez la console Amazon S3 à l'adresse [https://console.aws.amazon.com/s3/](https://console.aws.amazon.com/s3/).

1. Dans **Buckets**, cliquez sur le nom de votre bucket dans la liste des buckets, puis cliquez sur. `data`

1. Choisissez **Télécharger**, puis **Ajouter des fichiers**.

1. Dans la boîte de dialogue, accédez au `data` dossier situé dans le `tutorial-dataset` dossier de votre appareil local, sélectionnez tous les fichiers, puis choisissez **Ouvrir**.

1. Conservez les paramètres par défaut pour la **destination**, **les autorisations** et les **propriétés**.

1. Choisissez **Charger**.

### Pour télécharger l'exemple de jeu de données dans le dossier de données (AWS CLI)
<a name="tutorial-search-metadata-upload-data-cli"></a>

1. Pour télécharger les exemples de données dans le `data` dossier, utilisez la commande de [copie](https://awscli.amazonaws.com/v2/documentation/api/latest/reference/s3/cp.html) dans AWS CLI :

------
#### [ Linux ]

   ```
   aws s3 cp path/tutorial-dataset/data s3://amzn-s3-demo-bucket/data/ --recursive
   ```

   Où :
   + *path/*est le chemin du fichier vers le `tutorial-dataset` dossier sur votre appareil,
   + amzn-s3-demo-bucket est le nom de votre bucket.

------
#### [ macOS ]

   ```
   aws s3 cp path/tutorial-dataset/data s3://amzn-s3-demo-bucket/data/ --recursive
   ```

   Où :
   + *path/*est le chemin du fichier vers le `tutorial-dataset` dossier sur votre appareil,
   + amzn-s3-demo-bucket est le nom de votre bucket.

------
#### [ Windows ]

   ```
   aws s3 cp path/tutorial-dataset/data s3://amzn-s3-demo-bucket/data/ --recursive
   ```

   Où :
   + *path/*est le chemin du fichier vers le `tutorial-dataset` dossier sur votre appareil,
   + amzn-s3-demo-bucket est le nom de votre bucket.

------

1. Pour vous assurer que les fichiers de votre ensemble de données ont été correctement chargés `data` dans votre dossier, utilisez la commande [list](https://awscli.amazonaws.com/v2/documentation/api/latest/reference/s3/ls.html) dans le AWS CLI :

------
#### [ Linux ]

   ```
   aws s3 ls s3://amzn-s3-demo-bucket/data/
   ```

   Où :
   + amzn-s3-demo-bucket est le nom de votre compartiment S3.

------
#### [ macOS ]

   ```
   aws s3 ls s3://amzn-s3-demo-bucket/data/
   ```

   Où :
   + amzn-s3-demo-bucket est le nom de votre compartiment S3.

------
#### [ Windows ]

   ```
   aws s3 ls s3://amzn-s3-demo-bucket/data/
   ```

   Où :
   + amzn-s3-demo-bucket est le nom de votre compartiment S3.

------

À la fin de cette étape, vous disposez d'un compartiment S3 dans lequel votre ensemble de données est stocké `data` dans le dossier, et d'un `metadata` dossier vide dans lequel seront stockées vos métadonnées Amazon Kendra.