

本文為英文版的機器翻譯版本，如內容有任何歧義或不一致之處，概以英文版為準。

# 步驟 1：將文件新增至 Amazon S3
<a name="tutorial-search-metadata-add-documents"></a>

在資料集上執行 Amazon Comprehend 實體分析任務之前，您可以建立 Amazon S3 儲存貯體來託管資料、中繼資料和 Amazon Comprehend 實體分析輸出。

**Topics**
+ [下載範例資料集](#tutorial-search-metadata-add-documents-download-extract)
+ [建立 Amazon S3 儲存貯體](#tutorial-search-metadata-add-documents-create-bucket)
+ [在 S3 儲存貯體中建立資料和中繼資料資料夾](#tutorial-search-metadata-add-documents-data-metadata)
+ [上傳輸入資料](#tutorial-search-metadata-add-documents-upload-data)

## 下載範例資料集
<a name="tutorial-search-metadata-add-documents-download-extract"></a>

在 Amazon Comprehend 可以對資料執行實體分析任務之前，您必須下載並擷取資料集，並將其上傳至 S3 儲存貯體。

### 下載並擷取資料集 （主控台）
<a name="tutorial-search-metadata-download-extract-console"></a>

1. 在您的裝置上下載 [tutorial-dataset.zip](https://docs.aws.amazon.com/kendra/latest/dg/samples/tutorial-dataset.zip) 資料夾。

1. 解壓縮 `tutorial-dataset` 資料夾以存取 `data` 資料夾。

### 下載並擷取資料集 （終端機）
<a name="tutorial-search-metadata-download-extract-cli"></a>

1. 若要下載 `tutorial-dataset`，請在終端機視窗上執行下列命令：

------
#### [ Linux ]

   ```
   curl -o path/tutorial-dataset.zip https://docs.aws.amazon.com/kendra/latest/dg/samples/tutorial-dataset.zip
   ```

   其中：
   + *path/* 是您要儲存 zip 資料夾位置的本機檔案路徑。

------
#### [ macOS ]

   ```
   curl -o path/tutorial-dataset.zip https://docs.aws.amazon.com/kendra/latest/dg/samples/tutorial-dataset.zip
   ```

   其中：
   + *path/* 是您要儲存 zip 資料夾位置的本機檔案路徑。

------
#### [ Windows ]

   ```
   curl -o path/tutorial-dataset.zip https://docs.aws.amazon.com/kendra/latest/dg/samples/tutorial-dataset.zip
   ```

   其中：
   + *path/* 是您要儲存 zip 資料夾位置的本機檔案路徑。

------

1. 若要從 zip 資料夾擷取資料，請在終端機視窗上執行下列命令：

------
#### [ Linux ]

   ```
   unzip path/tutorial-dataset.zip -d path/
   ```

   其中：
   + *path/* 是儲存 zip 資料夾的本機檔案路徑。

------
#### [ macOS ]

   ```
   unzip path/tutorial-dataset.zip -d path/
   ```

   其中：
   + *path/* 是儲存 zip 資料夾的本機檔案路徑。

------
#### [ Windows ]

   ```
   tar -xf path/tutorial-dataset.zip -C path/
   ```

   其中：
   + *path/* 是儲存 zip 資料夾的本機檔案路徑。

------

在此步驟結束時，您應該將解壓縮的檔案放在名為 的解壓縮資料夾中`tutorial-dataset`。此資料夾包含具有 Apache 2.0 開放原始碼屬性`README`的檔案，以及名為 的資料夾，`data`其中包含本教學課程的資料集。資料集包含 100 個副`.story`檔名的檔案。

## 建立 Amazon S3 儲存貯體
<a name="tutorial-search-metadata-add-documents-create-bucket"></a>

下載並擷取範例資料資料夾之後，您可以將其存放在 Amazon S3 儲存貯體中。

**重要**  
Amazon S3 儲存貯體的名稱在所有 中必須是唯一的 AWS。

### 建立 S3 儲存貯體 （主控台）
<a name="tutorial-search-metadata-create-bucket-console"></a>

1. 登入 AWS 管理主控台 並開啟位於 https：//[https://console.aws.amazon.com/s3/](https://console.aws.amazon.com/s3/) 的 Amazon S3 主控台。

1. 在**儲存貯**體中，選擇**建立儲存貯**體。

1. 對於 **Bucket name (儲存貯體名稱)**，輸入一個唯一名稱。

1. 針對**區域**，選擇您要建立儲存貯體 AWS 的區域。
**注意**  
您必須選擇同時支援 Amazon Comprehend 和 Amazon Kendra 的區域。建立儲存貯體之後，就無法變更儲存貯體的區域。

1. 保留**此儲存貯體、儲存貯體版本控制和標籤的封鎖公開存取設定的**預設設定。 **** ****

1. 針對**預設加密**，選擇**停用**。

1. 保留**進階**設定的預設設定。

1. 檢閱您的儲存貯體組態，然後選擇**建立儲存貯**體。

### 建立 S3 儲存貯體 (AWS CLI)
<a name="tutorial-search-metadata-create-bucket-cli"></a>

1. 若要建立 S3 儲存貯體，請使用 中的 [create-bucket](https://awscli.amazonaws.com/v2/documentation/api/latest/reference/s3control/create-bucket.html) 命令 AWS CLI：

------
#### [ Linux ]

   ```
   aws s3api create-bucket \
           --bucket amzn-s3-demo-bucket \
           --region aws-region \
           --create-bucket-configuration LocationConstraint=aws-region
   ```

   其中：
   + amzn-s3-demo-bucket 是您的儲存貯體名稱，
   + *aws-region* 是您要建立儲存貯體的區域。

------
#### [ macOS ]

   ```
   aws s3api create-bucket \
           --bucket amzn-s3-demo-bucket \
           --region aws-region \
           --create-bucket-configuration LocationConstraint=aws-region
   ```

   其中：
   + amzn-s3-demo-bucket 是您的儲存貯體名稱，
   + *aws-region* 是您要建立儲存貯體的區域。

------
#### [ Windows ]

   ```
   aws s3api create-bucket ^
           --bucket amzn-s3-demo-bucket ^
           --region aws-region ^
           --create-bucket-configuration LocationConstraint=aws-region
   ```

   其中：
   + amzn-s3-demo-bucket 是您的儲存貯體名稱，
   + *aws-region* 是您要建立儲存貯體的區域。

------
**注意**  
您必須選擇同時支援 Amazon Comprehend 和 Amazon Kendra 的區域。建立儲存貯體之後，就無法變更儲存貯體的區域。

1. 若要確保您的儲存貯體已成功建立，請使用 [list](https://awscli.amazonaws.com/v2/documentation/api/latest/reference/s3/ls.html) 命令：

------
#### [ Linux ]

   ```
   aws s3 ls
   ```

------
#### [ macOS ]

   ```
   aws s3 ls
   ```

------
#### [ Windows ]

   ```
   aws s3 ls
   ```

------

## 在 S3 儲存貯體中建立資料和中繼資料資料夾
<a name="tutorial-search-metadata-add-documents-data-metadata"></a>

建立 S3 儲存貯體之後，您可以在其中建立資料和中繼資料資料夾。

### 在 S3 儲存貯體中建立資料夾 （主控台）
<a name="tutorial-search-metadata-create-folders-console"></a>

1. 開啟位於 [https://console.aws.amazon.com/s3/](https://console.aws.amazon.com/s3/) 的 Amazon S3 主控台。

1. 在**儲存貯**體中，從儲存貯體清單中按一下儲存貯體的名稱。

1. 從**物件**索引標籤中，選擇**建立資料夾**。

1. 針對新的資料夾名稱，輸入 **data**。

1. 針對加密設定，選擇**停用**。

1. 選擇 **Create folder** (建立資料夾)。

1. 重複步驟 3 到 6 建立另一個資料夾來存放 Amazon Kendra 中繼資料，並命名步驟 4 中建立的資料夾**metadata**。

### 在 S3 儲存貯體中建立資料夾 (AWS CLI)
<a name="tutorial-search-metadata-create-folders-cli"></a>

1. 若要在 S3 儲存貯體中建立 `data` 資料夾，請使用 中的 [put-object](https://awscli.amazonaws.com/v2/documentation/api/latest/reference/s3api/put-object.html) 命令 AWS CLI：

------
#### [ Linux ]

   ```
   aws s3api put-object \
           --bucket amzn-s3-demo-bucket \
           --key data/
   ```

   其中：
   + amzn-s3-demo-bucket 是您的儲存貯體名稱。

------
#### [ macOS ]

   ```
   aws s3api put-object \
           --bucket amzn-s3-demo-bucket \
           --key data/
   ```

   其中：
   + amzn-s3-demo-bucket 是您的儲存貯體名稱。

------
#### [ Windows ]

   ```
   aws s3api put-object ^
           --bucket amzn-s3-demo-bucket ^
           --key data/
   ```

   其中：
   + amzn-s3-demo-bucket 是您的儲存貯體名稱。

------

1. 若要在 S3 儲存貯體中建立 `metadata` 資料夾，請使用 中的 [put-object](https://awscli.amazonaws.com/v2/documentation/api/latest/reference/s3api/put-object.html) 命令 AWS CLI：

------
#### [ Linux ]

   ```
   aws s3api put-object \
           --bucket amzn-s3-demo-bucket \
           --key metadata/
   ```

   其中：
   + amzn-s3-demo-bucket 是您的儲存貯體名稱。

------
#### [ macOS ]

   ```
   aws s3api put-object \
           --bucket amzn-s3-demo-bucket \
           --key metadata/
   ```

   其中：
   + amzn-s3-demo-bucket 是您的儲存貯體名稱。

------
#### [ Windows ]

   ```
   aws s3api put-object ^
           --bucket amzn-s3-demo-bucket ^
           --key metadata/
   ```

   其中：
   + amzn-s3-demo-bucket 是您的儲存貯體名稱。

------

1. 若要確保您的資料夾已成功建立，請使用 [list](https://awscli.amazonaws.com/v2/documentation/api/latest/reference/s3/ls.html) 命令檢查儲存貯體的內容：

------
#### [ Linux ]

   ```
   aws s3 ls s3://amzn-s3-demo-bucket/
   ```

   其中：
   + amzn-s3-demo-bucket 是您的儲存貯體名稱。

------
#### [ macOS ]

   ```
   aws s3 ls s3://amzn-s3-demo-bucket/
   ```

   其中：
   + amzn-s3-demo-bucket 是您的儲存貯體名稱。

------
#### [ Windows ]

   ```
   aws s3 ls s3://amzn-s3-demo-bucket/
   ```

   其中：
   + amzn-s3-demo-bucket 是您的儲存貯體名稱。

------

## 上傳輸入資料
<a name="tutorial-search-metadata-add-documents-upload-data"></a>

建立資料和中繼資料資料夾之後，您會將範例資料集上傳到 `data` 資料夾。

### 將範例資料集上傳到資料資料夾 （主控台）
<a name="tutorial-search-metadata-upload-data-console"></a>

1. 開啟位於 [https://console.aws.amazon.com/s3/](https://console.aws.amazon.com/s3/) 的 Amazon S3 主控台。

1. 在**儲存貯**體中，從儲存貯體清單中按一下儲存貯體的名稱，然後按一下 `data`。

1. 選擇**上傳**，然後選擇**新增檔案**。

1. 在對話方塊中，導覽至本機裝置中 `data` 資料夾內的 `tutorial-dataset` 資料夾，選取所有檔案，然後選擇**開啟**。

1. 保留**目的地**、**許可**和**屬性**的預設設定。

1. 選擇**上傳**。

### 將範例資料集上傳到資料資料夾 (AWS CLI)
<a name="tutorial-search-metadata-upload-data-cli"></a>

1. 若要將範例資料上傳至 `data` 資料夾，請使用 中的[複製](https://awscli.amazonaws.com/v2/documentation/api/latest/reference/s3/cp.html)命令 AWS CLI：

------
#### [ Linux ]

   ```
   aws s3 cp path/tutorial-dataset/data s3://amzn-s3-demo-bucket/data/ --recursive
   ```

   其中：
   + *path/* 是裝置上 `tutorial-dataset` 資料夾的檔案路徑，
   + amzn-s3-demo-bucket 是您的儲存貯體名稱。

------
#### [ macOS ]

   ```
   aws s3 cp path/tutorial-dataset/data s3://amzn-s3-demo-bucket/data/ --recursive
   ```

   其中：
   + *path/* 是裝置上 `tutorial-dataset` 資料夾的檔案路徑，
   + amzn-s3-demo-bucket 是您的儲存貯體名稱。

------
#### [ Windows ]

   ```
   aws s3 cp path/tutorial-dataset/data s3://amzn-s3-demo-bucket/data/ --recursive
   ```

   其中：
   + *path/* 是裝置上 `tutorial-dataset` 資料夾的檔案路徑，
   + amzn-s3-demo-bucket 是您的儲存貯體名稱。

------

1. 若要確保您的資料集檔案已成功上傳至您的`data`資料夾，請使用 中的 [list](https://awscli.amazonaws.com/v2/documentation/api/latest/reference/s3/ls.html) 命令 AWS CLI：

------
#### [ Linux ]

   ```
   aws s3 ls s3://amzn-s3-demo-bucket/data/
   ```

   其中：
   + amzn-s3-demo-bucket 是 S3 儲存貯體的名稱。

------
#### [ macOS ]

   ```
   aws s3 ls s3://amzn-s3-demo-bucket/data/
   ```

   其中：
   + amzn-s3-demo-bucket 是 S3 儲存貯體的名稱。

------
#### [ Windows ]

   ```
   aws s3 ls s3://amzn-s3-demo-bucket/data/
   ```

   其中：
   + amzn-s3-demo-bucket 是 S3 儲存貯體的名稱。

------

在此步驟結束時，您有一個 S3 儲存貯體，其中包含存放在 `data` 資料夾內的資料集，以及一個空`metadata`資料夾，它會存放您的 Amazon Kendra 中繼資料。