

本文為英文版的機器翻譯版本，如內容有任何歧義或不一致之處，概以英文版為準。

# 自動化標籤工作的資料設定
<a name="sms-console-create-manifest-file"></a>

您可以使用自動化資料設定，利用儲存在 Amazon S3 的映像、影片、影片影格、文字 (.txt) 檔案以及逗號分隔值 (.csv) 檔案，在 Ground Truth 主控台為標籤工作建立資訊清單檔案。當您使用自動化資料設定時，您可以指定儲存輸入資料的 Amazon S3 位置與輸入資料類型，然後 Ground Truth 會在您指定的位置尋找符合該類型的檔案。

**注意**  
Ground Truth 不會使用 AWS KMS 金鑰來存取您的輸入資料，或在您指定的 Amazon S3 位置寫入輸入資訊清單檔案。建立標籤工作的使用者或角色針對 Amazon S3 的輸入資料物件具存取許可。

在使用下列程序之前，請確保輸入映像或檔案的格式正確：
+ 映像檔案 – 映像檔案必須符合 [輸入檔案大小配額](input-data-limits.md#input-file-size-limit) 資料表所列出的大小與解析度限制。
+ 文字檔案 – 文字資料可以儲存在一或多個 .txt 檔案中。您要標籤的每個項目必須以標準分行符號分隔。
+ CSV 檔案 – 文字資料可以儲存在一或多個 .csv 檔案中。您要標籤的每個項目必須位於單獨一列。
+ 影片 – 影片檔案可以是以下任何格式：.mp4、.ogg、.webm。如果您要從影片檔案擷取影片影格以進行物件偵測或物件追蹤，請參閱[提供影片檔案](sms-point-cloud-video-input-data.md#sms-point-cloud-video-frame-extraction)。
+ 影片影格 - 影片影格是從影片擷取的映像。從單一影片擷取的所有影像都稱為一*序列影片影格*。在 Amazon S3，每個影片影格序列都必須具有唯一字首鍵。請參閱[提供影片影格](sms-point-cloud-video-input-data.md#sms-video-provide-frames)。如需此資料類型，請參閱[設定自動化影片影格輸入資料](sms-video-automated-data-setup.md)

**重要**  
如需資訊了解影片影格物件偵測及影片影格物件追蹤標籤工作，請參閱[設定自動化影片影格輸入資料](sms-video-automated-data-setup.md)以了解如何使用自動化資料設定。

使用這些指示來自動設定您的輸入資料集連線 Ground Truth。

**自動連線 Amazon S3 的資料與 Ground Truth**

1. 導覽至 Amazon SageMaker AI 主控台的**建立標籤工作**頁面，網址為 [https://console.aws.amazon.com/sagemaker/](https://console.aws.amazon.com/sagemaker/)。

   此連結會將您置於北維吉尼亞 (us-east-1) AWS 區域。如果您的輸入資料位於其他區域的 Amazon S3 儲存貯體中，請切換至該區域。若要變更您的 AWS 區域，請在[導覽列](https://docs.aws.amazon.com/awsconsolehelpdocs/latest/gsg/getting-started.html#select-region)上選擇目前顯示區域的名稱。

1. 選取**建立標籤工作**。

1. 輸入**工作名稱**。

1. 在**輸入資料設定**區段內，選取**自動化資料設定**。

1. 針對**輸入資料集 S3 位置**輸入 Amazon S3 URI。

1. 指定**輸出資料集在 S3 的位置**。這是您輸出資料的儲存位置。

1. 使用下拉式清單選擇**資料類型**。

1. 使用 **IAM 角色**下的下拉式清單選取執行角色。如果選取 **Create a new role** (建立新角色)，請指定要授與此角色存取許可的 Amazon S3 儲存貯體。此角色必須針對您在步驟 5 與 6 指定的 S3 儲存貯體具存取許可。

1. 選取 **Complete data setup** (完成資料設定)。

這會在 Amazon S3 位置為您在步驟 5 指定的輸入資料集建立輸入資訊清單。如果您要使用 SageMaker API 或 、 AWS CLI或 AWS SDK 建立標籤工作，請使用此輸入資訊清單檔案的 Amazon S3 URI 做為參數 的輸入`ManifestS3Uri`。

下列 GIF 示範如何使用映像資料的自動化資料設定。此範例將在 Amazon S3 儲存貯體 `example-groundtruth-images` 建立檔案 `dataset-YYMMDDTHHMMSS.manifest`，其中 `YYMMDDTHHmmSS` 指示建立輸入資訊清單檔案的年 (`YY`)、月 (`MM`)、日 (`DD`)，以及時間，以小時 (`HH`)、分鐘 (`mm`)、秒 (`ss`) 為單位。

![\[顯示如何使用影像資料的自動化資料設定的 GIF。\]](http://docs.aws.amazon.com/zh_tw/sagemaker/latest/dg/images/sms/gifs/automated-data-setup.gif)
