

 Amazon Forecast 不再提供給新客戶。Amazon Forecast 的現有客戶可以繼續正常使用服務。[進一步了解」](https://aws.amazon.com/blogs/machine-learning/transition-your-amazon-forecast-usage-to-amazon-sagemaker-canvas/)

本文為英文版的機器翻譯版本，如內容有任何歧義或不一致之處，概以英文版為準。

# 預測的資料集準則
<a name="dataset-import-guidelines-troubleshooting"></a>

如果 Amazon Forecast 無法匯入資料集，或資料集無法如預期運作，請參閱下列準則。

**時間戳記格式**  
對於年 (`Y`)、月 (`M`)、週 (`W`) 和日 (`D`) 集合頻率，預測支援`yyyy-MM-dd`時間戳記格式 （例如 `2019-08-21`) 和選擇性`HH:mm:ss`格式 （例如 `2019-08-21 15:00:00`)。  
對於小時 (`H`) 和分鐘 (`M`) 頻率，預測僅支援 `yyyy-MM-dd HH:mm:ss` 格式 （例如 `2019-08-21 15:00:00`)。  
準則：將資料集收集頻率的時間戳記格式變更為支援的格式。

**Amazon S3 檔案或儲存貯體 **  
匯入資料集時，您可以在包含資料的 Amazon Simple Storage Service (Amazon S3) 儲存貯體中指定 CSV 或 Parquet 檔案的路徑，或指定包含資料的 S3 儲存貯體名稱。如果您指定 CSV 或 Parquet 檔案，預測只會匯入該檔案。如果您指定 S3 儲存貯體，預測會匯入儲存貯體中的所有 CSV 或 Parquet 檔案，最多 10，000 個檔案。如果您透過指定儲存貯體名稱匯入多個檔案，則所有 CSV 或 Parquet 檔案都必須符合指定的結構描述。  
指導方針：使用以下語法指定特定檔案或 S3 儲存貯體：  
`s3://bucket-name/example-object.csv`  
`s3://bucket-name/example-object.parquet`  
`s3://bucket-name/prefix/`  
`s3://bucket-name`  
Parquet 檔案可以有副檔名 .parquet、.parq、.pqt，或完全沒有副檔名。

**完整的資料集更新**  
您的第一個資料集匯入一律是完整匯入，後續匯入可以是完整或增量更新。您必須使用預測 API 來指定匯入模式。  
透過完整更新，所有現有的資料都會取代為新匯入的資料。由於完整的資料集匯入任務不會彙總，因此您最近的資料集匯入是在訓練預測器或產生預測時使用的資料集匯入。  
指導方針：建立增量資料集更新，將新資料附加至現有資料。否則，請確保您最近的資料集匯入包含您想要建模的所有資料，而不只是自上次匯入後所收集的新資料。

**增量資料集更新**  
時間戳記、資料格式、地理位置等欄位會從目前作用中的資料集讀取。您不需要在增量資料集匯入中包含此資訊。如果包含這些值，它們必須符合最初提供的值。  
準則：執行完整的資料集匯入，以變更任何這些值。

**屬性順序**  
結構描述定義中指定的屬性順序必須符合您匯入之 CSV 或 Parquet 檔案中的資料欄順序。例如，如果您`timestamp`將 定義為第一個屬性，則 `timestamp` 也必須是輸入檔案中的第一欄。  
準則：確認輸入檔案中的資料欄與您建立的結構描述屬性順序相同。

**天氣索引**  
若要套用天氣索引，您必須在目標時間序列和任何相關的時間序列資料集中包含[地理位置屬性](weather.md#adding-geolocation)。您也需要為目標[時間](weather.md#specifying-timezones)序列時間戳記指定時區。  
準則：確保您的資料集包含地理位置屬性，且您的時間戳記具有指派的時區。如需詳細資訊，請參閱天氣索引[條件和限制。](weather.md#weather-conditions-restrictions)

**資料集標頭**  
輸入 CSV 中的資料集標頭可能會導致驗證錯誤。建議您省略 CSV 檔案的標頭。  
準則：刪除資料集標頭，然後再次嘗試匯入。  
Parquet 檔案需要資料集標頭。

**資料集狀態**  
使用 [CreateDatasetImportJob](API_CreateDatasetImportJob.md)操作匯入訓練資料之前，資料集`Status`的 必須是 `ACTIVE`。  
準則：使用 [DescribeDataset](API_DescribeDataset.md) 操作取得資料集的狀態。如果無法建立或更新資料集，請檢查資料集檔案的格式，再次嘗試建立資料集。

**預設檔案格式**  
預設檔案格式為 CSV。

**檔案格式和分隔符號**  
預測僅支援逗號分隔值 (CSV) 檔案格式和 Parquet 格式。您無法使用 Tab 字元、空格、冒號或任何其他字元來分隔值。  
準則：將資料集轉換為 CSV 格式 （僅使用逗號做為分隔符號） 或 Parquet 格式，然後再次嘗試匯入檔案。

**檔案名稱**  
檔案名稱至少必須包含一個字母字元。無法匯入名稱僅含數字的檔案。  
準則：重新命名您的輸入資料檔案，以包含至少一個字母字元，然後再次嘗試匯入檔案。

**分割 Parquet 資料**  
預測不會讀取分割的 Parquet 檔案。

**假設分析資料集需求**  
如果分析需要 CSV 資料集，則為 。[CreateWhatIfAnalysis](API_CreateWhatIfAnalysis.md) 動作的 TimeSeriesSelector 操作和 的 TimeSeriesReplacementDataSource 操作[CreateWhatIfForecast](API_CreateWhatIfForecast.md)不接受 Parquet 檔案。