

本文為英文版的機器翻譯版本，如內容有任何歧義或不一致之處，概以英文版為準。

# Canvas 中的範例資料集
<a name="canvas-sample-datasets"></a>

SageMaker Canvas 提供解決獨特使用案例的範例資料集，讓您可以快速開始建置、訓練和驗證模型，而無需撰寫任何程式碼。與這些資料集相關聯的使用案例會強調 SageMaker Canvas 的功能，您可以利用這些資料集開始建置模型。您可以在 SageMaker Canvas 應用程式的**資料集**頁面中找到範例資料集。

下列資料集是 SageMaker Canvas 預設提供的範例。這些資料集涵蓋使用案例，例如預測房價、貸款違約以及預測糖尿病患者再住院率、預測銷售、預測機器故障以簡化製造單位的預測性維護，以及產生運輸和物流的供應鏈預測。這些資料集存放在預設 Amazon S3 儲存貯體的 `sample_dataset` 資料夾中，而 SageMaker AI 會在區域中為您的帳戶建立該資料夾。
+ **canvas-sample-diabetic-readmission.csv：**此資料集包含歷史資料，包括超過十五項患者和醫院結果的功能。您可以使用此資料集來預測高風險糖尿病患者是否有可能在出院 30 天內、30 天後入院或不再入院。使用 **redadmitted** 資料欄做為目標欄，並在此資料集中使用 3\+ 類別預測模型類型。若要進一步了解如何使用此資料集建立模型，請參閱 [SageMaker Canvas 工作坊頁面](https://catalog.us-east-1.prod.workshops.aws/workshops/80ba0ea5-7cf9-4b8c-9d3f-1cd988b6c071/en-US/zzz-legacy/1-use-cases/5-hcls)。此資料集是從 [UCI Machine Learning Repository](https://archive.ics.uci.edu/ml/datasets/diabetes+130-us+hospitals+for+years+1999-2008) 取得。
+ **canvas-sample-housing.csv：**此資料集包含與給具體房價格相關的特徵資料。您可以使用此資料集來預測房價。使用 **median\_house\_value** 資料欄做為目標欄，並在此資料集中使用數值預測模型類型。若要進一步了解使用此資料集建立模型，請參閱 [SageMaker Canvas 工作坊頁面](https://catalog.us-east-1.prod.workshops.aws/workshops/80ba0ea5-7cf9-4b8c-9d3f-1cd988b6c071/en-US/zzz-legacy/1-use-cases/2-real-estate)。這是從 [StatLib 儲存庫](https://www.dcc.fc.up.pt/~ltorgo/Regression/cal_housing.html)獲得的加州住房資料集。
+ **canvas-sample-loans.csv：**此資料集包含 2007-2011 年期間所有貸款的完整貸款資料，包括目前的貸款狀態和最新的付款資訊。您可以使用此資料集來預測客戶是否會償還貸款。使用 **loan\_status** 資料欄做為目標欄，並在此資料集中使用 3\+ 類別預測模型類型。若要進一步了解如何使用此資料集建立模型，請參閱 [SageMaker Canvas 工作坊頁面](https://catalog.us-east-1.prod.workshops.aws/workshops/80ba0ea5-7cf9-4b8c-9d3f-1cd988b6c071/en-US/zzz-legacy/1-use-cases/4-finserv)。此資料使用從 [Kaggle](https://www.kaggle.com/datasets/wordsforthewise/lending-club) 獲得的 LendingClub 資料。
+ **canvas-sample-maintenance.csv：**此資料集包含與指定維護失敗類型相關聯之特性的資料。您可以使用此資料集來預測未來會發生哪些失敗。使用**失敗類型**資料欄做為目標欄，並在此資料集中使用 3\+ 類別預測模型類型。若要進一步了解如何使用此資料集建立模型，請參閱 [SageMaker Canvas 工作坊頁面](https://catalog.us-east-1.prod.workshops.aws/workshops/80ba0ea5-7cf9-4b8c-9d3f-1cd988b6c071/en-US/zzz-legacy/1-use-cases/6-manufacturing)。此資料集是從 [UCI Machine Learning Repository](https://archive.ics.uci.edu/ml/datasets/AI4I+2020+Predictive+Maintenance+Dataset) 取得。
+ **canvas-sample-shipping-logs.csv：**此資料集包含所有已交付產品的完整運送資料，包括預估運送優先順序、承運商和寄件地。您可以使用此資料集來預測運送的預計送達天數時間。使用 **ActualShippingDays** 欄做為目標欄，並搭配此資料集使用數值預測模型類型。若要進一步了解如何使用此資料建立模型，請參閱 [SageMaker Canvas 工作坊頁面](https://catalog.us-east-1.prod.workshops.aws/workshops/80ba0ea5-7cf9-4b8c-9d3f-1cd988b6c071/en-US/zzz-legacy/1-use-cases/7-supply-chain)。這是 Amazon 建立的合成資料集。
+ **canvas-sample-sales-forecasting.csv：**此資料集包含零售商店的歷史時間序列銷售資料。您可以使用此資料集來預測特定零售商店的銷售額。使用 **sales** 資料欄做為目標欄，並搭配此資料集使用時間序列預測模型類型。若要進一步了解如何使用此資料集建立模型，請參閱 [SageMaker Canvas 工作坊頁面](https://catalog.us-east-1.prod.workshops.aws/workshops/80ba0ea5-7cf9-4b8c-9d3f-1cd988b6c071/en-US/zzz-legacy/1-use-cases/3-retail)。這是 Amazon 建立的合成資料集。