建立 Amazon S3 資料集 - Amazon Quick

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

建立 Amazon S3 資料集

若要建立 Amazon S3 資料集
  1. 檢查 資料來源配額 以確保您的目標檔案集不超過資料來源配額。

  2. 使用支援的 Amazon S3 清單檔案格式指定的其中一種格式建立資訊清單檔案,以識別您想要匯入的文字檔案。

  3. 請將清單檔案儲存到本機目錄,或上傳到 Amazon S3。

  4. 在快速入門頁面上,選擇資料

  5. 資料頁面上,選擇建立然後新增資料集

  6. 選擇 Amazon S3 圖示,然後選擇下一步

  7. 針對 Data source name (資料來源名稱),輸入資料來源的描述。此名稱應該協助您區分此資料來源和其他資料來源。

  8. 針對 Upload a manifest file (上傳資訊清單檔案),執行以下其中一個動作:

    • 若要使用本機資訊清單檔案,請選擇 Upload (上傳),然後選擇 Upload a JSON manifest file (上傳 JSON 資訊清單檔案)。針對 Open (開啟),選擇檔案,然後選擇 Open (開啟)

    • 若要使用 Amazon S3 的清單檔案,請選擇 URL,並輸入清單檔案的 URL。若要在 Amazon S3 主控台尋找既有清單檔案的 URL,請瀏覽到適當的檔案並選擇。這時會顯示屬性面板,包含連結 URL。您可以複製 URL 並將其貼到 Quick Sight 中。

  9. 選擇連線

  10. 為了確保連線完成,請選擇 Edit/Preview data (編輯/預覽資料)。否則,請選擇視覺化,以直接依資料現狀來建立分析。

    如果選擇編輯/預覽資料,您可以在準備資料時指定資料集名稱。否則,資料集名稱將與清單檔案的名稱相符。

    如要進一步了解資料準備,請參閱在 Amazon Quick Sight 中準備資料

根據多個 Amazon S3 檔案建立資料集

您可以使用數種方法之一,在 Quick Sight 中合併或合併來自 Amazon S3 儲存貯體的檔案:

  • 使用清單檔案來結合檔案 – 在這種情況下,檔案必須有相同的欄位 (資料欄) 數量。在檔案中相同位置的欄位之間,資料類型必須相符。例如,每個檔案中的第一個欄位必須是相同的資料類型。第二個欄位、第三個欄位,以此類推,也都必須如此。Quick Sight 會從第一個檔案取得欄位名稱。

    資訊清單中必須明確列出檔案。不過,檔案不需要在相同的 Amazon S3 儲存貯體內。

    此外,檔案必須遵循支援的 Amazon S3 清單檔案格式中所述的規則。

    如需有關使用資訊清單來結合檔案的詳細資訊,請參閱使用 Amazon S3 檔案建立資料集

  • 在不使用清單檔案的情況下合併檔案 – 若要將多個檔案合併成一個檔案,而不必在清單檔案中將其逐個列出,您可以使用 Athena。如果使用這個方法,您可以直接查詢文字檔案,就像在資料庫的表格中一樣。如需詳細資訊,請參閱大數據部落格中的文章:Analyzing data in Amazon S3 using Athena

  • 匯入之前使用指令碼來附加檔案 – 您可以使用為了上傳之前合併檔案而設計的指令碼。