

本文為英文版的機器翻譯版本，如內容有任何歧義或不一致之處，概以英文版為準。

# 教學課程：與 Apache Spark 整合以匯入或匯出資料
<a name="spark-integrating"></a>

Apache Spark 是用於大規模資料分析的開放原始碼引擎。Apache Spark 可讓您更有效率地對存放在 Amazon Keyspaces 中的資料進行分析。您也可以使用 Amazon Keyspaces 為應用程式提供一致的single-digit-millisecond讀取存取 Spark 的分析資料。開放原始碼 Spark Cassandra 連接器可簡化 Amazon Keyspaces 和 Spark 之間的讀取和寫入資料。

Amazon Keyspaces 對 Spark Cassandra Connector 的支援使用全受管無伺服器資料庫服務，簡化 Spark 型分析管道中執行 Cassandra 工作負載的過程。使用 Amazon Keyspaces，您不需要擔心 Spark 與資料表競爭相同的基礎基礎設施資源。Amazon Keyspaces 資料表會根據您的應用程式流量自動擴展和縮減。

下列教學課程會逐步解說使用 Spark Cassandra 連接器讀取和寫入資料至 Amazon Keyspaces 所需的步驟和最佳實務。本教學課程示範如何使用 Spark Cassandra 連接器從檔案載入資料並將其寫入 Amazon Keyspaces 資料表，以將資料遷移至 Amazon Keyspaces。然後，教學課程示範如何使用 Spark Cassandra 連接器從 Amazon Keyspaces 讀取資料。您會這麼做，以在 Spark 型分析管道中執行 Cassandra 工作負載。

**Topics**
+ [使用 Spark Cassandra 連接器建立 Amazon Keyspaces 連線的先決條件](spark-tutorial-prerequisites.md)
+ [步驟 1：設定 Amazon Keyspaces 以與 Apache Cassandra Spark Connector 整合](spark-tutorial-step1.md)
+ [步驟 2：設定 Apache Cassandra Spark 連接器](spark-tutorial-step2.md)
+ [步驟 3：建立應用程式組態檔案](spark-tutorial-step3.md)
+ [步驟 4：準備 Amazon Keyspaces 中的來源資料和目標資料表](spark-tutorial-step4.md)
+ [步驟 5：使用 Apache Cassandra Spark 連接器寫入和讀取 Amazon Keyspaces 資料](spark-tutorial-step5.md)
+ [對搭配 Amazon Keyspaces 使用 Spark Cassandra 連接器時的常見錯誤進行故障診斷](spark-tutorial-step6.md)