

本文為英文版的機器翻譯版本，如內容有任何歧義或不一致之處，概以英文版為準。

# Apache Spark
<a name="using-other-services-read-spark"></a>

Apache Spark 是用於大規模資料處理的統一分析引擎。它提供了 Java、Scala、Python 和 R 中的高層級 API，以及支援一般執行圖的最佳化引擎。您可以使用 Apache Spark 建置串流處理應用程式，以取用 Kinesis 資料串流中的資料。

若要使用 Apache Spark 結構化串流使用 Kinesis 資料串流，請使用 Amazon Kinesis Data Streams [連接器](https://github.com/awslabs/spark-sql-kinesis-connector)。此連接器支援使用增強型廣發，為您的應用程式提供每秒高達 2 MB 資料的專用讀取輸送量。如需詳細資訊，請參閱[使用專用輸送量開發自訂消費者 （增強廣發）](https://docs.aws.amazon.com/streams/latest/dev/enhanced-consumers.html)。

若要使用 Spark 串流使用 Kinesis 資料串流，請參閱 [Spark 串流 \+ Kinesis 整合](https://spark.apache.org/docs/latest/streaming-kinesis-integration.html)。