

本文属于机器翻译版本。若本译文内容与英语原文存在差异，则一律以英文原文为准。

# 使用 Spark 结构化流 Amazon Kinesis Data Streams 连接器
<a name="emr-spark-structured-streaming-kinesis"></a>

Amazon EMR 7.1.0 及更高版本在发布映像中包含 Spark 结构化流 Amazon Kinesis Data Streams 连接器。通过此连接器，您可以使用 Amazon EMR 上的 Spark 来处理存储在 Amazon Kinesis Data Streams 中的数据。该连接器支持两种使用者类型 `GetRecords`（共享吞吐量）和 `SubscribeToShard`（增强扇出）。此集成基于 [https://github.com/awslabs/spark-sql-kinesis-connector](https://github.com/awslabs/spark-sql-kinesis-connector)。有关如何开始使用连接器的详细信息，请参阅 [README](https://github.com/awslabs/spark-sql-kinesis-connector/blob/main/README.md)。

以下示例演示了如何使用连接器通过 Amazon EMR 启动 Spark 应用程序

```
spark-submit my_kinesis_streaming_script.py
```