

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

# Apache Spark
<a name="using-other-services-read-spark"></a>

Apache Spark는 대규모 데이터 처리를 위한 통합 분석 엔진으로서, Java, Scala, Python 및 R의 고급 API와 일반 실행 그래프를 지원하는 최적화된 엔진을 제공합니다. Apache Spark를 사용하여 Kinesis 데이터 스트림의 데이터를 소비하는 스트림 처리 애플리케이션을 구축할 수 있습니다.

Apache Spark Structured Streaming을 사용하여 Kinesis 데이터 스트림을 소비하려면 Amazon Kinesis Data Streams [커넥터](https://github.com/awslabs/spark-sql-kinesis-connector)를 사용합니다. 이 커넥터는 향상된 팬아웃을 사용한 소비를 지원합니다. 이 경우 애플리케이션에 샤드당 초당 최대 2MB 데이터의 전용 읽기 처리량을 제공합니다. 자세한 내용은 [Developing Custom Consumers with Dedicated Throughput (Enhanced Fan-Out)](https://docs.aws.amazon.com/streams/latest/dev/enhanced-consumers.html)을 참조하세요.

Spark Streaming을 사용하여 Kinesis 데이터 스트림을 소비하는 방법에 대한 자세한 내용은 [Spark Streaming \+ Kinesis Integration](https://spark.apache.org/docs/latest/streaming-kinesis-integration.html)을 참조하세요.