Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.
Gunakan Apache Spark di Amazon Athena
Amazon Athena memudahkan untuk menjalankan analitik dan eksplorasi data secara interaktif menggunakan Apache Spark tanpa perlu merencanakan, mengonfigurasi, atau mengelola sumber daya. Menjalankan aplikasi Apache Spark di Athena berarti mengirimkan kode Spark untuk diproses dan menerima hasil secara langsung tanpa perlu konfigurasi tambahan. Apache Spark di Amazon Athena tanpa server dan menyediakan penskalaan otomatis sesuai permintaan yang memberikan komputasi instan untuk memenuhi perubahan volume data dan persyaratan pemrosesan.
Dalam versi rilisPySpark mesin versi 3, Anda dapat menggunakan pengalaman notebook yang disederhanakan di konsol Amazon Athena untuk mengembangkan aplikasi Apache Spark menggunakan notebook Python atau Athena. APIs
Dalam versi rilisApache Spark versi 3.5, Anda dapat menjalankan kode Spark dari notebook Amazon SageMaker Unified Studio atau klien yang kompatibel dengan Spark Connect pilihan Anda.
Amazon Athena menawarkan fitur-fitur berikut:
-
Penggunaan konsol — Kirim aplikasi Spark Anda dari konsol Amazon Athena (hanya Pyspark enginer versi 3).
-
Scripting — Membangun dan men-debug aplikasi Apache Spark dengan cepat dan interaktif dengan Python.
-
Penskalaan dinamis — Amazon Athena secara otomatis menentukan sumber daya komputasi dan memori yang diperlukan untuk menjalankan pekerjaan dan terus menskalakan sumber daya tersebut hingga maksimum yang Anda tentukan. Penskalaan dinamis ini mengurangi biaya tanpa mempengaruhi kecepatan.
-
Pengalaman Notebook — Gunakan notebook Amazon SageMaker AI Unified Studio untuk membuat, mengedit, dan menjalankan komputasi menggunakan antarmuka yang sudah dikenal. Di mesin Pyspark versi 3, Anda dapat menggunakan notebook dalam konsol Athena yang kompatibel dengan notebook Jupyter dan berisi daftar sel yang dijalankan secara berurutan sebagai perhitungan. Konten sel dapat mencakup kode, teks, penurunan harga, matematika, plot, dan media kaya.
Untuk informasi tambahan, lihat Menjalankan Spark SQL di Amazon Athena