

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

# Sumber data dan konsumsi
<a name="feature-store-ingest-data"></a>

Rekaman ditambahkan ke grup fitur Anda melalui konsumsi. Bergantung pada kasus penggunaan yang Anda inginkan, catatan yang tertelan dapat disimpan dalam grup fitur atau tidak. Ini tergantung pada konfigurasi penyimpanan, jika grup fitur Anda menggunakan toko offline atau online. Toko offline digunakan sebagai database historis, yang biasanya digunakan untuk eksplorasi data, pelatihan model pembelajaran mesin (ML), dan inferensi batch. Toko online digunakan sebagai pencarian catatan waktu nyata, yang biasanya digunakan untuk penyajian model ML. Untuk informasi lebih lanjut tentang konsep dan konsumsi Toko Fitur, lihat. [Konsep Toko Fitur](feature-store-concepts.md)

Ada beberapa cara untuk membawa data Anda ke Amazon SageMaker Feature Store. Feature Store menawarkan panggilan API tunggal untuk konsumsi data `PutRecord` yang disebut yang memungkinkan Anda untuk menelan data dalam batch atau dari sumber streaming. Anda dapat menggunakan Amazon SageMaker Data Wrangler untuk merekayasa fitur dan kemudian memasukkan fitur Anda ke dalam Toko Fitur Anda. Anda juga dapat menggunakan Amazon EMR untuk konsumsi data batch melalui konektor Spark.

Dalam topik berikut kita akan membahas perbedaan antara 

**Topics**
+ [Streaming konsumsi](#feature-store-ingest-data-stream)
+ [Data Wrangler dengan Feature Store](#feature-store-data-wrangler-integration)
+ [Konsumsi batch dengan Amazon SageMaker Feature Store Spark](batch-ingestion-spark-connector-setup.md)

## Streaming konsumsi
<a name="feature-store-ingest-data-stream"></a>

Anda dapat menggunakan sumber streaming seperti Kafka atau Kinesis sebagai sumber data, tempat catatan diekstraksi, dan langsung memasukkan catatan ke toko online untuk pelatihan, inferensi, atau pembuatan fitur. Rekaman dapat dimasukkan ke dalam grup fitur Anda dengan menggunakan panggilan `PutRecord` API sinkron. Karena ini adalah panggilan API sinkron, ini memungkinkan sejumlah kecil pembaruan didorong dalam satu panggilan API. Ini memungkinkan Anda untuk mempertahankan kesegaran nilai fitur yang tinggi dan mempublikasikan nilai segera setelah pembaruan terdeteksi. Ini juga disebut fitur *streaming*. 

## Data Wrangler dengan Feature Store
<a name="feature-store-data-wrangler-integration"></a>

Data Wrangler adalah fitur Studio Classic yang menyediakan solusi end-to-end untuk mengimpor, menyiapkan, mengubah, menyesuaikan, dan menganalisis data. Data Wrangler memungkinkan Anda untuk merekayasa fitur Anda dan mencernanya ke dalam grup fitur toko online atau offline Anda.

Petunjuk berikut mengekspor buku catatan Jupyter yang berisi semua kode sumber yang diperlukan untuk membuat grup fitur Toko Fitur yang menambahkan fitur Anda dari Data Wrangler ke toko online atau offline.

Petunjuk tentang mengekspor aliran data Wrangler Data Anda ke Feature Store di konsol bervariasi tergantung pada apakah Anda mengaktifkan [SageMaker Studio Amazon](studio-updated.md) atau [Amazon SageMaker Studio Klasik](studio.md) sebagai pengalaman default Anda.

### Ekspor aliran data Data Wrangler Anda ke Feature Store jika Studio adalah pengalaman default Anda (konsol)
<a name="feature-store-ingest-data-wrangler-integration-with-studio-updated"></a>

1. Buka konsol Studio dengan mengikuti petunjuk di[Luncurkan Amazon SageMaker Studio](studio-updated-launch.md).

1. Pilih **Data** dari panel kiri, untuk memperluas daftar dropdown.

1. Dari daftar dropdown, pilih **Data** Wrangler.

1. Jika Anda memiliki instance Amazon SageMaker Canvas yang sudah berjalan, pilih **Open Canvas**.

   Jika Anda tidak memiliki instance SageMaker Canvas yang berjalan, pilih **Jalankan di Canvas**.

1. Pada konsol SageMaker Canvas, pilih **Data Wrangler** di panel navigasi kiri.

1. Pilih **Alur data** untuk melihat aliran data Anda.

1. Pilih **\+** untuk memperluas daftar dropdown.

1. Pilih **Ekspor aliran data** untuk memperluas daftar dropdown.

1. Pilih **Simpan ke Toko SageMaker Fitur (melalui JupyterLab Notebook)**.

1. **Di bawah Ekspor aliran data sebagai buku catatan**, pilih salah satu opsi berikut:
   + **Unduh salinan lokal** untuk mengunduh aliran data ke mesin lokal Anda.
   + **Ekspor ke lokasi S3** untuk mengunduh aliran data ke lokasi Layanan Penyimpanan Sederhana Amazon dan masukkan lokasi Amazon S3 atau pilih **Jelajahi** untuk menemukan lokasi Amazon S3 Anda.

1. Pilih **Ekspor**.

 Setelah grup fitur dibuat, Anda juga dapat memilih dan menggabungkan data di beberapa grup fitur untuk membuat fitur rekayasa baru di Data Wrangler dan kemudian mengekspor kumpulan data Anda ke bucket Amazon S3. 

Untuk informasi selengkapnya tentang cara mengekspor ke Feature Store, lihat [Mengekspor ke Toko Fitur SageMaker AI](https://docs.aws.amazon.com/sagemaker/latest/dg/data-wrangler-data-export.html#data-wrangler-data-export-feature-store). 