

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

# Tahap 4 - Migrasi data
<a name="stage-4-data-migration"></a>

Sekarang lingkungan target Anda sudah siap, Anda dapat menerapkan strategi migrasi data yang Anda pilih selama tahap perencanaan.

Bagian ini mencakup langkah-langkah implementasi untuk empat pola yang berbeda:
+ [Membangun dari snapshot](build-from-snapshot.md)
+ [Membangun dari sumbernya](build-from-source.md)
+ [Pengindeksan ulang jarak jauh](remote-reindexing.md)
+ [Menggunakan Logstash](logstash.md)

# 1. Membangun dari snapshot
<a name="build-from-snapshot"></a>

Bila Anda menggunakan pendekatan snapshot-restore, Anda menyalin data dari sumber Elasticsearch atau cluster OpenSearch untuk menargetkan domain Amazon Service. OpenSearch 

Secara umum, proses snapshot-restore terdiri dari langkah-langkah berikut:

1. Ambil snapshot data (indeks) yang diperlukan dari cluster yang ada, dan unggah snapshot ke bucket S3.

1. Buat domain OpenSearch Layanan Amazon.

1. Berikan izin OpenSearch Layanan Amazon untuk mengakses bucket, dan berikan izin akun pengguna Anda untuk bekerja dengan snapshot. Buat repositori snapshot dan arahkan ke bucket Anda.

1. Kembalikan snapshot pada domain OpenSearch Layanan Amazon.

1. Arahkan aplikasi klien Anda ke domain OpenSearch Layanan Amazon.

1. Buat kebijakan Manajemen Status Indeks (ISM) untuk mengonfigurasi retensi (opsional).

Snapshot bersifat inkremental. Oleh karena itu, snapshot dapat dijalankan dan dipulihkan secara bertahap. Dengan menggunakan snapshot, Anda dapat mengekstrak data secara massal sebagai file pada sistem penyimpanan (misalnya, Amazon S3). Anda kemudian dapat memuat file-file ini di lingkungan target dengan menggunakan operasi `_restore` API. Ini menghilangkan kebutuhan untuk pengindeksan ulang, yang memakan waktu, dan juga mengurangi lalu lintas jaringan.

## Pertimbangan snapshot
<a name="snapshot-considerations"></a>

Saat menggunakan pendekatan snapshot-restore, pertimbangkan hal berikut:
+ Anda tidak dapat mencari atau mengindeks ulang saat indeks dipulihkan. Namun, Anda dapat mencari dan mengindeks ulang indeks saat snapshot sedang diambil.
+ Sumber dan target Elasticsearch atau OpenSearch versi harus kompatibel. Cuplikan indeks yang dibuat di:
  + 5.x dapat dikembalikan ke 6.x
  + 2.x dapat dikembalikan ke 5.x
  + 1.x dapat dikembalikan ke 2.x
+ Karena ini adalah point-in-time pemulihan Elasticsearch atau OpenSearch snapshot, perubahan selanjutnya dalam cluster sumber tidak akan direplikasi ke domain Layanan Amazon target. OpenSearch Anda dapat menghentikan konsumsi data ke dalam sumber Elasticsearch atau OpenSearch cluster hingga pemulihan selesai, atau Anda dapat mengulangi proses pemulihan snapshot beberapa kali. Karena snapshot bersifat inkremental, hanya perubahan yang akan disalin dan dipulihkan di lingkungan target dalam waktu yang lebih singkat daripada pemulihan pertama. Setelah restorasi berhasil selesai, Anda mengarahkan aplikasi konsumsi ke domain OpenSearch Layanan Amazon.
+ Mengambil snapshot mencakup, secara default, snapshot dari status cluster dan semua indeks. Saat bermigrasi dari Elasticsearch, Anda mungkin perlu membuat kebijakan siklus hidup indeks yang setara di lingkungan target menggunakan fitur ISM di. OpenSearch Elasticsearch Index Lifecycle Management (ILM) tidak didukung di Amazon Service. OpenSearch 
+ Anda tidak dapat memulihkan snapshot ke versi Elasticsearch yang lebih lama atau. OpenSearch Misalnya, Anda tidak dapat mengembalikan snapshot versi 7.10 ke 7.9. Demikian pula, Anda tidak dapat memulihkan snapshot dari Elasticsearch 7.11 atau yang lebih baru ke domain Layanan Amazon. OpenSearch Jika Anda telah memigrasikan lingkungan Elasticsearch yang dikelola sendiri ke versi 7.11 atau yang lebih baru, Anda dapat menggunakan Logstash untuk memuat data dari cluster Elasticsearch dan menuliskannya ke domain. OpenSearch
+ Anda mengekspor snapshot ke lokasi penyimpanan yang ditunjuk yang disebut repositori. Elasticsearch atau OpenSearch membuat sejumlah file dalam repositori. Anda tidak dapat mengubah atau menghapus file-file ini. Melakukannya dapat menciptakan inkonsistensi atau menyebabkan proses pemulihan gagal.

# 2. Membangun dari sumbernya
<a name="build-from-source"></a>

Seperti dijelaskan sebelumnya, membangun dari sumber adalah pendekatan di mana Anda tidak memigrasikan data dari Elasticsearch atau lingkungan saat ini. OpenSearch Sebagai gantinya, Anda membuat indeks di domain target langsung dari log, atau sumber data katalog produk atau sumber konten.

Dua opsi tersedia untuk membangun dari sumbernya. Opsi yang Anda pilih tergantung pada tipe data data Anda:
+ Menggunakan AWS Database Migration Service — Jika sumber data Anda adalah sistem manajemen basis data relasional (RDBMS) dan sumbernya didukung oleh AWS Database Migration Service (AWS DMS), Anda dapat menggunakan AWS DMS untuk menyalin data dari sumber data ke domain Amazon Service target Anda. OpenSearch AWS DMS mendukung opsi full load dan change data capture (CDC). Dalam opsi pemuatan penuh, tugas AWS DMS menyalin semua data dari tabel database sumber ke OpenSearch indeks target. Anda dapat menggunakan pemetaan default atau menyediakan konfigurasi pemetaan khusus. Dalam opsi CDC, AWS DMS pertama-tama membuat salinan lengkap catatan tabel sumber menjadi indeks target OpenSearch . Kemudian menangkap data yang diubah (pembaruan dan sisipan) dan menyalinnya ke indeks. OpenSearch Untuk informasi selengkapnya, lihat posting blog [Memperkenalkan Amazon Elasticsearch Service sebagai target di AWS Database Migration Service dan Scale Amazon Elasticsearch Service untuk migrasi](https://aws.amazon.com/blogs/database/introducing-amazon-elasticsearch-service-as-a-target-in-aws-database-migration-service/) [AWS Database Migration Service](https://aws.amazon.com/blogs/database/scale-amazon-elasticsearch-service-for-aws-database-migration-service-migrations/).
+ Membangun dari sumber dokumen — Jika sumber data Anda bukan RDBMS atau tidak didukung oleh AWS DMS, Anda mungkin harus membuat solusi khusus menggunakan alat sumber terbuka atau kombinasi alat sumber terbuka dan layanan AWS. Anda harus mengonversi data sumber Anda ke dokumen JSON sebelum dapat dimuat. OpenSearch Jika Anda sudah menyiapkan saluran pipa dari sumber ke Elasticsearch atau OpenSearch lingkungan saat ini, Anda dapat mengarahkan pipeline data tersebut OpenSearch dengan perubahan yang sesuai di pustaka klien dan (jika diperlukan) perubahan model data dalam indeks di domain Layanan Amazon. OpenSearch Saat membangun indeks dari sumbernya, ingatlah pertimbangan berikut:
  + Lokasi dokumen — Dokumen mungkin sudah tersedia di AWS Cloud, di penyimpanan objek seperti Amazon S3, atau dokumen tersebut mungkin disimpan di lokasi penyimpanan lokal seperti sistem file.
  + Format dokumen — Dokumen sudah bisa dalam format JSON, siap untuk dicerna ke dalam domain OpenSearch Layanan Amazon, atau mereka mungkin perlu dibersihkan, diproses, dan diformat ke dalam JSON sebelum dapat dicerna ke dalam domain Layanan Amazon. OpenSearch 

Membangun dari sumber melibatkan langkah-langkah tingkat tinggi berikut:

1. Tentukan pemetaan dan pengaturan indeks di domain OpenSearch Layanan Amazon.

1. Ekstrak data dari sumber dokumen dan salin ke lokasi penyimpanan objek seperti Amazon S3. Anda dapat menggunakan alat sumber terbuka (misalnya, Logstash), klien layanan AWS (misalnya, Agen Amazon Kinesis), alat komersial pihak ketiga, atau program khusus.

1. Konfigurasikan alat sumber terbuka (misalnya, Logstash atau Fluent Bit) atau layanan AWS asli (misalnya, AWS Lambda atau AWS DMS) untuk mengonversi data menjadi dokumen JSON dan memuatnya secara berkala atau terus menerus dari penyimpanan objek ke domain Layanan Amazon. OpenSearch 

Untuk informasi selengkapnya, lihat [Memuat data streaming ke OpenSearch Layanan Amazon](https://docs.aws.amazon.com/opensearch-service/latest/developerguide/integrations.html).

# 3. Pengindeksan ulang jarak jauh
<a name="remote-reindexing"></a>

[Dalam hal ini, indeks Elasticsearch atau OpenSearch cluster sumber yang dikelola sendiri akan dimigrasikan ke domain Layanan OpenSearch Amazon menggunakan operasi API dokumen indeks ulang.](https://docs.opensearch.org/latest/api-reference/document-apis/reindex/) Anda dapat menggunakan operasi API dokumen indeks ulang untuk membuat indeks dari Elasticsearch atau indeks yang ada. OpenSearch Indeks yang ada bisa berada di cluster yang sama tempat Anda menjalankan operasi indeks ulang, atau bisa juga di cluster jarak jauh. Amazon OpenSearch Service mendukung penggunaan operasi API dokumen indeks ulang dengan cluster jarak jauh. Anda dapat mengindeks ulang dari indeks dalam Elasticsearch yang dikelola sendiri ke indeks di Amazon Service. OpenSearch 

Remote reindex mendukung Elasticsearch 1.5 dan yang lebih baru untuk cluster Elasticsearch jarak jauh dan OpenSearch Amazon Service 6.7 dan yang lebih baru untuk domain lokal. Untuk informasi selengkapnya, lihat posting blog [Memigrasikan data ke Amazon ES menggunakan indeks ulang jarak jauh](https://aws.amazon.com/blogs/big-data/migrate-data-into-amazon-es-using-remote-reindex/). Posting blog mengacu pada Amazon Elasticsearch, tetapi panduan ini berlaku untuk domain OpenSearch Layanan Amazon secara merata.

# 4. Menggunakan Logstash
<a name="logstash"></a>

[Logstash](https://www.elastic.co/guide/en/logstash/current/index.html) adalah alat pemrosesan data sumber terbuka yang dapat mengumpulkan data dari sumber, melakukan transformasi atau pemfilteran, dan mengirim data ke satu atau lebih tujuan. Untuk menulis data ke domain OpenSearch Layanan Amazon, Logstash menyediakan plugin berikut:
+ logstash-input-elasticsearch
+ logstash-input-opensearch
+ logstash-output-opensearch

Untuk informasi selengkapnya, lihat [Memuat data ke OpenSearch Layanan Amazon dengan Logstash](https://docs.aws.amazon.com/opensearch-service/latest/developerguide/managedomains-logstash.html) dan posting OpenSearch blog [Memperkenalkan logstash-input-opensearch plugin](https://opensearch.org/blog/community/2022/05/introducing-logstash-input-opensearch-plugin-for-opensearch/) untuk. OpenSearch