

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

# Étape 4 — Migration des données
<a name="stage-4-data-migration"></a>

Maintenant que votre environnement cible est prêt, vous pouvez mettre en œuvre la stratégie de migration des données que vous avez choisie lors de la phase de planification.

Cette section décrit les étapes de mise en œuvre des quatre modèles différents :
+ [Création à partir d'un instantané](build-from-snapshot.md)
+ [Construire à partir de la source](build-from-source.md)
+ [Réindexation à distance](remote-reindexing.md)
+ [Utilisation de Logstash](logstash.md)

# 1. Création à partir d'un instantané
<a name="build-from-snapshot"></a>

Lorsque vous utilisez l'approche de restauration instantanée, vous copiez les données de la source Elasticsearch ou du cluster OpenSearch vers le domaine Amazon Service cible. OpenSearch 

D'une manière générale, le processus de restauration des instantanés comprend les étapes suivantes :

1. Prenez un instantané des données nécessaires (index) à partir du cluster existant, puis chargez-le dans un compartiment S3.

1. Créez un domaine Amazon OpenSearch Service.

1. Donnez à Amazon OpenSearch Service l'autorisation d'accéder au compartiment et autorisez votre compte utilisateur à utiliser des instantanés. Créez un référentiel de snapshots et pointez-le vers votre compartiment.

1. Restaurez le snapshot sur le domaine Amazon OpenSearch Service.

1. Dirigez vos applications clientes vers le domaine Amazon OpenSearch Service.

1. Créez des politiques ISM (Index State Management) pour configurer la rétention (facultatif).

Les instantanés sont incrémentiels. Par conséquent, un instantané peut être exécuté et restauré de manière incrémentielle. En utilisant des instantanés, vous pouvez extraire des données en masse sous forme de fichiers sur un système de stockage (par exemple, Amazon S3). Vous pouvez ensuite charger ces fichiers dans l'environnement cible à l'aide de l'opération `_restore` API. Cela élimine le besoin de réindexation, qui prend beaucoup de temps, et réduit également le trafic réseau.

## Considérations relatives aux captures
<a name="snapshot-considerations"></a>

Lorsque vous utilisez l'approche de restauration instantanée, tenez compte des points suivants :
+ Vous ne pouvez pas effectuer de recherche ou de réindexation pendant la restauration d'un index. Toutefois, vous pouvez rechercher et réindexer un index pendant que l'instantané est en cours de prise.
+ Les OpenSearch versions ou versions d'Elasticsearch source et cible doivent être compatibles. Instantané d'un index créé dans :
  + 5.x peut être restauré en 6.x
  + 2.x peut être restauré en 5.x
  + 1.x peut être restauré en 2.x
+ Comme il s'agit d'une point-in-time restauration d'Elasticsearch ou d'un OpenSearch instantané, les modifications ultérieures apportées au cluster source ne seront pas répliquées sur le domaine Amazon OpenSearch Service cible. Vous pouvez arrêter l'ingestion des données dans l'Elasticsearch ou le OpenSearch cluster source jusqu'à ce que la restauration soit terminée, ou vous pouvez répéter le processus de restauration des instantanés plusieurs fois. Le cliché étant incrémentiel, seules les modifications seront copiées et restaurées dans l'environnement cible en moins de temps que lors de la première restauration. Une fois la restauration terminée, vous pointez les applications d'ingestion vers le domaine Amazon OpenSearch Service.
+ La prise d'un instantané inclut, par défaut, un instantané de l'état du cluster et de tous les index. Lors de la migration depuis Elasticsearch, vous devrez peut-être créer des politiques de cycle de vie d'index équivalentes dans l'environnement cible à l'aide de la fonctionnalité ISM de. OpenSearch La gestion du cycle de vie des index (ILM) d'Elasticsearch n'est pas prise en charge par Amazon Service. OpenSearch 
+ Vous ne pouvez pas restaurer un instantané vers une version antérieure d'Elasticsearch ou. OpenSearch Par exemple, vous ne pouvez pas restaurer un instantané des versions 7.10 à 7.9. De même, vous ne pouvez pas restaurer des instantanés depuis Elasticsearch 7.11 ou version ultérieure vers un domaine Amazon Service. OpenSearch Si vous avez migré votre environnement Elasticsearch autogéré vers la version 7.11 ou ultérieure, vous pouvez utiliser Logstash pour charger des données depuis le cluster Elasticsearch et les écrire dans le domaine. OpenSearch
+ Vous exportez un instantané vers un emplacement de stockage désigné appelé référentiel. Elasticsearch ou OpenSearch crée un certain nombre de fichiers dans le référentiel. Vous ne pouvez ni modifier ni supprimer ces fichiers. Cela risque de créer des incohérences ou d'entraîner l'échec du processus de restauration.

# 2. Construire à partir de la source
<a name="build-from-source"></a>

Comme décrit précédemment, la création à partir de la source est l'approche selon laquelle vous ne migrez pas de données depuis l'environnement ou OpenSearch Elasticsearch actuel. Au lieu de cela, vous créez des index dans le domaine cible directement à partir de votre journal, de votre source de données de catalogue de produits ou de votre source de contenu.

Deux options sont disponibles pour construire à partir de la source. L'option que vous choisissez dépend du type de données :
+ Utilisation d'AWS Database Migration Service : si la source de vos données est un système de gestion de base de données relationnelle (RDBMS) et qu'elle est prise en charge par AWS Database Migration Service (AWS DMS), vous pouvez utiliser AWS DMS pour copier les données de votre source de données vers votre domaine Amazon Service cible. OpenSearch AWS DMS prend en charge les options de chargement complet et de capture des données modifiées (CDC). Dans l'option de chargement complet, la tâche AWS DMS copie toutes les données de la table de base de données source vers un OpenSearch index cible. Vous pouvez utiliser le mappage par défaut ou fournir des configurations de mappage personnalisées. Dans l'option CDC, AWS DMS crée d'abord une copie complète des enregistrements de la table source dans un OpenSearch index cible. Il capture ensuite les données modifiées (mises à jour et insertions) et les copie dans l' OpenSearchindex. Pour plus d'informations, consultez les articles de blog [Introducing Amazon Elasticsearch Service as a target in AWS Database Migration](https://aws.amazon.com/blogs/database/introducing-amazon-elasticsearch-service-as-a-target-in-aws-database-migration-service/) Service et Scale [Amazon Elasticsearch Service for AWS Database](https://aws.amazon.com/blogs/database/scale-amazon-elasticsearch-service-for-aws-database-migration-service-migrations/) Migration Service.
+ Création à partir de la source du document — Si votre source de données n'est pas un SGBDR ou si elle n'est pas prise en charge par AWS DMS, vous devrez peut-être créer une solution personnalisée à l'aide d'outils open source ou d'une combinaison d'outils open source et de services AWS. Vous devez convertir vos données sources en documents JSON avant de pouvoir les charger OpenSearch. Si vous avez déjà configuré des pipelines entre votre source et votre OpenSearch environnement Elasticsearch actuel, vous pouvez diriger ces pipelines de données vers OpenSearch des modifications appropriées dans les bibliothèques clientes et (si nécessaire) des modifications du modèle de données dans les index du domaine Amazon OpenSearch Service. Lorsque vous créez des index à partir de la source, tenez compte des considérations suivantes :
  + Emplacement des documents — Les documents peuvent déjà être disponibles dans le cloud AWS, dans un espace de stockage d'objets tel qu'Amazon S3, ou ils peuvent être stockés dans un emplacement de stockage sur site tel qu'un système de fichiers.
  + Le format des documents — Les documents sont peut-être déjà au format JSON, prêts à être ingérés dans le domaine Amazon OpenSearch Service, ou ils peuvent avoir besoin d'être nettoyés, traités et formatés au format JSON avant de pouvoir être ingérés dans le domaine Amazon Service. OpenSearch 

La création à partir de la source implique les étapes de haut niveau suivantes :

1. Définissez le mappage d'index et les paramètres dans le domaine Amazon OpenSearch Service.

1. Extrayez les données de la source du document et copiez-les dans un emplacement de stockage d'objets tel qu'Amazon S3. Vous pouvez utiliser un outil open source (par exemple, Logstash), un client de service AWS (par exemple, Amazon Kinesis Agent), un outil commercial tiers ou un programme personnalisé.

1. Configurez un outil open source (par exemple, Logstash ou Fluent Bit) ou un service AWS natif (par exemple, AWS Lambda ou AWS DMS) pour convertir les données en documents JSON et les charger périodiquement ou en continu depuis le magasin d'objets vers le domaine Amazon Service. OpenSearch 

Pour plus d'informations, consultez la section [Chargement de données de streaming dans Amazon OpenSearch Service](https://docs.aws.amazon.com/opensearch-service/latest/developerguide/integrations.html).

# 3. Réindexation à distance
<a name="remote-reindexing"></a>

Dans ce cas, les index de l'Elasticsearch ou du OpenSearch cluster source autogéré sont migrés vers le domaine OpenSearch Amazon Service à l'aide de l'opération d'API de réindexation [du](https://docs.opensearch.org/latest/api-reference/document-apis/reindex/) document. Vous pouvez utiliser l'opération d'API de réindexation du document pour créer un index à partir d'un Elasticsearch ou d'un index existant. OpenSearch L'index existant peut se trouver dans le même cluster dans lequel vous exécutez l'opération de réindexation, ou dans un cluster distant. Amazon OpenSearch Service prend en charge l'utilisation de l'opération d'API de réindexation des documents avec des clusters distants. Vous pouvez réindexer un index dans un Elasticsearch autogéré vers un index dans Amazon Service. OpenSearch 

La réindexation à distance prend en charge Elasticsearch 1.5 et versions ultérieures pour le cluster Elasticsearch distant et OpenSearch Amazon Service 6.7 et versions ultérieures pour le domaine local. Pour plus d'informations, consultez le billet de blog [Migrer les données vers Amazon ES à l'aide de la réindexation à distance](https://aws.amazon.com/blogs/big-data/migrate-data-into-amazon-es-using-remote-reindex/). Le billet de blog fait référence à Amazon Elasticsearch, mais les instructions s'appliquent également aux domaines Amazon OpenSearch Service.

# 4. Utilisation de Logstash
<a name="logstash"></a>

[Logstash](https://www.elastic.co/guide/en/logstash/current/index.html) est un outil de traitement de données open source qui peut collecter des données à la source, effectuer une transformation ou un filtrage, et envoyer des données vers une ou plusieurs destinations. Pour écrire des données dans le domaine Amazon OpenSearch Service, Logstash fournit les plugins suivants :
+ logstash-input-elasticsearch
+ logstash-input-opensearch
+ logstash-output-opensearch

Pour plus d'informations, consultez [Charger des données dans Amazon OpenSearch Service avec Logstash](https://docs.aws.amazon.com/opensearch-service/latest/developerguide/managedomains-logstash.html) et le billet de OpenSearch blog [Présentation du logstash-input-opensearch plugin](https://opensearch.org/blog/community/2022/05/introducing-logstash-input-opensearch-plugin-for-opensearch/) pour. OpenSearch