

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

# Fase 4: migración de datos
<a name="stage-4-data-migration"></a>

Ahora que su entorno de destino está listo, puede implementar la estrategia de migración de datos que eligió durante la fase de planificación.

En esta sección se describen los pasos de implementación de los cuatro patrones diferentes:
+ [Creación a partir de una instantánea](build-from-snapshot.md)
+ [Creación a partir del origen](build-from-source.md)
+ [Reindexación remota](remote-reindexing.md)
+ [Uso de Logstash](logstash.md)

# 1. Creación a partir de una instantánea
<a name="build-from-snapshot"></a>

Cuando utilizas el enfoque de restauración de instantáneas, copias los datos del clúster o Elasticsearch de origen OpenSearch al dominio de Amazon Service de destino. OpenSearch 

En términos generales, el proceso de restauración de instantáneas consta de los siguientes pasos:

1. Cree una instantánea de los datos (índices) necesarios del clúster existente y cárguela en un bucket de S3.

1. Crea un dominio OpenSearch de Amazon Service.

1. Concede permisos a Amazon OpenSearch Service para acceder al bucket y a tu cuenta de usuario permisos para trabajar con instantáneas. Cree un repositorio de instantáneas y asígnelo a su bucket.

1. Restaure la instantánea en el dominio OpenSearch de Amazon Service.

1. Dirija las aplicaciones de sus clientes al dominio OpenSearch de Amazon Service.

1. Cree políticas de Index State Management (ISM) para configurar la retención (opcional).

Las instantáneas son progresivas. Por lo tanto, una instantánea se puede poner en marcha y restaurar de forma incremental. Al usar instantáneas, puede extraer datos de forma masiva como archivos en un sistema de almacenamiento (por ejemplo, Amazon S3). A continuación, puede cargar estos archivos en el entorno de destino mediante la operación `_restore` de la API. Esto elimina la necesidad de volver a indexar, un proceso que lleva mucho tiempo, y también reduce el tráfico de red.

## Consideraciones sobre las instantáneas
<a name="snapshot-considerations"></a>

Cuando utilice una estrategia de restauración de instantáneas, tenga en cuenta lo siguiente:
+ No puede buscar ni volver a indexar mientras se restaura un índice, aunque sí puede hacerlo mientras se crea la instantánea.
+ Las OpenSearch versiones de Elasticsearch de origen y destino deben ser compatibles. Una instantánea de un índice que se creó en:
  + 5.x se puede restaurar a 6.x
  + 2.x se puede restaurar a 5.x
  + 1.x se puede restaurar a 2.x
+ Como se trata de una point-in-time restauración del Elasticsearch o de la OpenSearch instantánea, los cambios posteriores en el clúster de origen no se replicarán en el dominio de Amazon OpenSearch Service de destino. Puede detener la ingestión de los datos en el OpenSearch clúster o Elasticsearch de origen hasta que se complete la restauración, o bien puede repetir el proceso de restauración de la instantánea varias veces. Como la instantánea es incremental, solo se copiarán y restaurarán los cambios en el entorno de destino, tardando menos que la primera restauración. Una vez finalizada la restauración correctamente, diriges las aplicaciones de ingestión al dominio de Amazon OpenSearch Service.
+ La creación de una instantánea incluye, de forma predeterminada, una instantánea del estado del clúster y de todos los índices. Al migrar desde Elasticsearch, es posible que tengas que crear políticas de ciclo de vida de indexación equivalentes en el entorno de destino mediante la función ISM incluida en. OpenSearch Amazon Service no admite la administración del ciclo de vida (ILM) de Elasticsearch Index. OpenSearch 
+ No puedes restaurar una instantánea en una versión anterior de Elasticsearch o. OpenSearch Por ejemplo, no puede restaurar una instantánea de la versión 7.10 a la 7.9. Del mismo modo, no puedes restaurar instantáneas de Elasticsearch 7.11 o versiones posteriores a un dominio de Amazon Service. OpenSearch Si migraste tu entorno autogestionado de Elasticsearch a la versión 7.11 o posterior, puedes usar Logstash para cargar datos del clúster de Elasticsearch y escribirlos en el dominio. OpenSearch
+ Tiene que exportar una instantánea a una ubicación de almacenamiento designada denominada “repositorio”. Elasticsearch o crea varios archivos en el repositorio. OpenSearch Estos archivos no se pueden modificar ni eliminar. Si lo hace, podría crear incoherencias o provocar un error en el proceso de restauración.

# 2. Creación a partir del origen
<a name="build-from-source"></a>

Como se describió anteriormente, crear a partir del origen es el enfoque en el que no se migran los datos del entorno o Elasticsearch actuales. OpenSearch En su lugar, se crean índices en el dominio de destino directamente a partir del registro, el origen de datos del catálogo de productos o el origen de contenido.

Hay dos opciones disponibles para crear a partir del origen. La opción que elija depende del tipo de datos:
+ Uso de AWS Database Migration Service: si la fuente de sus datos es un sistema de administración de bases de datos relacionales (RDBMS) y la fuente es compatible con AWS Database Migration Service (AWS DMS), puede usar AWS DMS para copiar los datos de su fuente de datos a su dominio de Amazon Service de destino. OpenSearch AWS DMS admite opciones de captura de datos modificados (CDC) y carga completa. En la opción de carga completa, la tarea de AWS DMS copia todos los datos de la tabla de la base de datos de origen a un OpenSearch índice de destino. Puede usar la asignación predeterminada o proporcionar configuraciones de asignación personalizadas. En la opción CDC, AWS DMS primero hace una copia completa de los registros de la tabla de origen en un OpenSearch índice de destino. A continuación, captura los datos modificados (los actualiza e inserta) y los copia en el OpenSearch índice. Para obtener más información, consulte las publicaciones del blog [Introducing Amazon Elasticsearch Service as a target in AWS Database Migration Service](https://aws.amazon.com/blogs/database/introducing-amazon-elasticsearch-service-as-a-target-in-aws-database-migration-service/) y [Scale Amazon Elasticsearch Service for AWS Database Migration Service migrations](https://aws.amazon.com/blogs/database/scale-amazon-elasticsearch-service-for-aws-database-migration-service-migrations/).
+ Creación a partir del origen del documento: si su origen de datos no es un RDBMS o no es compatible con AWS DMS, es posible que tenga que crear una solución personalizada con herramientas de código abierto o una combinación de herramientas de código abierto y servicios de AWS. Debe convertir los datos de origen en documentos JSON para poder cargarlos OpenSearch. Si ya tienes canalizaciones configuradas desde tu fuente hasta tu OpenSearch entorno o Elasticsearch actual, puedes apuntar esas canalizaciones de datos con los cambios adecuados en las bibliotecas de clientes y (si es necesario) OpenSearch con los cambios del modelo de datos en los índices del dominio de Amazon Service. OpenSearch Cuando cree índices a partir del origen, tenga en cuenta lo siguiente:
  + La ubicación de los documentos: es posible que los documentos ya estén disponibles en la nube de AWS, en un almacén de objetos, como Amazon S3, o en una ubicación de almacenamiento en las instalaciones, como un sistema de archivos.
  + El formato de los documentos: es posible que los documentos ya estén en formato JSON, listos para ser ingeridos en el dominio de Amazon OpenSearch Service, o es posible que deban limpiarse, procesarse y formatearse en JSON antes de poder incorporarse al dominio de Amazon Service. OpenSearch 

Estos son los pasos generales para crear a partir del origen:

1. Defina la asignación de índices y la configuración en el dominio OpenSearch de Amazon Service.

1. Extraiga los datos del origen del documento y cópielos en una ubicación de almacenamiento de objetos, como Amazon S3. Puede usar una herramienta de código abierto (por ejemplo, Logstash), un cliente de servicio de AWS (por ejemplo, Amazon Kinesis Agent), una herramienta comercial de terceros o un programa personalizado.

1. Configure una herramienta de código abierto (por ejemplo, Logstash o Fluent Bit) o un servicio nativo de AWS (por ejemplo, AWS Lambda o AWS DMS) para convertir los datos en documentos JSON y cargarlos de forma periódica o continua desde el almacén de objetos al dominio de Amazon Service. OpenSearch 

Para obtener más información, consulta [Cómo cargar datos de streaming en Amazon OpenSearch Service](https://docs.aws.amazon.com/opensearch-service/latest/developerguide/integrations.html).

# 3. Reindexación remota
<a name="remote-reindexing"></a>

En este caso, los índices del OpenSearch clúster o Elasticsearch autogestionado de origen se migran al dominio de Amazon OpenSearch Service mediante la operación de API de [reindexación](https://docs.opensearch.org/latest/api-reference/document-apis/reindex/) de documentos. Puedes usar la operación de la API de reindexación de documentos para crear un índice a partir de un Elasticsearch o índice existente. OpenSearch El índice existente puede estar en el mismo clúster en el que puso en marcha la operación de reindexación o en un clúster remoto. Amazon OpenSearch Service admite el uso de la operación API de reindexación de documentos con clústeres remotos. Puedes volver a indexar de un índice de un Elasticsearch autogestionado a un índice de Amazon Service. OpenSearch 

La reindexación remota admite Elasticsearch 1.5 y versiones posteriores para el clúster remoto de Elasticsearch y OpenSearch Amazon Service 6.7 y versiones posteriores para el dominio local. Para obtener más información, consulte la publicación del blog [Migrate data into Amazon ES using remote reindex](https://aws.amazon.com/blogs/big-data/migrate-data-into-amazon-es-using-remote-reindex/). La entrada del blog hace referencia a Amazon Elasticsearch, pero la guía se aplica igualmente a los dominios de Amazon OpenSearch Service.

# 4. Uso de Logstash
<a name="logstash"></a>

[Logstash](https://www.elastic.co/guide/en/logstash/current/index.html) es una herramienta de procesamiento de datos de código abierto que puede recopilar datos del origen, transformar, filtrar y enviar datos a uno o más destinos. Para escribir datos en el dominio de Amazon OpenSearch Service, Logstash proporciona los siguientes complementos:
+ logstash-input-elasticsearch
+ logstash-input-opensearch
+ logstash-output-opensearch

Para obtener más información, consulta Cómo [cargar datos en Amazon OpenSearch Service con Logstash](https://docs.aws.amazon.com/opensearch-service/latest/developerguide/managedomains-logstash.html) y la entrada del OpenSearch blog [Introducing logstash-input-opensearch plugin](https://opensearch.org/blog/community/2022/05/introducing-logstash-input-opensearch-plugin-for-opensearch/) for. OpenSearch