

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

# Etapa 4: migração de dados
<a name="stage-4-data-migration"></a>

Agora que seu ambiente de destino está pronto, você pode implementar a estratégia de migração de dados que escolheu durante a etapa de planejamento.

Esta seção aborda as etapas de implementação dos quatro padrões diferentes:
+ [Criação com base em um snapshot](build-from-snapshot.md)
+ [Criação com base na fonte](build-from-source.md)
+ [Reindexação remota](remote-reindexing.md)
+ [Uso do Logstash](logstash.md)

# 1. Criação com base em um snapshot
<a name="build-from-snapshot"></a>

Ao usar a abordagem de restauração de instantâneos, você copia dados do Elasticsearch ou cluster de origem OpenSearch para o domínio de destino do Amazon Service. OpenSearch 

Em termos gerais, o processo de restauração de snapshots consiste nas seguintes etapas:

1. Obter um snapshot dos dados necessários (índices) do cluster existente e fazer upload do snapshot para um bucket do S3.

1. Crie um domínio do Amazon OpenSearch Service.

1. Dê permissões ao Amazon OpenSearch Service para acessar o bucket e conceda à sua conta de usuário permissões para trabalhar com snapshots. Criar um repositório de snapshots e apontá-lo para o seu bucket.

1. Restaure o snapshot no domínio do Amazon OpenSearch Service.

1. Direcione seus aplicativos clientes para o domínio do Amazon OpenSearch Service.

1. Criar políticas do Index State Management (ISM) para configurar a retenção (opcional).

Os snapshots são incrementais. Portanto, um snapshot pode ser executado e restaurado de forma incremental. Usando snapshots, você pode extrair dados em massa como arquivos em um sistema de armazenamento (por exemplo, o Amazon S3). Em seguida, você pode carregar esses arquivos no ambiente de destino usando a operação da API `_restore`. Isso elimina a necessidade de reindexação, que é demorada, e também reduz o tráfego na rede.

## Considerações sobre snapshots
<a name="snapshot-considerations"></a>

Ao usar a abordagem de restauração de snapshots, considere o seguinte:
+ Você não pode pesquisar ou reindexar enquanto um índice está sendo restaurado. No entanto, você pode pesquisar e reindexar um índice enquanto o snapshot está sendo obtido.
+ O Elasticsearch ou as OpenSearch versões de origem e destino devem ser compatíveis. Um snapshot de um índice que foi criado em:
  + 5.x pode ser restaurado para 6.x
  + 2.x pode ser restaurado para 5.x
  + 1.x pode ser restaurado para 2.x
+ Como essa é uma point-in-time restauração do Elasticsearch ou do OpenSearch snapshot, as alterações subsequentes no cluster de origem não serão replicadas para o domínio de destino do Amazon Service. OpenSearch Você pode interromper a ingestão dos dados no Elasticsearch ou no OpenSearch cluster de origem até que a restauração seja concluída, ou você pode repetir o processo de restauração do snapshot algumas vezes. Como o snapshot é incremental, somente as alterações serão copiadas e restauradas no ambiente de destino em menos tempo do que na primeira restauração. Depois que a restauração for concluída com sucesso, você direciona os aplicativos de ingestão para o domínio do Amazon OpenSearch Service.
+ A captura de um snapshot inclui, por padrão, um snapshot do estado do cluster e de todos os índices. Ao migrar do Elasticsearch, talvez seja necessário criar políticas de ciclo de vida de índice equivalentes no ambiente de destino usando o recurso ISM em. OpenSearch O Elasticsearch Index Lifecycle Management (ILM) não é compatível com o Amazon Service. OpenSearch 
+ Você não pode restaurar um snapshot para uma versão anterior do Elasticsearch ou. OpenSearch Por exemplo, você não pode restaurar um snapshot da versão 7.10 para a 7.9. Da mesma forma, você não pode restaurar snapshots do Elasticsearch 7.11 ou posterior para um domínio do Amazon Service. OpenSearch Se você migrou seu ambiente autogerenciado do Elasticsearch para a versão 7.11 ou posterior, você pode usar o Logstash para carregar dados do cluster Elasticsearch e gravá-los no domínio. OpenSearch
+ Você exporta um snapshot para um local de armazenamento designado chamado repositório. Elasticsearch ou OpenSearch cria vários arquivos no repositório. Você não pode modificar nem excluir esses arquivos. Isso pode criar inconsistências ou fazer com que o processo de restauração falhe.

# 2. Criação com base na fonte
<a name="build-from-source"></a>

Conforme descrito anteriormente, criar a partir da fonte é a abordagem em que você não migra dados do Elasticsearch ou do ambiente atual. OpenSearch Em vez disso, você cria índices no domínio de destino diretamente do seu log, da fonte de dados do catálogo de produtos ou da fonte do conteúdo.

Duas opções estão disponíveis para a criação com base na fonte. A opção escolhida depende do tipo de dados dos seus dados:
+ Usando o AWS Database Migration Service — Se a fonte dos seus dados for um sistema de gerenciamento de banco de dados relacional (RDBMS) e a fonte for suportada pelo AWS Database Migration Service (AWS DMS), você poderá usar o AWS DMS para copiar dados da sua fonte de dados para o domínio de destino do Amazon Service. OpenSearch O AWS DMS é compatível com opções de carga total e captura de dados de alteração (CDC). Na opção de carregamento completo, a tarefa do AWS DMS copia todos os dados da tabela do banco de dados de origem para um OpenSearch índice de destino. Você pode usar o mapeamento padrão ou fornecer configurações de mapeamento personalizadas. Na opção CDC, o AWS DMS primeiro faz uma cópia completa dos registros da tabela de origem em um índice de destino OpenSearch . Em seguida, ele captura os dados alterados (atualizações e inserções) e os copia para o OpenSearch índice. Para obter mais informações, consulte as postagens do blog [Introducing Amazon Elasticsearch Service as a target in AWS Database Migration Service](https://aws.amazon.com/blogs/database/introducing-amazon-elasticsearch-service-as-a-target-in-aws-database-migration-service/) e [Scale Amazon Elasticsearch Service for AWS Database Migration Service migrations](https://aws.amazon.com/blogs/database/scale-amazon-elasticsearch-service-for-aws-database-migration-service-migrations/).
+ Criação com base na fonte do documento: se sua fonte de dados não for um RDBMS ou não for compatível com o AWS DMS, talvez seja necessário criar uma solução personalizada usando ferramentas de código aberto ou uma combinação de ferramentas de código aberto e serviços da AWS. Você deve converter seus dados de origem em documentos JSON antes que eles possam ser carregados OpenSearch. Se você já tem pipelines configurados da sua fonte para o seu Elasticsearch ou OpenSearch ambiente atual, você pode direcionar esses pipelines de dados OpenSearch com as alterações apropriadas nas bibliotecas de clientes e (se necessário) mudanças no modelo de dados nos índices no domínio do Amazon Service. OpenSearch Ao criar índices com base na fonte, leve em conta o seguinte:
  + A localização dos documentos: os documentos já podem estar disponíveis na Nuvem AWS, em armazenamento de objetos, como o Amazon S3, ou podem estar armazenados em um local de armazenamento on-premises, como um sistema de arquivos.
  + O formato dos documentos — Os documentos já podem estar no formato JSON, prontos para serem ingeridos no domínio do Amazon OpenSearch Service, ou talvez precisem ser limpos, processados e formatados em JSON antes de serem ingeridos no domínio do Amazon Service. OpenSearch 

Criar com base na fonte envolve as seguintes etapas de alto nível:

1. Defina o mapeamento e as configurações do índice no domínio do Amazon OpenSearch Service.

1. Extrair dados da fonte do documento e copiá-los em um local de armazenamento de objetos, como o Amazon S3. Você pode usar uma ferramenta de código aberto (por exemplo, o Logstash), um cliente de serviço da AWS (por exemplo, o agente do Amazon Kinesis), uma ferramenta comercial de terceiros ou um programa personalizado.

1. Configure uma ferramenta de código aberto (por exemplo, Logstash ou Fluent Bit) ou um serviço nativo da AWS (por exemplo, AWS Lambda ou AWS DMS) para converter dados em documentos JSON e carregá-los periodicamente ou continuamente do armazenamento de objetos para o domínio do Amazon Service. OpenSearch 

Para obter mais informações, consulte [Carregamento de dados de streaming no Amazon OpenSearch Service](https://docs.aws.amazon.com/opensearch-service/latest/developerguide/integrations.html).

# 3. Reindexação remota
<a name="remote-reindexing"></a>

[Nesse caso, os índices do Elasticsearch ou OpenSearch cluster autogerenciado de origem são migrados para o domínio do OpenSearch Amazon Service usando a operação de API de reindexação de documentos.](https://docs.opensearch.org/latest/api-reference/document-apis/reindex/) Você pode usar a operação da API de reindexação de documentos para criar um índice a partir de um Elasticsearch ou índice existente. OpenSearch O índice existente pode estar no mesmo cluster em que você executa a operação de reindexação, ou pode estar em um cluster remoto. O Amazon OpenSearch Service oferece suporte ao uso da operação de API de reindexação de documentos com clusters remotos. Você pode reindexar de um índice em um Elasticsearch autogerenciado para um índice no Amazon Service. OpenSearch 

A reindexação remota oferece suporte ao Elasticsearch 1.5 e posterior para o cluster remoto do Elasticsearch e ao OpenSearch Amazon Service 6.7 e posterior para o domínio local. Para obter mais informações, consulte a publicação do blog [Migrate data into Amazon ES using remote reindex](https://aws.amazon.com/blogs/big-data/migrate-data-into-amazon-es-using-remote-reindex/). A postagem do blog se refere ao Amazon Elasticsearch, mas a orientação se aplica igualmente aos domínios do Amazon OpenSearch Service.

# 4. Uso do Logstash
<a name="logstash"></a>

O [Logstash](https://www.elastic.co/guide/en/logstash/current/index.html) é uma ferramenta de processamento de dados de código aberto que pode coletar dados da fonte, realizar transformação ou filtragem e enviar dados para um ou mais destinos. Para gravar dados no domínio do Amazon OpenSearch Service, o Logstash fornece os seguintes plug-ins:
+ logstash-input-elasticsearch
+ logstash-input-opensearch
+ logstash-output-opensearch

Para obter mais informações, consulte [Carregamento de dados no Amazon OpenSearch Service com o Logstash](https://docs.aws.amazon.com/opensearch-service/latest/developerguide/managedomains-logstash.html) e a postagem do OpenSearch blog [Apresentando o logstash-input-opensearch plug-in](https://opensearch.org/blog/community/2022/05/introducing-logstash-input-opensearch-plugin-for-opensearch/) para. OpenSearch