View a markdown version of this page

IBM Db2、SAP、Sybase、およびその他のデータベースから の MongoDB Atlas にデータをストリーミングする AWS - AWS 規範ガイダンス

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

IBM Db2、SAP、Sybase、およびその他のデータベースから の MongoDB Atlas にデータをストリーミングする AWS

Battulga Purevragchaa、Igor Alekseev (Amazon Web Services)

Babu Srinivasan (MongoDB)

概要

このパターンでは、IBM Db2 およびその他のデータベース (メインフレームデータベースや Sybase など) から AWS クラウド上の MongoDB Atlas にデータを移行する手順について説明します。AWS Glue を使用して、MongoDB Atlas へのデータ移行を高速化します。

このパターンは、 AWS 「 規範ガイダンス」ウェブサイトの「 での MongoDB Atlas への移行 AWS」ガイドに付属しています。ここでは、そのガイドで説明されている移行シナリオの 1 つの実装手順について説明します。その他の移行シナリオについては、 AWS 「 規範ガイダンス」ウェブサイトの次のパターンを参照してください。

このパターン は、AWS マネージドサービスパートナーと AWS ユーザーを対象としています。

前提条件と制限

前提条件

  • MongoDB Atlas に移行するソースデータベース (SAP、Sybase、IBM Db2 など)。

  • SAP、Sybase、IBM Db2、MongoDB Atlas、 などのデータベースに精通していること AWS のサービス。

製品バージョン

  • MongoDB バージョン 5.0 以降

アーキテクチャ

次の図は、、Amazon Kinesis Data Streams AWS Glue Studio、および MongoDB Atlas を使用したバッチデータのロードとデータストリーミングを示しています。

このリファレンスアーキテクチャでは AWS Glue Studio 、 を使用して抽出、変換、ロード (ETL) パイプラインを作成し、データを MongoDB Atlas に移行します。は MongoDB Atlas と AWS Glue クローラー 統合され、データガバナンスを容易にします。データは、Amazon Kinesis Data Streams を使用して MongoDB Atlas にバッチで移植するか、ストリーミングすることができます。

一括データロード

バッチモードでの MongoDB Atlas へのデータ移行。

バッチデータ移行の詳細については、 AWS ブログ記事「Compose your ETL jobs for MongoDB Atlas with AWS Glue」を参照してください。

データストリーミング

データストリーミングモードでの MongoDB Atlas へのデータ移行。

さまざまな使用シナリオをサポートする MongoDB Atlas リファレンスアーキテクチャについては、 AWS 「 規範ガイダンス」ウェブサイトの「 での MongoDB Atlas への移行 AWS」を参照してください。

ツール

●      AWS Glue はフルマネージド型の ETL サービスです。これにより、データストアとデータストリーム間でのデータの分類、整理、強化、移動を確実に行うことができます。

●      Amazon Kinesis Data Streams は、データレコードの大量のストリームをリアルタイムで収集し、処理するのに役立ちます。

●      MongoDB Atlas は、MongoDB データベースをクラウドにデプロイおよび管理するためのフルマネージド型 Database as a Service (DbaaS) です。

ベストプラクティス

ガイドラインについては、MongoDB GitHub リポジトリにある「MongoDB のベストプラクティスガイド」を参照してください。

エピック

タスク説明必要なスキル

クラスターサイズを決定します。

db.stats() からの合計インデックススペースに関する情報を使用してワーキングセットのサイズを見積もります。データスペースの一部が頻繁にアクセスされると仮定します。または、独自の仮定に基づいてメモリ要件を見積もることもできます。このタスクには約 1 週間かかりそうです。この記事とこのエピックの他のストーリーの詳細と例については、「関連リソース」セクションのリンクを参照してください。

MongoDB DBA、アプリケーションアーキテクト

ネットワーク帯域幅要件を見積もります。

ネットワーク帯域幅要件を見積もるには、平均ドキュメントサイズに 1 秒あたりに提供されるドキュメント数を掛けます。基準として、クラスター上のノードが負担する最大トラフィックを考慮に入れます。クラスターからクライアントアプリケーションへのダウンストリームのデータ転送速度を計算するには、一定期間に返されたドキュメントの合計を使用します。アプリケーションがセカンダリノードから読み取る場合は、このドキュメントの合計数を、読み取り操作を実行できるノード数で割ります。データベースの平均ドキュメントサイズを求めるには、db.stats().avgObjSize コマンドを使用してください。このタスクには通常 1 日かかります。

MongoDB DBA

Atlas 層を選択します。

MongoDB ドキュメントの指示に従い、正しい Atlas クラスター階層を選択してください。 

MongoDB DBA

カットオーバーを計画します。

アプリケーションのカットオーバーを計画します。

MongoDB DBA、アプリケーションアーキテクト
タスク説明必要なスキル

で新しい MongoDB Atlas クラスターを作成します AWS。

MongoDB Atlas で、クラスターの構築を選択し、クラウドプロバイダー AWS として を選択します。

MongoDB DBA

AWS リージョン および グローバルクラスター設定を選択します。

Atlas クラスター AWS リージョン で使用できる のリストから を選択します。必要に応じてグローバルクラスタを設定します。

MongoDB DBA

クラスター階層を選択します。

お好みのクラスター階層を選択します。階層の選択によって、メモリ、ストレージ、IOPS の仕様などの要素が決まります。

MongoDB DBA

追加のクラスター設定を構成します。

MongoDB のバージョン、バックアップ、暗号化オプションなどのクラスター設定を追加して行います。これらのオプションの詳細については、「関連リソース」セクションを参照してください。

MongoDB DBA
タスク説明必要なスキル

アクセスリストを設定します。

Atlas クラスターに接続するには、プロジェクトのアクセスリストにエントリを追加する必要があります。Atlasは、Transport Layer Security (TLS) / Secure Sockets Layer (SSL) を使用して、データベースの仮想プライベートクラウド (VPC) への接続を暗号化します。プロジェクトのアクセスリストの設定やこのエピックのストーリーの詳細については、「関連リソース」セクションのリンクを参照してください。 

MongoDB DBA

ユーザーの認証と認可を行います。

MongoDB Atlas クラスターにアクセスするデータベースユーザーを作成して認証する必要があります。プロジェクト内のクラスターにアクセスするには、ユーザーはそのプロジェクトに属し、複数のプロジェクトに属している必要があります。 AWS Identity and Access Management (IAM) で認可を有効にすることもできます。詳細については、MongoDB のドキュメントの「IAM による認証を設定する」を参照してください。

MongoDB DBA

カスタムロールを作成します。

(オプション) Atlas では、組み込みの Atlas データベースユーザー権限で必要な権限セットがカバーできない場合にカスタムロールを作成できます。

MongoDB DBA

VPC ピアリングを設定します。

(オプション) Atlas では、他の AWS VPC との VPC ピアリングがサポートされます。

MongoDB DBA

AWS PrivateLink エンドポイントをセットアップします。

(オプション) を使用して AWS でプライベートエンドポイントを設定できますAWS PrivateLink

MongoDB DBA

2 要素認証を有効にします。

(オプション) Atlasは、ユーザーがAtlasアカウントへのアクセスを制御できるようにする 2 要素認証 (2FA) をサポートしています。

MongoDB DBA

LDAP によるユーザー認証と認可を設定します。

(オプション) Atlasは、Lightweight Directory Access Protocol (LDAP) によるユーザー認証および認可の実行をサポートします。

MongoDB DBA

統合 AWS アクセスを設定します。

(オプション) Atlas データレイクや顧客キー管理による静的暗号化などを含む一部の Atlas 機能では、認証に IAM ロールを使用します。

MongoDB DBA

を使用して保管時の暗号化を設定します AWS KMS。

(オプション) Atlas は、 AWS Key Management Service (AWS KMS) を使用してストレージエンジンとクラウドプロバイダーのバックアップを暗号化することをサポートしています。

MongoDB DBA

CSFLE を設定します。

(オプション) Atlas では、フィールドの自動暗号化を含む、クライアント側のフィールドレベルの暗号化 (CSFLE) がサポートされます。 

MongoDB DBA
タスク説明必要なスキル

MongoDB Atlas でターゲットのレプリカセットを起動します。

MongoDB Atlas でターゲットのレプリカセットを起動します。Atlas ライブマイグレーションサービスで、「移行する準備ができました」を選択します。

MongoDB DBA

AWS Glue と MongoDB Atlas の接続を確立します。

AWS Glue クローラー を使用して MongoDB Atlas (ターゲットデータベース) AWS Glue に接続します。このステップにより、ターゲット環境の移行準備ができます。詳細については、AWS Glue のドキュメントを参照してください。

MongoDB DBA

ソースデータベースまたはソースストリーム AWS Glue との の接続を確立します。

これにより、ターゲット環境の移行準備ができます。

MongoDB DBA

データ変換を設定します。

従来の構造化スキーマから MongoDB の柔軟なスキーマにデータを移行するための変換ロジックを設定します。

MongoDB DBA

データを移行します。

AWS Glue Studioで移行をスケジュールします。

MongoDB DBA
タスク説明必要なスキル

クラスターに接続します。

MongoDB Atlas クラスターに接続します。

アプリ開発者

データを操作します。

クラスターデータと対話します。

アプリ開発者

クラスターをモニタリングします。

MongoDB Atlas クラスターをモニタリングします。

MongoDB DBA

データをバックアップおよび復元します。

クラスターデータをバックアップし、復元します。

MongoDB DBA

トラブルシューティング

問題ソリューション

問題が発生した場合

MongoDB Atlas CloudFormation Resources リポジトリの「トラブルシューティング」を参照してください。

関連リソース

特に明記されていない限り、以下のリンクはすべて MongoDB ドキュメントのウェブページに移動します。

移行ガイド

発見と評価

セキュリティとコンプライアンスの設定

AWS 上に新しい MongoDB Atlas 環境を設定する

データを移行する

クラスターのモニタリング

オペレーションの統合

GitHub リポジトリ