データ分析用、あるいは、災害復旧対策用にデータレプリケーションの仕組みを構築したいと考えている方へ。データリプリケーションツールの機能やツールを選ぶ際の比較ポイント、おすすめのサービスなどを紹介します。
データレプリケーションツールとは、データベースやファイルシステムなど、複数のデータソースから自動的にデータを複製して別の場所に保存し、複数の場所やシステム間でデータを同期させるソフトウェアツールです。
データレプリケーションツールは、データの可用性(システムが継続して稼働できる能力のこと)、信頼性、パフォーマンスの向上に役立ち、以下のような目的で使われます。
分析用の環境構築 | 複数の基幹システムや各種業務SaaSから、データをコピーして分析用の環境を用意する など |
---|---|
パフォーマンスの改善 | 複数箇所にデータを保存することでシステムの負荷を分散し、通信の遅延を削減できる など |
障害・災害対策 | 一方に問題が発生しても、もう一方の待機系データベースに切り替えて運用を継続できるようにする など |
安全なデータベース移行 | 新たなデータベースへの移行 など |
レプリケーションとバックアップで何が違うのでしょうか。どちらもデータを複製することで損失を防ぐための手段ですが、目的が異なります。それぞれの導入目的について解説します。
レプリケーションの目的は、システムやデータベースを複数の場所に同期させ、リアルタイムでデータを複製することです。データの損失を即座に復旧でき、障害やデータ損失時にもデータへのアクセスが継続されます。また、複製されたデータは常に最新の状態に保たれているため、データの可用性が高いのも特徴です。
加えて、元のデータを処理するために複製したデータを使用することもできます。そのため、レプリケーションは、負荷分散やホットスタンバイ(メインシステムが壊れたらすぐに動かせる予備システムを用意しておくこと)の手段として有効です。しかし、レプリケーションでは、データの損失を完全に防ぐことはできません。
バックアップは定期的にデータを別の場所にコピーすることです。主に障害やデータ損失時の復元目的で使用され、特定の時間点までのデータを保護します。データの損失を完全に防ぐことができる一方で、複製データは常に最新の状態に保たれていないため、データの可用性が低くなります。
データレプリケーションツールの主な機能には、次のようなものがあります。
データベースやファイルシステムから、ほかの場所にあるターゲットのデータベースやファイルシステムにデータを複製。データのレプリカ(複製品)が複数の場所に保存されるようになります。
データソース(元のデータ)と、ターゲット(複製データの保存先)の同期を維持します。データソースに加えられた変更内容は、自動でターゲットにも反映されます。
システムの障害やメンテナンス時に、データのレプリケーションシステムやアプリケーションを別の環境に移行するプロセス(フェイルオーバー・フェイルバック)をサポートすることで、損失や破損からデータを保護します。
フェイルオーバーとは、主となるシステムやサーバーが障害や問題によって利用できなくなった場合に、代替のシステムやサーバーに切り替えること。そしてフェイルバックは、フェイルオーバー後に障害が解消されたら元の環境に戻すことを指します。
データベースの読み取りを分散することで、データベースのパフォーマンスを向上できます。加えて、地理的に複数の場所にデータを分散させる「マルチサイト展開」を採用すれば、ユーザーに近いデータセンターからデータを転送できるため、パフォーマンス向上につながります。
データベースの複数のインスタンス(データベース・ファイルを管理する一連のメモリー構造)を作成し、それらを異なる場所に配置することで、データベースの可用性が向上します。
データレプリケーションツールは大きく3タイプに分けられます。
このタイプは、様々なデータソース、アプリケーション間のデータ統合をサポートします。そのため、データ分析用にデータベースやデータウェアハウスなどをレプリケーションしたい場合に最適です。
リレーショナルデータベース管理システム(RDBMS)や、データウェアハウス、ファイルシステム、クラウドサービスなど、様々なデータストレージシステムを統合できるサービスも多いため、異なるプラットフォームや環境で、データを統合・同期できるようになります。
更に、SAPなどの基幹システム、各種業務システム、データ分析用のデータウェアハウスからデータをレプリケーション・統合して、データを分析することも可能に。
SaaSやクラウドベースのアプリケーションなどのデータ統合を効率的に行いたい場合に最適なタイプ。 SaaSのデータ統合を自動化することで、手間をかけずにデータ統合を実現できます。
たとえば、「CData Sync」はコネクターを使って、250以上のSaaSやデータ形式などとノーコードで連携が可能。また、同様に「Fivetran」も200以上のSaaSのコネクターに対応しています。
DR対策(Disaster Recovery:災害復旧)として高い可用性を実現したい場合には、こちらのタイプがおすすめ。データの複製先に遠隔地のデータセンターを選択する、データの複製を自動化するといった機能により、データの耐障害性と高い復旧能力を備えているのが特徴です。
たとえば、「Arcserve Replication and High Availability」のように、切り替えや復旧後の切り戻しを自動化できるサービスも提供されています。
まずレプリケーション元(移行元)のデータベースの対応範囲を確認することが重要です。なぜなら、1つのデータレプリケーションツールがすべてのデータベースやデータ形式に対応しているわけではないからです。
たとえば、異なるデータベース管理システム(RDBMS)やデータストレージシステムに対して、どれだけ広範な対応があるかを確認します。また、Oracle、MySQL、Microsoft SQL Server、PostgreSQLなど、様々なデータベースタイプに対応しているかどうかもチェックしておきましょう。加えて、移行元のデータベースのバージョンによってはツールが対応していない場合もあるため、注意が必要です。
移行元のデータベースの対応範囲が広いツールは、異なるデータベースタイプに対して柔軟な対応が可能です。たとえば、「FCReplicator」はOracle、SQL Server、PostgreSQLなど異なるプラットフォーム間でもシームレスな連携を実現します。
一方で、「SharePlex」のように「Oracle DB」や「PostgresSQL」に対応範囲が限られるサービスもあります。データベースを使用している環境や、将来的なデータベースの切り替えも考慮に入れてサービスを選択してください。
データレプリケーションの実現方式には、リアルタイムでデータの複製を行う「同期型レプリケーション」と、定期的にデータの複製を行う「非同期型レプリケーション」の2種類があります。
「同期型レプリケーション」は、データの可用性向上に役立ちます。たとえば、ECサイトでの販売や在庫管理などデータの即時性が要求されるシステムでは、遅延時間が少なく、高いパフォーマンスで変更を同期できるという点で、「同期型レプリケーション」が適しています。
一方で、「非同期型レプリケーション」は、データのコストパフォーマンス向上に役立ちます。たとえば、「FCReplicator」は、レプリカサーバーがマスターサーバーのジョブキュー表を定期的に確認して、更新があれば処理する非同期型レプリケーションの仕組みを採用しています。
採用する実現方式によっては、ターゲットサーバーに処理負荷が発生することもあります。そのため、データの整合性やパフォーマンス、可用性の要件に応じて、どの方式が最適かを見極めることが重要です。また、同一データセンター内や異なる地理的領域間でのレプリケーションがサポートされているかどうかも確認しておきましょう。
リアルタイムでデータの同期や反映を行いたい場合、ツールがどれだけ即時かつ効率的に変更を転送・同期できるかを確認しましょう。具体的には、同期の頻度や遅延時間、トランザクション処理のサポートなど、リアルタイム性を実現するための機能がチェックポイントです。
たとえば、「SharePlex」は移動中のデータの正確性を確保しながら、データのレプリケーションと統合をほぼリアルタイムで行うことが可能。また、「Veeam Backup & Replication™」はサイズや接続速度にかかわらず、実行されるジョブに応じた「可変圧縮機能」を搭載。「変更ブロック追跡(Change Block Tracking)」を使って、前回のジョブセッション以降に変更されたブロックのリストを取得することで、レプリケーションの効率を高めています。
幅広いデータ統合に対応しているデータレプリケーションツールをご紹介します。
※料金はすべて要問い合わせ
(出所:SharePlex公式Webサイト)
プラットフォーム間の高可用性、拡張性、および相互運用性のためのデータベース・レプリケーション・ソフトウェア。低コストで優れたデータレプリケーションを提供する。インストールが簡単で使いやすい包括的な管理ツールを用いることで、クラウドからオンプレミスまで様々なプラットフォームに対応可能。ダウンタイムやデータロスといった業務に支障のあるトラブルを起こさずに、データベースの移行やアップロードができるという強みも。
また、レポート作成機能を搭載し、分析プロジェクトやビックデータプロジェクトもサポート。データをレプリケートできるターゲットの数に制限はなく、拡張性も高いので幅広くビジネスニーズに対応できる。
(出所:FCReplicator公式Webサイト)
遠隔地への高速バックアップシステムや、マルチサイト・マルチマスタといった高度なシステム連携を実現する、データベースレプリケーションの定番ソフトウェア。Windows OSのコンピューターから専用の管理ツールを使って、WindowsだけでなくLinuxやUNIX上のデータベースにも高度なレプリケーションシステムを構築できる。GUIツールなので、誰でも簡単に設定可能だ。
同一プラットフォーム間だけでなく、Oracle、SQL Server、PostgreSQLなどの異なるプラットフォーム間でも、シームレスな連携を実現。そのほかにも、マルチマスタやマルチサイトに対応している。国産のサービスなので、日本語によるサポートを重視したい場合にも最適だ。
(出所:Qlik Replicate公式Webサイト)
マルチデータベース間のリアルタイムデータ統合プラットフォーム。異種データベースだけでなく、メインフレームやSAP、Salesforceなどのデータを分析基盤などへリアルタイムに連携する。
ソースデータベースからターゲットデータベースへデータをコピーするのではなく、変更データログを読み込む独自技術を利用して、差分のみをレプリケートするため、限りなくリアルタイムに近いデータ連携を実現する。ソース、ターゲット共にデータベースを停止する必要がない。また、ソースとなるデータベースやターゲットに指定するデータベースは、クラウドかオンプレミスのどちらかだけでなくハイブリッド環境にも対応。主要なデータベースを網羅している。
SaaSのデータ統合に強みを持つ、データレプリケーションツールをご紹介します。
(出所:CData Sync公式Webサイト)
400種類以上のSaaS、DB、アプリケーションに対応したデータ統合基盤。データの同期先として、SQL ServerやOracleなど各種RDB、BigQuery、Snowflake、RedshiftなどのクラウドDWH を利用できる。セキュアなレプリケーションで、データを安全にDBやDWHに移動する。
プラットフォームの提供形態はAMI提供のほか、オンプレミスとクラウドの両方に対応している。少ない設定ステップで簡単に、データをレプリケーションできる点も便利。また、kintone、Salesforce、HubSpot を含む人気の業務SaaSのデータを、ノーコードで単一のDBやDWHに集約できる。
(出所:Fivetran公式Webサイト)
データエンジニアリングの複雑な作業を自動化することで、企業がデータからより多くの価値を引き出すのを支援するデータレプリケーションツール。数百のデータソースを数分で統合し、データウェアハウスやデータレイクなどのターゲットに複製できる。
また、Salesforce、Oracle、SAP、Microsoft Dynamicsといった様々なソースから、データを抽出してロードできる点も強み。加えて、データの抽出・変換・ロードを自動化することで、データアナリストやデータサイエンティストがデータを分析する際にも役立てられる。使いやすいインターフェイスや、24 時間365日のサポート対応といった魅力も。
災害対策に強みを持つ、データレプリケーションツールをご紹介します。
※料金はすべて要問い合わせ
(出所:Arcserve Replication and High Availability公式Webサイト)
既存の環境のまま手軽に、システムやデータの可用性を向上するデータリプリケーションツール。オンプレミス・リモート・クラウドのいずれの環境においても、WindowsやLinux上で稼働するアプリケーションとデータを継続的に保護できるため、システムトラブル時のダウンタイム発生を防止する。一度同期されたデータは、複製元から複製先に継続的に複製され、常に整合性が確保される。
また、システムクラッシュ、データ破損、ランサムウェアなどが発生する直前にアプリケーションをロールバック。復旧時間やデータの損失を心配することなく、システムの可用性向上を期待できるという強みも持つ。
(出所:Veeam Backup & Replication™公式Webサイト)
オンプレミス、クラウド問わず、あらゆるデータを包括的に保護できるデータレプリケーションサービス。バックアップデータから直接仮想マシンを起動させる「インスタントリカバリ」という独自機能によって、ダウンタイムの発生を防げるため災害対策に強い。
また、自動バックアップとレプリカテストにより、どのような災害が発生しても確実にデータを復元。加えて、クラウド、仮想、物理、NASの環境全体にわたる包括的なバックアップを自動化し、広範な保護を可能にしている。オプションでレプリケーションベースのディザスタリカバリサービス(DRaaS)を提供。
(出所:LifeKeeper / DataKeeper公式Webサイト)
リスクマネジメントに特化したHAクラスターソフトウェアがLifeKeeper。レプリケーションツールであるDataKeeperと連携することで、スムーズな待機系への切り替えを実現できる。システムの障害を監視し、稼働系での障害発生時に自動的に切り替えを行うことで、システムダウンタイムを短縮。ビジネス損失を最小限に抑える。
直感的かつ視認性の高い専用ツールを用いることで、スクリプト操作などの専門知識がなくても簡単にシステムを運用可能。システムの可用性向上のための設計・実装・試験にかかる工数の大幅削減も期待できる。
1992年の誕生以来、グローバルで80,000ライセンスという豊富な導入実績を持つ。
(出所:Oracle GoldenGate公式Webサイト)
RDBMSの開発・販売において世界的なリーディング・カンパニーであるOracleが手掛ける、データレプリケーションツール。リアルタイムなデータ統合を実現し、システムの可用性を向上するための運用および分析基盤を提供する。
非OracleのDB(Microsoft SQL Server、IBM DB2、MySQL、PostgreSQL、HDFS、Kafka、Sparkなど)とOracle DBを接続するデータレプリケーションにも対応。ビック・データとの統合やマルチクラウド・サポートなど、業界最大手の企業だからこそ実現可能なサービスが充実している。24時間年中無休のサポートなので、災害対策時にも利用可能な点も評価されている。
災害時対応やシステムトラブルといったリスクマネジメントだけでなく、リアルタイム同期や様々なデータソース間の連携にも役立つデータレプリケーションツールについてご紹介しました。以下、要点(よくある質問)をまとめておきましたので、参考にしてください。
データレプリケーションツールとは、データベースやファイルシステムなど、複数のデータソースから自動的にデータを複製して別の場所に保存し、複数の場所やシステム間で同期させるソフトウェアツールです。データの可用性や信頼性、パフォーマンスの向上に有効で、「分析用の環境構築」「パフォーマンスの改善」「障害・災害対策」「安全なデータベース移行」といった目的で利用されています。
レプリケーションの目的は、システムやデータベースを複数の場所に同期させ、リアルタイムでデータを複製すること。複製されたデータは常に最新の状態に保たれているため、データの可用性の高さに強みを持ちます。
一方、バックアップは定期的にデータを別の場所にコピーすることです。データの損失を完全に防ぐことができますが、常に最新の状態に保たれている訳ではないので、データの可用性が低くなります。
<重要なお知らせ> サイトリニューアルに伴い、初回ログインにはパスワードの再設定が必要です。
アスピックご利用のメールアドレスを入力ください。
パスワード再発行手続きのメールをお送りします。
パスワード再設定依頼の自動メールを送信しました。
メール文のURLより、パスワード再登録のお手続きをお願いします。
ご入力いただいたメールアドレスに誤りがあった場合がございます。
お手数おかけしますが、再度ご入力をお試しください。
ご登録いただいているメールアドレスにダウンロードURLをお送りしています。ご確認ください。
サービスの導入検討状況を教えて下さい。
本資料に含まれる企業(社)よりご案内を差し上げる場合があります。