はじめに

Version 22.0.8300


はじめに


データはすべてのビジネス上の意思決定において重要である、というデータ駆動型の企業文化がますます醸成されてきています。その結果、企業はしっかりとしたデータ管理戦略を策定する必要があります。あらゆる同期先にデータを簡単かつ効率的に移動できるユニバーサルデータパイプラインであるCData Sync なくして、この戦略は完成しません。Sync は、ブラウザを介して利用できる管理インターフェースを備えたWeb アプリケーションです。

アーキテクチャ

CData Sync のパワーで、200以上のサポートされたリレーショナルデータベース(SQL Server、Oracle、PostgreSQL、etc.)、クラウドデータウェアハウス(Amazon Redshift、Snowflake、Google Big Query、etc.)、その他のビッグデータシステム(Amazon S3、Azure Data Lake、Kafka、etc.)へのデータ移動が可能になります。

Sync では、Sync の管理コンソールを使用して、スケジュールおよびモニタ可能なデータフロージョブを構成することができます。シンプルなデータフロージョブを作成したり、変換、関数、フィルタリングなどを組み込んでデータを同期先に移動する前に修正したりすることが可能です。

サポートされている200 以上のデータソースの多くは差分更新を提供します。差分更新とは、スケジュールされた各ジョブ実行が、前回の実行以降のソースの変更を検出し、その変更内容のみで同期先を更新するプロセスです。データセットのすべてを毎回複製することは法外なコストがかかる場合がありますが、この機能により、大規模なデータセットを同期できるようになります。差分更新をサポートするデータソースは、アプリケーションに明記されています。

本ドキュメントでは、CData Sync の主要な機能とコアとなる概念について説明します。また、3ステップで簡単に始められるクイックスタートのセクションも用意されています。

主要機能

  • 主要データウェアハウスへのレプリケート:Sync は、SQL Server、PostgreSQL、Snowflake、Amazon など人気のデータベースをサポートします。

  • 差分更新:Sync は、チェンジセットのみを取得して通信量を抑え、スピーディな同期を実現します。

  • ポイント&クリックによる設定:同期管理はシンプルで、ジョブスケジューリングやデータ変換が簡単に行えます。

  • ログとトランザクションモニタリング:Sync では、データベースやデータソースに加えられた変更をモニタできます。

  • エンタープライズクラスのセキュリティ機能を標準装備:Sync は、TLS(Transport Layer Security)プロトコルまたはSSL(Secure Sockets Layer)プロトコルのいずれかを、サポートされているプロトコルに応じて使用することで、暗号化されたクライアント / サーバー間の通信を提供します。

  • REST API とイベント:REST API とイベントにより外部アプリケーションとの統合を実現します。

  • オンプレミスまたはクラウドでのホスト:Sync は、軽量のASP.NET Web アプリケーションとJava Web アプリケーションとして利用できます。どちらのバージョンもスタンドアロンの組み込みサーバーがパッケージ化されているため、お好みのプラットフォームで簡単にホストできます。Sync はまた、Amazon Web Services (AWS) Marketplace からも利用できます。

コアとなる概念

  • 接続:接続は、データソースまたは同期先へのリンクです。データパイプラインを作成するには、まずデータソースおよび同期先の接続を設定する必要があります。Sync には、データ転送を容易にする厳選された人気のデータソースと同期先のリストがプリインストールされています。加えて、CData Web サイト からさらに多くのコネクタをダウンロードできます。接続の作成についての詳細は、接続を作成 を参照してください。コネクタタイプの詳細は、ソース および同期先 を参照してください。

  • コネクタ:コネクタは、特定の接続タイプです。例えば、Salesforce コネクタを使用して、異なるSalesforce アカウントに複数の接続を作成することができます。

  • ジョブ:Sync のジョブは、ソース接続、同期先接続、およびさまざまなテーブルのデータフローを表す一連のタスクを含む実行単位です。ジョブ内のすべてのタスクは順次実行され、必要に応じてデータフローを順序付けることができます。管理コンソールのジョブページには、Sync アプリケーションで設定された各ジョブのリストがあります。この画面で、アプリケーションに新しいジョブを追加しつつ、既存のジョブを簡単に管理およびモニタできます。詳しくは、ジョブ を参照してください。

  • タスク:タスク は、アクティビティを実行するためのプログラミングの基本単位です。Sync では、タスクはソースから同期先テーブルへのデータフローを制御します。詳しくは、タスク を参照してください。

クイックスタート

3つの簡単な手順でSync を開始できます。

  1. サーバーを起動

  2. 接続を作成

  3. ジョブを設定

お問い合わせ

ご質問ご意見がございましたら、こちら までご連絡ください。