パフォーマンス

Version 22.0.8483


パフォーマンス


ビジネスチームがタイムリーにデータにアクセスできるようにするには、パフォーマンスが重要です。API レスポンスが遅い可能性のあるソースから大量のデータを移動する場合、Sync は次のセクションで説明する機能を使用して、データの整合性を向上させ、ジョブのパフォーマンスを最大化します。

最高レベルのコネクタ

アナリティクスとコグニティブコンピューティングによる需要増加のため、アプリケーションはかつては考えられなかったような大量のデータセットを取得、処理しなければなりません。Sync の業界最高レベルのコネクタは他のSaaS(software-as-a-service)、NoSQL、およびビッグデータ連携ソリューションの2倍以上高速に、この課題に対応します。Sync は、ビッグデータ時代に最高の効率で運用するために必要なスピードと信頼性を提供します。

バッチ挿入処理

Sync は複数行の挿入にバッチ挿入処理を使用します。Sync は1行ずつ挿入せずに、1つのステートメントで同時に複数行をデータベースに挿入します。この方法により、ネットワークを効率化してジョブの処理スピードを向上します。

MERGE アクション

データをソースから同期先に移動する際、Sync はMERGE アクションを使用して、データを同期先テーブルに統合する前に、まずテンポラリテーブルにデータを挿入します。

テンポラリテーブルを使用することで、アプリケーションのデータ移動の効率が大幅に向上します。行ごとに対象テーブルを読み込む必要があるアップサート処理とは異なり、MERGE アクションは1つのトランザクション内で実行されます。つまり、本プロセスはターゲットを1回読み込み、どの行を更新し、どの行を挿入すべきかを決定します。

このプロセスにより、パフォーマンスが向上し、ジョブ実行中にSync がプロダクションテーブルをロックすることを防ぎます。エラーが発生した場合、Sync はプロダクションテーブルを破損する可能性があるのではなく、単純にテンポラリテーブルを削除できます。

並列処理

Sync ジョブが並列処理を使用するように設定できます。これは、アプリケーションが1つのジョブを処理するために複数のワーカースレッドを使用することを意味します。並列処理により、Sync はワークロードを複数のプロセスに分割し、複数のテーブルを同時に移動できるようにします。その結果、より少ない時間でより多くのデータが移動され、ジョブ効率が大幅に向上します。Sync では、ジョブ単位で必要な数のワーカーを割り当てることができます。

複数の並行リーダー

ソース接続が許可する場合には、Sync はソースAPI からデータを読み込むために複数の並行リーダーを作成します。複数のリーダーを使用することで、Sync は同じテーブルから同時にデータを読み込むことができ、データパイプラインを介してデータを移動する際のパフォーマンスがさらに向上します。

お問い合わせ

ご質問ご意見がございましたら、こちら までご連絡ください。