CData Software Japanは2025年1月9日、データ同期/統合ツール新版「CData Sync V24.3」を発表した。新版では、Oracle DatabaseとPostgreSQLからリアルタイムにデータを取得可能にした。また、リバースETL機能でDynamics 365に書き戻せるようにした。
CData Software Japanの「CData Sync(シーデータ シンク)」は、SalesforceやServiceNowなどのSaaSのデータを、データベースサーバーやクラウド型データウェアハウス(DWH)にノーコードでレプリケーション(複製)が可能なデータ同期/統合ツールである。400種類超のデータソースを30種類のデータベースに同期することができる(関連記事:データ同期ツール新版「CData Sync V24.2」、PostgreSQLからSalesforceにデータを書き戻し)。
新版のV24.3では、Oracle DatabaseとPostgreSQLからリアルタイムにデータを取得可能にした。具体的には、データソース側の変更履歴やトランザクションログを常時監視し、変更が発生すると同時に変更データを収集する。これまでもデータソースとの差分を抽出するCDC(Change Data Capture:変更データキャプチャ)機能があったが、バッチ処理で使うしかなかった。これを差分データをリアルタイムに収集可能にしている。
なお、データソースからCData Syncへのデータの取得はリアルタイムに行いつつも、レプリケーション先への反映を任意のタイミングで行うことも可能である。また、以前のCDC機能と比較して、データソースとなるデータベースサーバーへの負荷を軽減しているため、基幹システムなどの連携に、より適用しやすくなったという。今後のアップデートではIBM Db2でCDC機能を利用できるようにする予定である。
また、新版では、データベースサーバー/DWHからSaaSにデータを書き戻す「リバースETL」機能を拡充している。リバースETLとは、処理後のデータをDWHに送る通常のETL(抽出/変換/ロード)とは逆に、DWHで分析した結果を再びSaaSに同期する仕組みを指す(図1)。
まず、これまでリバースETLに対応していたSaaSはSalesforceのみだったが、Dynamics 365にデータを書き戻せるようになった。なお、今後のアップデートではkintoneにも書き戻せるようにする予定である。もう1つは、リバースETLのデータ元となるDWHとして、既存のSnowflake、Microsoft SQL Server、PostgreSQLに、Google BigQueryとAmazon Redshiftが加わった。
拡大画像表示
新版では、既存コネクタの改修・改良が施されている。例えば、JSON型のデータをSnowflakeのVariant型としてレプリケーションできるようになった。「JSON型のデータはスキーマを指定せずに格納でき、現場で生じる種々の変更に柔軟に対応できる利点がある。Snowflakeではまた、大規模データを同期させる性能を高めている。100万件規模のデータの同期速度が200%向上していることを確認した」(同社)としている。
このほか、BigQueryへのレプリケーションの際、マルチバイト文字を含んだカラム名を変換・変更なしで同期できるようになった。これまでは、kintoneなどのようにデフォルトで日本語名カラムを含んだアプリケーションからBigQueryにレプリケーションする際は、対象のカラム名を1つずつ変換する必要があった。新版ではこの変換が不要になる。