グーグル・クラウド・ジャパンは2021年6月2日、説明会を開き、米Google Cloudが同年5月26日に発表したデータ分析のための3つの新サービスについて説明した。分散しているデータを統合して分析する「Dataplex」、データベースをリアルタイムにレプリケーションする「Datastream」、BigQueryの新機能でデータだけでなくデータの分析手法を共有する「Analytics Hub」である。
「Dataplex」は、分散しているデータを統合して分析するサービスである(図1)。例えば、顧客を知るために、データベースに格納したCRM(顧客関係管理)のデータと、データレイクに保存したアクセスログを組み合わせて使いたいケースがある。こうした場面で役立つ。
拡大画像表示
Dataplexを使うと、データ分析者は、DWH(データウェアハウス)やデータレイク、個々のデータベースなど、データがどこにあるかを意識することなく分析できるようになる。また、データ管理者の視点では、データがどこから来たのかや、だれがアクセスできるのかなどを管理できる。
「Datastream」は、データベースをリアルタイムにレプリケーションするCDC(変更データキャプチャ)サービスである(図2)。サーバーレス型で動作する。データベース上で生じた変更を継続的に読み出し、これを他のデータベースやストレージなどに即時レプリケーションできる。
拡大画像表示
例えば、ECサイトの在庫をリアルタイムに分析するといった、リアルタイムにデータベースを複製したい各種のニーズに応える。参照専用のデータベースをオフロード分離し、商品購入などの更新系のトランザクションを維持するようなケースにも利用できる。
「Analytics Hub」は、グーグルのDWH「BigQuery」に追加した新機能で、データの共有だけでなくデータ分析の手法も共有することができる(図3)。主に、データ分析手法を共有していない社外とのデータ共有に役立つ。「BIツールのLookerを使って、このように可視化する」「このテンプレートを、こう使う」といった、データの分析方法を共有できる。
拡大画像表示
社外とデータを共有する場合、共有したデータの使い方が分からないケースがある。一方で、社内でのデータ共有は、ユースケースや分析方法を最初から共有できているため、データの共有と活用がうまくいく。Analytics Hubによって、データの分析方法を共有できていない社外ユーザーとの間でも分析手法を容易に共有できるようになる。