グーグル・クラウド・ジャパンは2021年6月2日、説明会を開き、米Google Cloudが同年5月26日に発表したデータ分析のための3つの新サービスについて説明した。分散しているデータを統合して分析する「Dataplex」、データベースをリアルタイムにレプリケーションする「Datastream」、BigQueryの新機能でデータだけでなくデータの分析手法を共有する「Analytics Hub」である。
「Dataplex」は、分散しているデータを統合して分析するサービスである(図1)。例えば、顧客を知るために、データベースに格納したCRM(顧客関係管理)のデータと、データレイクに保存したアクセスログを組み合わせて使いたいケースがある。こうした場面で役立つ。
![図1:分散しているデータを統合して分析できる(出典:グーグル・クラウド・ジャパン)](/mwimgs/2/3/600/img_230f526777e4c58c843bcc9fdbbdff6360172.jpg)
拡大画像表示
Dataplexを使うと、データ分析者は、DWH(データウェアハウス)やデータレイク、個々のデータベースなど、データがどこにあるかを意識することなく分析できるようになる。また、データ管理者の視点では、データがどこから来たのかや、だれがアクセスできるのかなどを管理できる。
「Datastream」は、データベースをリアルタイムにレプリケーションするCDC(変更データキャプチャ)サービスである(図2)。サーバーレス型で動作する。データベース上で生じた変更を継続的に読み出し、これを他のデータベースやストレージなどに即時レプリケーションできる。
![図2:データベースをリアルタイムにレプリケーションする(出典:グーグル・クラウド・ジャパン)](/mwimgs/3/8/600/img_38d95514198df937f67a70eb25b4598466058.jpg)
拡大画像表示
例えば、ECサイトの在庫をリアルタイムに分析するといった、リアルタイムにデータベースを複製したい各種のニーズに応える。参照専用のデータベースをオフロード分離し、商品購入などの更新系のトランザクションを維持するようなケースにも利用できる。
「Analytics Hub」は、グーグルのDWH「BigQuery」に追加した新機能で、データの共有だけでなくデータ分析の手法も共有することができる(図3)。主に、データ分析手法を共有していない社外とのデータ共有に役立つ。「BIツールのLookerを使って、このように可視化する」「このテンプレートを、こう使う」といった、データの分析方法を共有できる。
![図3:BigQueryにおいてデータだけでなくデータの分析手法も共有できる(出典:グーグル・クラウド・ジャパン)](/mwimgs/6/8/600/img_68d3a672767d6aa8effdaaeb730a35af104584.jpg)
拡大画像表示
社外とデータを共有する場合、共有したデータの使い方が分からないケースがある。一方で、社内でのデータ共有は、ユースケースや分析方法を最初から共有できているため、データの共有と活用がうまくいく。Analytics Hubによって、データの分析方法を共有できていない社外ユーザーとの間でも分析手法を容易に共有できるようになる。