データレイク/データウェアハウス/データハブなどのデータ統合基盤を構築したが、実際には十分に活用されていないという課題をよく耳にする。その解決策として近年注目されているのが「データ仮想化」だ。あらゆるデータをコピーすることなく、オンデマンドで統合するこの技術によって、クイックなデータ提供、データアクセスの集中管理、データカタログ、データ系列表示など既存のデータ基盤を大幅にパワーアップすることができる。「データマネジメント2021」のセッションでは、NTTコム オンライン・マーケティング・ソリューションの嶋田貴夫氏が、データ仮想化の使い方について解説した。
なぜデータウェアハウスが利用されないのか
多大なコストをかけ、鳴り物入りでデータウェアハウスやデータレイクを構築したにもかかわらず、一部の人にしか使われていないといった問題が様々な企業で散見される。なぜこのようなことが起こっているのか。NTTコム オンライン・マーケティング・ソリューションのエバンジェリストである嶋田貴夫氏は、様々な企業の業務現場から寄せられた声として下記を挙げた。
- ほしいデータがない:基本データはあるが、新しいデータや使いたいテーブルがない
- 新しいデータ提供に時間がかかる:ETLの開発に数か月待つ必要がある
- データが氾濫して必要なものが見つけられない:データマートの数が100を超えたらカオス状態
この状態がさらに進行するとどうなってしまうだろうか。嶋田氏が示すのは、次の5つの症状である。
① 人力対応
少数のデータサイエンティスト(またはデータエンジニア)にデータの依頼が殺到。データサイエンティストは「人力データハブ」と化して疲弊してしまう。
② データ探しの旅
ほしいデータを誰かが持っているはずだと、人から人へと尋ねて回って探し続ける、あたかもアドベンチャーゲームでアイテム探しをやっているような状況に陥る。レポート作成作業の90%の時間がデータ探しに費やされているケースも実際にあった。
③ 産地直送、ローカル取引
ほしいデータソースがデータウェアハウスになかなか登録されないので、所有者と直接交渉して利用(産地直送)したり、他のユーザーが使っているデータを自分も利用(ローカル取引)させてもらったりする。結果として“怪しい”データの流通や、ガバナンスの低下を招いてしまう。
④ データ誤用による重篤な副作用
たとえば売上の見込み値を実績値として取り込んだり、他の社員の加工などによってエラー値の含まれた野良データをそのまま利用したりといった誤用により、経営判断を誤らせるなど事業リスクを増大させる。
⑤ 積極的なデータ活用をしなくなる
最低限の業務でのデータ活用でさえ手間やリスクばかりが増していくことに疲弊し、ユーザーに“心の壁”ができてしまい、新たなデータ活用に消極的になってしまう。
データ仮想化が実現する4つの機能強化
上記のような課題にどう対処すればよいのだろうか。嶋田氏が解決策として提示するのが「データ仮想化」である。ここでいうところのデータ仮想化とは、「あらゆるデータをコピーすることなく、オンデマンドで統合するミドルウェア」だと嶋田氏は説明する。
これまでのデータウェアハウスは、ETLツールを用いて各データソースからデータを取得し、データマートを作成し、業務ごとのローカルコピーを行うといった、コピーを重ねる形のデータ統合を行ってきた。
拡大画像表示
これに対してデータ仮想化は、データソースのメタデータをベースにあらかじめ仮想テーブル(View)を定義しておき、実際にデータを要求する時点でクエリを分解して実データを取得するのだ。「ユーザー側のフロントにこの仕組みを置いておけば、それだけで仮想的なデータウェアハウス/データマートを作ることができます」と嶋田氏は強調する。
拡大画像表示
これにより、次の4つの観点においてデータ活用基盤の大幅な機能強化が実現する。
1つめは「クイックなデータ提供」。そもそも従来のデータウェアハウスとデータ仮想化では設計思想が異なる。従来のデータウェアハウスは、目的が明確な正しいデータを正しいプロセスで提供することを基本とする。一方でデータ仮想化は目的が変化しやすいデータの提供や修正の即時性(アジリティ)を重視している。「管理画面での設定が可能で、データウェアハウスで行っていたストレージの確保やジョブチェーン設計、テストデータの準備、システム間連携、コーディングなどの設計・開発は基本的に不要となります」(嶋田氏)。
2つめは「データアクセスの集中管理」。各ユーザーに対してアクセスできる仮想テーブルをACL(アクセス制御リスト)でコントロールするほか、ログを取得することもでき、ユーザーの入退社や異動にも素早く対応することが可能だ。「前述した“産地直送”や“ローカル取引”を抑制してガバナンスを強化します」(嶋田氏)。
3つめは「データカタログ」。ユーザーごとに利用可能なすべての仮想テーブルをカタログ化し、データの探索稼働を大幅に削減する。「結果として、人力データハブ化して疲弊していたデータサイエンティストの負荷も軽減されます」(嶋田氏)。
4つめが「データ系列(リネージュ)の表示」。見つけ出したデータが本当に自分の求めていたものなのか、データソースを含むルートやカラム間の関係などからデータの“素性”を確認することができるのだ。「この機能によってデータの誤用を防止し、データサイエンティストも、IT管理者も、ガバナンス管理者も、安心してエンドユーザーにデータを使わせることが可能となります」(嶋田氏)。
TIBCO Data Virtualizationを推奨する理由
こうした多くのメリットを持つデータ仮想化を実現するミドルウェア製品として、NTTコム オンライン・マーケティング・ソリューションが推奨しているのが、TIBCO社の「TIBCO Data Virtualization」である。
その理由として挙げるのがグローバルトップ企業での採用実績が豊富なことだ。「Fortune 500のトップ10にランクインする企業の6社、製薬企業トップ8社のうち7社、エネルギー企業のトップ3社、米国銀行トップ6社、米国通信・メディア企業トップ5社のうち4社がTIBCO Data Virtualizationを活用しています」(嶋田氏)。
また、クエリ最適化や超並列処理、アクティブクラスタといったテクノロジーにより大規模利用に対応するパフォーマンス、350種以上のデータ接続アダプタやTIBCO Connected Intelligenceファミリーによるデータ統合ソリューションとしての拡張性も他のデータ仮想化ソリューションに対する優位性となっている。
NTTコム オンライン・マーケティング・ソリューションはTIBCOの国内総代理店として活動しており、国内企業におけるデータ仮想化の普及を後押ししている。「データ仮想化に興味・関心を持たれましたら、デモやトライアル、資料請求、その他お問い合わせなど、ぜひ私どもまでご連絡をください」と嶋田氏は呼びかけた。
●お問い合わせ先
NTTコム オンライン・マーケティング・ソリューション株式会社
〒141-0032
品川区大崎一丁目5番1号 大崎センタービル4F
URL:https://www.nttcoms.com/service/TIBCO/products/data-virtualization/
Email:info-tibco@nttcoms.com
- 経営革新の核となるデータ活用の考え方~経営・顧客・設計・製造が連動したDX基盤のグランドデザインを描く(2021/05/06)
- MDMの効果を経営層に納得させるために―ROI可視化に効く3つの観点とは?(2021/04/26)
- データマネジメントで見過ごしがちな重要ポイント! 今こそ“ストレージ”を再考すべき時期(2021/04/21)
- データ駆動経営を実現する組織の在り方とは? 事例で学ぶデータアーキテクトのミッション(2021/04/20)
- 点在するデータリソースをワンストップで利用できる「データ仮想化プラットフォーム」の実力(2021/04/16)