デジタルビジネスの創出への期待が高まっているが、その本質はデータ駆動型経営への変革だといえる。多種多様なデータの取得から蓄積、分析までの実現が容易になればなるほど、企業にとっての差異化点は、いかに活用し行動に移すかに集中する。そこに“必要な時に、必要な形で”データを提供したり推奨したりを目指す「Intelligent Data Lake(IDL)」を提唱するのが、データマネジメント関連ツールベンダーの米Informatica(インフォマティカ)。IDLの価値などについて、同社CMO(Chief Marketing Officer)のJim Davis(ジム・デイビス)氏に聞いた。
−−年次カンファレ ンス「Informatica World 2016」では、中核製品群「Intelligent Data Platform(IDP)」を基盤にする「Intelligent Data Lake(IDL)」を発表した。IDPとIDLでは何が異なるのか。
Intelligent Data Lake(IDL)は、ビジネス部門におけるデータ活用に向けて、よりセルフサービス化を進めるための考え方であり、それを実現するための仕組みである(関連記事『データを制するものが勝者、全社に広がるデータを利用者視点で管理せよ』)。
当社はこれまでIntelligent Data Platform(IDP)を提唱し、データ活用のためのデータマネジメント基盤(プラットフォーム)の重要性を訴えてきた。データアナリティクス(分析)プロジェクトの8割は、実際に活用できるデータを整備するためのデータマネジメントに費やされるのが実状だからだ。
だが、データ活用のためのIT関連予算は、IT部門の管轄からビジネス部門の管轄へとシフトしている。データをどう経営に生かすかを目指しているのだから、それは当然だ。結果として、データアナリティクスに対するニーズは業種別に分かれてきている。通信事業者が求めるアナリティクスと製造業が求めるアナリティクス、あるいは官公庁が求めるアナリティクスでは、分析したいデータも異なれば分析結果の生かし方なども異なっている。つまり、データ駆動型経営に向けたソリューションとしては、IDPで主張してきたIT基盤の標準化に加えて業種・業務ノウハウを組み合わなければならないわけだ。
なのでIDPが持つ機能をAPI(Application Programming Interface)として整備・公開し、業種別サービスを展開できるようにした。IDP上で動作するアプリケーション群の総称が「Intelligent Data Lake(IDL)」だと言っても良い。今後はパートナー企業には、それぞれが持つ業種・業務ノウハウを生かしたサービスを開発してもらいたい。
IDPをオンプレミスに実現するためのシステム構築ニーズは残るが、分析対象のデータがクラウド上で発生するのに従い、IDPの機能はクラウド化が進む。既にAWS(Amazon Web Services)やMicrosoft Azure上での利用が可能になっている。これらIDPのサービス(API)を使って業種サービスを提供できるようにパートナー企業に対する教育メニューも変えていく。
−−IDLによるビジネス部門のセルフサービス化を進めれば、予算を持たないIT部門は不要ということか。
それは全くの誤りだ。IT部門なしにデータアナリティクスは実現できない。SaaS(Software as a Service)などのクラウド事業者であればビジネス部門に直ぐに取り入れることができるという論調があるが、これは世界的な間違いである。私が「Informatica World 2016」で、企業におけるデータ活用の成熟度モデルを示したのも、この誤解を解くためだ。
データ活用の成熟度は、「Individual(個人的)」「Forms(標準化)」「Unity(統一化)」「Discover(気づき)」「Innovate(変革)」の5段階からなる。第2段階までは、自分が利用するアプリケーションしか視野に入っていない状況で、情報システムがサイロ化していても大きな問題にならない。
これに対し第3段階以降は、データに対するシングルビューが求められる。そこでは、データに基づく変革に向けて、IT基盤を整備するIT部門と、それを使って経営上の成果を生みだすビジネス部門とが対話できなければならない。言い換えれば、データ活用の成熟度は、IT部門とビジネス部門が、どれだけ共通の認識を持ち、目標の実現に向けて対話できているかの度合いでもあるわけだ。
クラウドが登場して以降、ITはビジネス環境に組み込まれ、それ自体が提供する機能の価値は見えづらくなる傾向が強まっている。当社製品でいえば、マスターデータ管理の「MDM(Master Data Management)」やデータ品質を高める「Data Quality」なども、それらを導入することによって利益は確実に上がるが、それがMDMやData Quality単独によるものか、アプリケーションや社員の行動によるものかの切り分けは難しい。
IT部門が、ビジネスにより直接的に関与しなければならないと指摘されるのは、このためだ。その意味では、当社のIDLはITがもつ価値をビジネス部門の視点から表現し直しているとも言える。
−−データ活用に向けてはIoT(Internet of Things:モノのインターネット)への期待も高まっている。
IoTで扱うデータは、プロセスデータと非構造データとに大別できる。プロセスデータは、状況の変化をリアルタイムに示すものだ。当社のIDPでは、ビッグデータ環境においてHadoopに加えてSparkにも対応し、ストリーミングデータの扱いには対応済みだ。
一方の非構造データは製品の状態を示すもので、大量のデータから洞察を得るためにバッチ処理される。そこでは、必要なデータを瞬時に取り出したり、気づいていないデータを推奨したりするための「Intelligence」も重要になってくる。ここには機械学習といった手を打っている。いずれにせよ、テキストデータをどうか使うかが重要になってきている。