IoTやAIなどのデジタル技術を活用しようとすると、必然的にこれまで以上に多種多様かつ膨大な量のデータを扱うことになる。サイバーの世界と実世界をまたいで人・モノ・コトをつないだデータそのものの意味を解釈し、価値を発見し、異種データの横断的な分析によって業務やビジネスに活用できる基盤とすることが求められる。「データマネジメント2018」のセッションで、NECがデジタルトランスフォーメーション(DX)時代に向けたデータマネジメントのあるべき姿について解説した。
AIによる予測とデータがもつ意味の解釈を両輪で回す
これまでデータは主にサイバーの世界で生成され活用されていたが、その対象が実世界に拡大しようとしている。多種多様なデータをどのようにデータマネジメントをするべきか。NEC クラウドプラットフォーム事業部のマネージャーを務める佐々木洋平氏は、「デジタルトランスフォーメーション時代になりAI技術が注目されているが、データマネジメント技術も日々技術革新が進んでおり、これらを有効に活用することが重要になってくる」と語った。
もともとNECは1960年代のOCRからAI技術に取り組んできた歴史があった。この技術はその後もさまざまな“見える化”技術の礎となり、なかでも指紋認証や顔認証は世界でもトップクラスの評価を獲得している。また、2000年代からは「分析」や「対処」といった領域でも独自の術を生み出しており、これらのAI技術は「NEC the WISE」として体系化されている。
拡大画像表示
佐々木氏は、「多くのAI実証実験が行われていますが最も期待されているのは将来を予測することです。しかし、予測の検証が進むとデータの意味を見直すタイミングが来ます。今後のデータ活用のシナリオは、そうしたAIによる予測とデータそのものがもつ意味の解釈を両輪で回していくという世界になると考えています。その時、いままで以上にデータマネジメントの重要性が増していきます」と示唆した。
世の中の事象を多面的に捉えることができる基盤が必要
これまでのデータマネジメントの基本的な考え方、つまりデータをビジネスに活かすことができる状態で継続的に維持しさらに進化させていくための組織的な営みは今後も変わることはない。ただ、そうした中で新たに生まれてきた概念として佐々木氏が取り上げたのが、ビッグデータプラットフォームとしてのデータレイクである。
「世の中に起こっている事象を理解しようとしたとき、1つのシステムのデータだけを観察するのではなく、ある事象から取得されるデータを多面的に捉えることができることが必要となります。これがすなわちデータレイクであり、サイバーの世界のデータのみならず、実世界のデータまであわせて理解することが重要です」と佐々木氏は説明した。
拡大画像表示
もちろん、こうした統合データ基盤に対する取り組みがこれまでなかったわけではない。たとえば部門を横断した分析を実現する基盤としてデータウェアハウスが多くの企業で構築されてきた。また、その後の利用局面拡大による過去データの永続化への要求の高まりを受け、従来に比べてより低コストで大量データの全件分析が可能な基盤としてHadoopなどの活用も進んだ。
しかし、実世界におけるさまざまなビジネス活動やサービスのデジタル化が進み、これに伴いデータ発生源が多様化してくると、異種データの統合管理を可能とするシステムアーキテクチャーが求められるようになる。
佐々木氏は、「アプリケーションから分断された、ある一面からのみ事象を捉えたデータ群が多数発生しているのです。そうした中でデジタルトランスフォーメーションの領域においては新たなデータ価値の探索がますます重要なテーマとなっており、各業務部門が独自に導入したシステム、画像や映像など多種多様なデータを統合しつつ、多面的な解釈を促進するプラットフォームへの期待が高まっています」とデータレイクが望まれる理由を説いた。
拡大画像表示
データマネジメントを拡張する3つのアプローチ
デジタルトランスフォーメーション時代のデータマネジメントに向けて、具体的にNECは具体的にどのような取り組みを行っているのだろうか。
「多種多様なデータが混在する中から価値を発見するためには、データを解釈できることが重要です。とはいえ人手による作業では大量のデータを理解することは困難であるため、人がより簡単にデータを解釈できるように、“データを寄せる”技術が重要になると考えています」(佐々木氏)。
このデータマネジメント拡張技術には大きく3つのアプローチがある。
1つめは「スキーマの意味を寄せる」という取り組みだ。ガバナンスが効いていないデータソースのデータも有効活用したいところだが、その場合にはスキーマを理解することからして大変な労力を伴うのが実情だ。この課題に対してNECは、システムの設計仕様書やマニュアルなどの入手可能な情報に対して自動的な解析を行いナレッジ情報を抽出することで、表や列の意味を解釈する独自技術を提供しているという。
2つめは「レコードの意味を寄せる」という取り組みだ。ファクトとマスターはアプリケーション等により生成された情報のみが存在しているが、それらのデータ間の関連性を解釈し、データの関係性を分析することで、不足している情報を補ったりすることでデータの価値を高める技術を提供している。
3つめは「バイナリデータを寄せる」という取り組みだ。一般にAI技術の進歩によりバイナリデータはその個々のデータ単位での解釈は可能となってきたが、大局的な意味の解釈は困難である。この問題への取り組みの一環としてNECでは、画像データを自動的にクラスター化する技術を開発し画像データを集合論的に分析するという新しい分析手法を提案している。この分析手法によりデータの意味解釈のための時間を大幅に短縮することを実現している。
「これらのアプローチと従来からのSQLやBIツールを融合することで、異種データの横断分析も可能となってきました。この 新たなデータマネジメントの世界をデータを持つユーザ企業の皆様と作っていきたい」と佐々木氏は強調した。
こうした新たなデータマネジメントは、先進的な企業での実証事件で効果をあげているほか、データマネジメントを業務とする方々からは強い関心を集めているという。
NECはこのデータマネジメント拡張技術を核とした「データ発見コンサルティングサービス」を提供し、RDB、ドキュメント、非構造データ、IoTなど、あらゆるデータソースからのデータ活用を支援していく意向である。
●お問い合わせ先
日本電気株式会社(NEC)
E-mail:info@dbg.jp.nec.com
URL:https://jpn.nec.com/bigdata/product/
- クラウドファーストの実現・実践に向けてデータ基盤はこう構築せよ(2018/04/19)
- デジタル変革の実現に必須となるデータプラットフォームとプロセスの姿(2018/04/11)
- 再び脚光を集める「データHUB」──基盤構築のポイントは仮想データ統合にあり(2018/04/10)
- 基軸となるデータを見ずに何を見る? AIを始めとした過剰なツール信仰が招いたデータ活用の失敗例(2018/04/10)
- データマネジメントをリードする「モデリングのプロ」の育てかた!(2018/04/09)