構造化/非構造化データの高度な統合が ビジネスに新たな可能性をもたらす 全世界で1400社、2500システム以上の導入実績を持つテラデータ。DWHを使った構造化データの分析はもとより、非構造化データの活用分野でもリーダー的存在だ。同社のセッションでは、金井啓一氏が「ビッグデータ時代のデータマネジメントを考察する」と題して講演。企業は構造化データと非構造化データをどう組み合わせていけばいいかを解説した。
データの生成から、蓄積、統合、破棄、活用までをいかに実践するか
コーポレート・エバンジェリスト
エグゼクティブ・コンサルタント
金井 啓一 氏
データの高度な利活用に向けた各種ソリューションを展開するテラデータ。日本法人の金井啓一氏がセッションの壇上に立ち、昨今のトレンドに照らしたデータマネジメントのあり方を語った。
巷間言われるビッグデータについては「データの収集・管理・分析といったアクションに対して、通常利用しているツールで許容時間内に処理できないデータを指す」と解説。一般には、Webログ、RFID、センサー情報、通話記録明細、医療記録、画像保管庫など多種多様なデータを指し示す。それらをカバーする技術としては、MPPデータベース、Apache Hadoopフレームワーク、MapReduceアルゴリズム、アーカイブスレトージシステムなど新たなものが次々に登場している。
企業は、膨大で多種多様なデータについて、その生成から蓄積、統合、破棄、活用までを含む広範な活動に取り組まなければならない。「これからのデータマネジメントを考える上では、非構造化データと構造化データの統合による活用・分析が重要性を増す」(金井氏)。
構造化データと非構造化データを統合しビジネス価値を向上させる
これまでの情報活用の中心だった構造化データに、新機軸として非構造化データを統合すれば、ビジネス価値の向上につながる新たなインサイトを引き出せる可能性が高まる。
非構造化データの代表的な活用分野としては、「顧客管理・CRM」「マーケティング」「品質管理」「パターン検知・発見」の4つが挙げられるという。例えば顧客管理・CRMでは、これまでの取引データに基づくデシル分析やRFM分析だけでなく、SNSなどのソーシャルデータを使って消費者や商品の関係性を分析したり、スマートフォンから取得するセンサーデータを使って行動分析したりといったことができるようになる。
構造化データと非構造化データを統合するにあたって留意すべきことは何か。金井氏は、技術基盤(Hadoopなど)、顧客識別子、論理データモデル、行動履歴といったさまざまな視点での統合を考察しておく必要があると指摘する。
例えばHadoopという視点で見ると、まずは従来のデータベースとは異なる対応が求められることになる。一般的にはデータモデリングの概念はなくファイルのまま取り込むことが多い。格納されるデータは第3正規形ではないため、データの整合性をとるために名寄せなどの統合フェーズで一定水準のスキルやノウハウが必要になる。また、顧客の行動履歴といった視点で見ると、商品の価格や取引の履歴といったことに加え、SNSの情報、Webサイト閲覧の履歴、電子メール、広告、コンテンツなどの情報を統合していく必要がある。
テラデータの国内における導入実績は、金融、小売、製造、通信、運輸などの多数の大手企業からなる。この中には実際にソーシャルデータの分析を手がける企業も表れてきているという。金井氏は「国内企業も本格的にビッグデータを活用し始めようとしている。実績に基づいたノウハウがある点が当社の強みで、顧客のニーズに合わせた解を提示できる」と強調した。
お問い合わせ
- 【session 12】「InfoFrame Relational Store」のポテンシャルを強調するNEC(2012/05/10)
- 【session 11】情報活用、事業継続の実現に向けた日本オラクルのメッセージ(2012/05/10)
- 【session 10】「3つのV」の特性に着目し、複数のビッグデータ・アプローチを提示する日本IBM(2012/05/10)
- 【session 09】膨大なデータの具体的活用イメージを訴求する富士通(2012/05/10)
- 【session 08】意思決定・ビジネス活用に貢献するためのデータ品質を追及するリアライズ(2012/05/10)