昨今、これまで捨てていたログデータを資産として扱うようになるとともに、IoTなどが大量のデータを生成しつつある。企業にとってビッグデータが当たり前のように存在するようになると、必然的にその処理基盤であるHadoop/Sparkの利活用に、本格的に取り組まなければならなくなる。「データマネジメント2017」のセッションでは、Apache Hadoopのコミュニティでの開発実績を持ち、ビッグデータの専門企業であるホートンワークスが、これまでにないビッグデータの格納、処理、分析、アクセスを実現する方法と、国内外の最新事例を紹介した。
ビッグデータ活用のためのプラットフォームがなぜ必用なのか
政府が掲げる「日本再興戦略2016」では、新たな有望成長市場を築くにあたり、IoT、ビッグデータ、AI、ロボットなどによる第四次産業革命を実現することで、2020年に30兆円の付加価値創出を目指している。このうちビッグデータに関しては、従来からの構造化データだけではなく、半構造化データや非構造化データも取り扱わねばならなくなる。
ホートンワークスジャパン マーケティング本部 マーケティングディレクターの北瀬公彦氏は、「IoTデバイスやSNS、画像データなどの非構造化データと構造化データをうまく組み合わせて活用しないといけないが、果たしてどれだけの企業がデータを貯めるプラットフォームをきちんと準備しているだろうか」と疑問を投げかけた。
同氏は、「ビッグデータの活用には新しいプラットフォームが必用になる」として、そこで求められる以下の5つの要件を示した。
- 大量・多種類データに対応する拡張性
- 静的・動的データの一元管理
- リアルタイム・エッジの実装
- ガバナンス・セキュリティ
- オープンテクノロジー(優れたオープンソースのツールが次々と開発されるため)
このようなプラットフォームの整備が必須となりつつある一方で、2017年度の企業のIT投資動向の予想は、2016年度からもほぼ横ばいのままだ。「データプラットフォームにどう投資していけばいいのか、今こそ真剣に考えなければいけない」(北瀬氏)。
次世代アプリケーションを支えるプラットフォームを実現した5社のケース
そうしたなか、ホートンワークスが提供しているのが、次世代データアプリケーションを支えるプラットフォーム(図1)である。このプラットフォームは、データの収集やデータフロー管理を担う「HDF(Hortonworks DataFlow)」と、データの蓄積やデータ分析を担う「HDP(Hortonworks Data Platform)」の2つを軸としており、いずれもオープンソースのソフトウェアを使って製品を構成しているのが特徴だ。
「我々のパッケージは、誰でも利用することが可能だ。それはホートンワークスのビジネスモデルが、ソフトウェアのサポート(サブスクリプションライセンス)と、導入支援サービス(プロフェッショナルサービス)になるからだ」と北瀬氏は言う。
同氏は、ホートンワークスの製品を活用している国内外の企業の事例を示した。1つ目は、自動車保険会社Progressiveの事例だ。以前よりWebを解析して最適な広告を出していた同社では、運転手の状況診断や位置情報などを把握するデバイスを車に設置し、それらのセンサーデータの活用を目指すこととなる。そこで新たに設定したのが、日頃の運転が穏やかか荒いかによって保険金額を変動させる保険プランである。さらに同社では、位置情報とその場所の犯罪発生率や気象データなどを組み合わせて、これから走行する地域を迂回すべきなどのアドバイスをする付加価値サービスも実現しているという。「最初は1つのデータでできるビジネスを実践するというように小さく始めて、やがて複数のデータを組み合わせていくというアプローチがこの事例のポイントだ」と北瀬氏はコメントした。
続いては、イギリスの電力ガス会社の事例だ。かつて同社では、検針をあまり実施せずに料金を決めているという課題を抱えていたが、スマートメーターを設置することで、5分毎に使用量を把握し、それに応じた料金を請求できるようにしたのである。さらに、提携クレジットカードで料金を支払うとクーポンを提供するようにしたほか、地域の使用量の平均を基に使い過ぎをユーザーに警告するなどの付加価値サービスを展開しているという。「こちらも1つのデータから小さく始めて、その後様々ななデータを組み合わせて付加価値サービスへとつなげた事例だと言える」(北瀬氏)。
3つめ以降は、国内の事例である。住宅設備機器メーカーのLIXILは、合併に伴い5社のシステムを統合するに当たって、データソースの統合が課題となった。その課題解決のためにHadoopベースのデータ基盤を構築した結果、ガバナンスの向上やコスト削減、情報分析データ活用の検証といった効果を得ることができたのだ。
「同社は以前、データのソースが不明瞭でレポートの信頼性が低くなるようなこともあったというが、今では均一なレポートが作成できるようになっており、今後は住宅IoTデータの活用に意欲を見せている」(北瀬氏)。
4つめのリクルートテクノロジーズでは、数多くのサービスを展開していることから、データもまた多種多様で増大を続け、パフォーマンスの劣化や最新テクノロジーを有効活用できないといった課題が生じていた。Hadoopの環境へと刷新したことで、これらの課題を解決できたのである。同社は現在、オープンプラットフォームを活用した人材の開発・育成にも注力しているという。
最後は、ヤフージャパンの事例である。同社が運用するWebサイト「Yahoo!JAPAN」では、加速度的に増え続ける膨大なデータや、大規模クラスタの運用の不安定さが問題となっていた。そこでデータ分析システムにHDPを採用した結果、パフォーマスの向上や、3000台を超えるクラスタの安定運用、さらには社内技術者のレベル向上を果たしたのである。現在同社では、Webのログやショッピングの購入履歴、オークションの入札情報など様々なデータを統合して、広告を出すための基盤としてHDPを活用しているという。「ビッグデータをビジネスで安定的に活用できる基盤を構築したケースと言える」と北瀬氏は強調した。
北瀬氏は、Hadoop等を利用したデータ・ウェアハウス最適化ソリューションやその効果について言及したほか、ホートンワークスが国内で展開するコミュニティ活動などを紹介。講演の最後には、今後も次世代データアプリケーションを支えるプラットフォームの実現に注力していくことを力強く宣言した。
●お問い合わせ先
ホートンワークスジャパン株式会社
E-mail:info-jp@hortonworks.com
URL:https://jp.hortonworks.com/