米国ではデータを分析し、経営や事業に生かすことが常識になっているのかも知れない。それも人事や会計、生産管理といった定型業務とほぼ同じレベルで業務に溶け込んでいる−−。2014年10月下旬に開催されたカンファレンス「PARTNERS 2014」(主催は米テラデータのユーザー組織)に参加し、数々の事例に触れる中で、その思いは確信に近いものになった。
データ分析が米国では業務に溶け込んでいると考える理由の1つは、「PARTNERS 2014」の参加者数は4000人を超え(前年は3600人)、金融や流通、サービス、製造、公共など様々な業種の企業・組織が集まっていること。データウェアハウス(DWH)の老舗とは言え、米テラデータ1社のユーザーカンファレンスに、10万円以上の費用を支払って参加する人がこれだけいる。
より大きな、もう一つの理由は、事例発表の内容だ。確実なROI(Return of Investment:投資対効果)を見込んで実際に達成したとか、コスト低減を実現したという発表ばかりではない。むしろ「データがある以上、あらゆる技術を動員して分析や活用に取り組むのは当たり前。その結果として成果を生み出せれば御の字」といった姿勢を感じるものが多かった。
底流には、ある種の“不安”や“恐れ”があるかのようだ。消費者向けビジネス(B2C)を主体とする企業はもちろん、B2Bの企業もデジタル時代の波に洗われ、日々変化する状況に対応を迫られている。状況を詳細に把握したり競合他社に先んじてサービスを洗練させたりして、顧客へのエンゲージメント(関与)を強めないと生き残りが危うくなる−−そんな印象だ。
拡大画像表示
前置きが長くなった。以下では、PARTNERS 2014で発表された取り組み事例を紹介する(写真1)。「規模が大きいだけでは」とか「技術的には先進的かもしれないが、成果はどうなのか」といった疑問が出るかも知れない。そこには上記のような背景があることを考慮いただきたい。
人、モノ、コトのすべてがデジタル化され、つながるIoT(Internet of Things:モノのインターネット)時代を迎える中で、データの分析・活用がなくてはならない業務に位置づけられつつある。
事例1:eBay
総計100PBを上回るデータを3つのシステムで分析
拡大画像表示
オンラインマーケットプレイスの運営企業であり、特にインターネットオークションでは世界最大の米eBay(2013年の売上高は1兆8000億円弱)。同社が「Extreme Analytics @ eBay」と題して講演した。そのデータ分析プラットフォームは“Extreme(究極の、並外れた)”と呼ぶにふさわしいものだ(図1)。
eBayの分析システムは、構造化データのための企業データウェアハウス(EDW)と、半構造化(Semi-structured)データを扱う「シンギュラリティ」と呼ぶシステム、それに非構造データのためのHadoopシステムからなる。扱うデータ量は、それぞれ15PB(最大27PB)、36PB(同42PB)、50PB(同90PB)と、想像を超える規模ある。増加量もすさまじく、毎年40〜100%で伸びているという。
もはやビッグデータではなくエクストリームデータだ。その理由を同社のアーキテクチャー担当上級技術スタッフであるTom Fastner氏は、こう話す。
「世界中に1億5000万人の顧客がいます。当社のサイトに、いつ誰が来てどれだけの時間を費やしたか、サイト上のどの項目をどんな順番で閲覧したか(クリックストリーム)などを、すべての顧客について把握しています。顧客の次回の買い物を、常により良くするのが目的です」
講演では3つのシステムの用途に言及した。EDWは定型レポートやキャンペーンの効果把握などに利用する。「150から200人が同時にアクセスします」。
拡大画像表示
シンギュラリティの実体は、ストレージ容量の多さを重視したTeradataシステムである。クリックストリームを蓄積し、いわゆる「ABテスト」を実施して、サイトを日々改良するのに使用している。ABテストは、例えば文字の色をAとBの2種類用意し、どちらがより多くクリックされるかを調べるものだ(図2)。
拡大画像表示
最後のHadoopにはWebサイトの画像データやそれに紐付けたクリック数、あるいはEDWから送られる購入履歴データを蓄積する。そこでは例えば、画像の質が販売にどのように影響するかを調べている(図3)。結果はどうかというと「質と販売には強い関係があることが分かりました」(Fastner氏)。そのうえで、プラットフォーム運営者であるeBayとしては「劣悪な画像を掲載している出品者には連絡し、修正を依頼します」(同)。