数億人規模のユーザーが生み出す膨大な情報が流通するソーシャルメディア。蓄積された声を拾い集めてビジネスに活用したいと考える企業は少なくないはずだ。そうした希望を叶えるべく、主要ベンダーがデータ分析ツールを続々と投入してきている。
2011年は、ソーシャルメディアの存在がマスメディアでクローズアップされた。チュニジアやエジプト、リビアの政変では独裁政権に抵抗する市民の武器として活躍。東日本大震災やタイの大洪水などの災禍の中ではいち早く現場の“声”を届けた。刻一刻と生み出される人々の発言を眺めながら、“何かすごいことができるのでは”と考えた経験は誰しもあるはずだ。
野村総合研究所が毎年発表する「ITロードマップ」の2012年版では、企業ITにおける今後5年間の重要テーマとしてスマートデバイスとソーシャルメディアをあげる。ベンダー側も大きな可能性を見出している。セールスフォース・ドットコムは2011年3月、ソーシャルメディア分析ツール大手の米Radian6を買収、3億2600万ドルもの投資額で話題をまいた。狙いは顧客情報の高精細化にある。「CRMやForce.comアプリケーションにソーシャルメディアの情報を取り込むためのアダプタとしてRadian6を活用していく」(同社の榎隆司 執行役員)。
現在、ソーシャルメディアの活用方法の中でも最も製品・サービスが充実しているのが“分析”の分野である。ツイッターやフェイスブック、ブログ、掲示板に寄せられた投稿の声を分析して、人々の関心を探る。例えば、自社製品に対して消費者はどのような印象をもっているか、販促キャンペーンの実施後にインターネット上でどの程度の反響があったかなどを調べるというものだ。「コールセンターやアンケート以外の手段で社外の声を取り込むチャネルが増えた。消費者の本音をリアルタイムかつ手軽に取得できる点がソーシャルメディアの特徴」(野村総合研究所の亀津敦 主任研究員)。
収集・加工・活用の3ステップ
日本語の解析技術が鍵
一般的なソーシャルメディア分析ツールの仕組みを示したのが図1だ。(1)収集、(2)加工、(3)利用の3つのステップで構成する製品・サービスが多い。以下、順を追って見ていこう。
1. 収集
ソーシャルメディア分析に必要なデータは社内に存在しない。ブログや掲示板、ツイッター、フェイスブックなどから入手する必要がある。データの取得方法はメディアごとに異なる。運営者が公式APIなどのインターフェースを用意している場合もあれば、個別にデータ提供契約を結んだり、クローラーなどを使ってデータを収集したりしなければならない場合もある。
例えばツイッターでは、投稿者が公開設定を行っているつぶやきの中から、(1)過去1週間で特定のキーワードを含むものを取得できる「検索API」と、(2)全体の1%程度をリアルタイムに抽出・配信する「ストリーム」という2つのデータ取得手段を無料提供している。特定のキーワードに関する発言を詳細に分析したい場合は前者、トレンドを知りたい場合は後者を利用すれば良いだろう。現時点で公開ツイートを100%分析可能なサービスは米データシフトと米GNIPなどに限られている。なお、同社は公式解析ツール「Twitter Web Analytics」の提供も予定している。
オンプレミスの場合はデータの調達を利用者に委ねる製品がほとんど。一方、クラウドサービスの場合は、各メディアからデータを収集・蓄積して、独自のデータベースを構築、利用に供している場合も多い。例えば、SaaS型分析ツール「クチコミ@係長」を提供するホットリンクは、公式APIを使ってツイッターのデータを蓄積。また、アメーバブログやYahoo!ブログなどの主要ブログサイト、2ちゃんねるやカカクコムなどの掲示板などと提携してデータの提供を受ける。
製品・サービスによって利用可能なデータは異なる。どのメディアからデータを収集しているか、どれぐらいの期間さかのぼることができるか、すべての投稿データを収集しているのか、あるいは特定のキーワードで絞り込んでいるのか。製品選定の際は利用可能なデータが自社の分析ニーズにマッチしていることを確認しておきたい。
2. 加工
収集したデータの内容を解析して、分析に適した形に加工する。ソーシャルメディアから取得した“生”データはただのテキストにすぎず、集計などの操作が難しいからだ。投稿データの内容を解析して、キーワードを拾い上げたり、内容に応じてカテゴリー分類したりする。製品・サービスによっては、ソーシャルメディアのプロファイルや発言の内容から、年齢や性別、感情などの指標を付与するものもある。
データの加工を支えるのが形態素解析や構文分析などの自然言語処理技術である。例えば、文章を「ITLeaders/は/無料/で/読め/る」といった要領で要素に分割し、辞書と突き合わせながら書かれた意味を解釈していく。この例文では、「ITLeaders」「無料」といったキーワードを含んでおり、ポジティブな感情を抱いていると判断できる。
もちろん、実際の処理はさらに複雑だ。キーワードを拾うだけではなく、主語と述語の対応や係り受けなども考慮する。テキストの意味を正確に解析できるかが分析の信頼性を左右する。各社が独自の技術やノウハウを投入している。日本IBMの「IBM Content Analy-tics」や野村総合研究所の「TRUE TELLER」などテキストマイニングに出自を持つツールも多い。ソーシャルメディア分析の専業ベンダーがデータ収集に重きを置くのに対し、テキストマイニングツール系のベンダーは分析機能で差異化を図る印象だ。
また、製品選定の際は対応言語にも注目しておきたい。海外の評判を分析する場合だけでなく、日本在住の外国人が母国語で発言した内容を分析する場合にも外国語対応が必要だ。解析の精度は言語によって異なる。必要な言語の解析機能が実用に耐えうる水準に達しているかチェックしたい。
3. 利用
収集・加工したデータを分析する。テーマに関する発言数の推移を見る「時系列分析」や、キーワードに対する発言者の感情を調べる「ポジネガ分析」、インターネットで影響力を持つ人々を特定する「インフルエンサー分析」などを備えるものが一般的だ。特定のキーワードを含む投稿をメールなどで知らせる「アラート機能」や、定期的に所定のフォーマットで分析結果を報告する「レポート機能」など運用面を考慮した製品も少なくない。以下、特徴的な製品を見ていこう。
業界特化型のテンプレートでチェックすべき観点を明らかに
SAS Institute Japanが提供する「SAS Social Media Analytics」は、企業がソーシャルメディア分析を行う上でチェックすべき観点をまとめたテンプレートで差異化を図る。コアとなるのは業界別の辞書。例えば、自動車業界なら「性能」「燃費」「デザイン」「価格」、ホテル業界なら「立地」「宿泊費」「部屋の広さ」「接客態度」など、消費者が商品・サービスを評価する際の指標や言葉遣いをまとめている。
評価指標となるキーワードごとにデータを集計すれば「性能は申し分ないが、デザインが今一つ」「立地は良いが、接客態度が悪い」といった具合に業務に結びついた情報を獲得できる。
「ビジネスとして活用するからには、具体的なアクションにつながるような視点で分析する必要がある」(同社のビジネス開発本部の高橋昌樹CIグループ部長)。
会員登録(無料)が必要です
- 1
- 2
- 次へ >
- 注目のメガネ型ウェアラブルデバイス(製品編)(2015/04/27)
- メインフレーム最新事情[国産編]NEC、日立、富士通は外部連携や災害対策を強化(2013/09/17)
- メインフレーム最新事情[海外編]IBM、ユニシスはクラウド対応やモバイル連携を加速(2013/09/17)
- データ分析をカジュアルにする低価格クラウドDWH(2013/08/02)
- 「高集積サーバー」製品サーベイ─極小サーバーをぎっしり詰め込み、用途特化で“非仮想化”の強みを訴求(2013/07/23)