インターネット上には企業にとって有用な情報があふれている。自社の製品やサービスを紹介するメディアの記事や購入した消費者の声、競合製品に関するその種の情報などがその例だ。そうした情報から目的のものを検索し、収集し、分析するにはどうすればいいか? もちろんGoogle検索でもある程度のことはできるが、企業向けの専用ツールを使う方が効率がいいことは確かだ。Googleでは難しいSNSの情報はもちろん、現在では音声ファイルやYoutubeの動画も検索・収集できるという。
ネット上のさまざまなサイトから横断的に情報収集
日々、インターネット上にアップされて増え続ける情報から、欲しいものをどうやって見出すか――。誰しも思いつくのが、GoogleやBingなどを使った検索だろう。ニュース検索すればどんなメディア取り上げられているかがわかるし、画像や動画も検索できる。Googleが提供するGoogleトレンドというサービスを使えば、時系列や地域別で検索数の推移を把握することもできる。
一般的な検索ならこれで十分だが、企業が自社の製品やサービスに関する評判や評価を知ろうとすると限界がある。典型例が、個人が意見や思いを共有するソーシャルネットワークサービス(SNS)だ。検索エンジンで得られる情報は一部でしかなく、結局は個々のSNSにログインしてキーワード検索したりハッシュタグ検索したりしないと、求める情報を得られない。例えば、営業やマーケティング、製品やサービスの企画責任者などが自社の製品やサービスに関する評判を知ろうとすると、手間と時間をかけなければならなかったのだ。
この問題を解決するのが、”ソーシャルリスニング”と呼ばれるツールである。SNSで個人が発信した情報を収集して分析するものだ。その1つであるNTTデータの「なずき」はTwitter社と提携して、Twiiterの全データを含む各種情報を収集・整理しているので、製品やサービスの評判を可視化できる。Twitterに限らず現在では、さまざまなSNSに加えてブログサイト、マスメディアや専門メディアが運営するWebサイトなどの情報を収集、分析できるサービスも登場している。
では最新のソーシャルリスニングツールはどんな情報をどのように検索できるのか? その1社でルクセンブルグを拠点にサービスを提供するTalkwalkerに話を聞く機会があったので、紹介しよう。この種のサービスの主な利用者はマーケティング部門であることが多いが、CIOやITリーダーが知っておいて損はないからだ。さらに「ここまでできる」という技術的な観点でも知っておくべきと考えられるからだ。
18億サイトのうち2億サイトをカバー、個別契約で主要SNSも
Talkwalkerでは、Googleなどと同じく様々なWebサイトの情報をロボット(クローラー)で収集、整理するクローリングを行っている。サイトは現在、世界に18億超あるが(https://www.internetlivestats.com/)、そのうち掲示板やニュースサイトなど約1億5000万サイトを毎日巡回し、検索インデックスを作成して蓄積しているという。
加えてログインが必要なSNSなどについては、主要なサービス事業者と契約してAPI経由でデータを取得している。つまり仕組みはGoogleやBingと同様だが、カバーするサイト数は少ない。一方で様々なSNSの情報を詳細に検索、分析できる点が異なる。
製品名や企業名などでキーワード検索すると、タイトルと説明文を検索結果として表示する。これを可視化してダッシュボードで分析できる(画面1)。投稿、掲載数の推移を時系列でグラフ化して、SNSやメディア別、あるいは投稿されたデバイス、国や言語などで絞り込むことも可能だ。
拡大画像表示
文章にキーワードと一緒に出現するさまざまな言葉を、ワードクラウド(Talkwalkerはテーマクラウドと呼んでいる)という形式で表示したり(画面2)、投稿者のプロフィールを推測して表示したり、ワールドマップで各国の投稿数を表示することも可能となっている。競合製品と比較分析する機能もある。
拡大画像表示
露出が多かったからといって、好意的に受け入れられているとは限らない。炎上している可能性もある。それを知るために、投稿や記事の内容がポジティブか、ネガティブか、ニュートラルかをセンチメント分析によって判断して、その割合を示したグラフも表示する(画面3)。
拡大画像表示
センチメント分析は、文章の中に出てくるキーワードから投稿が肯定的か否定的かを判断する技術。一般的には、肯定的なキーワードが多ければポジティブ、否定的なものが多ければネガティブと判断するわけだが、これだと間違った判断をしている可能性もある。例えば他人の肯定的な言葉を引用して、それを否定したり、あえて逆説的な表現をしたりと、そのキーワードが逆の意味を持っていることがある。
そこで、テキストを自然言語処理で取り込んで表現の仕方や言葉遣いなどを分析することで、より高精度な判断を行っている。機械学習が使われており、膨大なデータで学習して精度を向上させている。
●Next:画像や動画はどうやって検索しているのか?
会員登録(無料)が必要です
- 1
- 2
- 次へ >