[Sponsored]
オープンソースでビッグデータ統合を実現、データに基づいた経営でビジネスを変える
2014年5月12日(月)
データを高度に活用した意思決定が急がれている。しかし、静的データだけでなく動的データも取り扱い、さらには非構造化データまで対象を広げた途端に、その量は膨大となって複雑化し、品質は不安定になる。フランス生まれのオープンソースベンダーであるTalendは、この課題解決に向けて多様なソースからデータを集め、整備・統合するソフトウェアを提供している。
ビッグデータ統合でビジネスが変わる
~データ活用のオープンソース戦略~
経営者が「知りたいこと」は、現在の実力(最も売れている商品)、将来性(今後、売り上げが伸びる商品)、確実性(何かがあると必ず売れる商品)、着実性・安定性(いつも一定して売れる商品)、一過性・断続性(時々よく売れる商品)の5つに集約される。
売上高で年率128%の急成長を遂げているオープンソース企業のTalendは、「ビッグデータインテグレーション」によってこのニーズに応え、データに基づいた経営(データドリブン経営)を支援・実現していくことをミッションに事業を展開している。
同社マーケティングディレクターである寺澤慎祐氏は、そこで核となるデータ統合について「データの収集から意思決定までのプロセスを、次の一手までつなげてオートメーション化する技術」と定義すると共に、次の3つのキーワードを示した。
第1は「リアルタイム」で、スナップショット(静的)データだけでなく、ストリームされるリアルタイムなデータも統合の対象とする。第2は「プログラマブル」であること。すなわち、データ統合にまつわる分析、ビジネスルール、モデル、アルゴリズムをすべてプログラミング可能とする。第3は「オートメーション」。第2のプロセスから得た情報をインテリジェンスに変換し、さらに次のシステムに渡し、あらかじめ決められたアクションを適宜実行する。
多種多様なデータソースとつなぐ500以上のコンポーネントを提供
Talendは、データおよびアプリケーションの統合からテスト、デプロイまで一連の管理を担うGUIベースの開発環境として「Talend Studio」を提供している。ここからノンプログラミングで生成されたJARファイルによって、多様なデータソースからのインプットならびに、多様なシステムへのアウトプットをコントロールする仕組みだ。
「Talend Studioで生成されたJARファイルは、JREやMapReduceはもちろん、業界初で唯一、Talendが対応した「YARN」上でもネイティブに動作し、データ統合エンジン、データクレンジング、ビッグデータインテグレーションを、分散環境において圧倒的なスピードで実行できる」と寺澤氏は強調する。
ちなみにYARNとは、Hadoopを構成するMapReduceとHDFSの間に入る汎用的なフレームワークである。これにより、MapReduceに準拠していないデータモデルも対象とした、幅広いアプリケーションをHadoop上で実行することが可能となった。さらに、従来のMapReduceで利用できる分散サーバーのノード数が4000程度だったのに対して、YARNは約1万にまでノードを拡大できる。
データの取り扱いもシンプルになる。「高速な分散処理技術としてHadoopへの期待が高まっているが、MapReduceを使えるエンジニアはまだまだ不足しているのが実情。Talendは、Hadoopのほか各種のNoSQLデータベース、各ベンダーの分散処理技術など、先進テクノロジーを容易に活用できるAPIを提供する」(寺澤氏)。
ここで活きてくるのが、同社がOSSをベースに推進しているオープンビジネス戦略だ。Talendならびにコミュニティで開発された各種データソースを扱うコンポーネントは500以上を数える。今後登場してくるデータソースについても、即座にコンポーネントが開発され、オープンソースとして提供される。
様々なシステムの構成図や概念図、フローチャートを記述する際、モジュール間を「矢印」でつなぐのが通例。「Talendは、まさにその部分にフォーカスした『矢印ベンダー』として、ビッグデータインテグレーションを支援していく」と寺澤氏は締めくくった。
問い合わせ先
Talend株式会社
http://jp.talend.com/
- データ活用に取り組む企業や自治体の最前線に迫る(2014/05/12)
- 情報アーキテクチャに目を向け、全社を挙げたコラボレーションと業務に沿った情報共有の実現を(2014/05/12)
- データを経営資源として統合管理し最大限に活用するための最適解とは(2014/05/12)
- リアルタイムなビッグデータ活用を実現するSAP HANAテクノロジー(2014/05/12)
- 多種多様で膨大なデータの解析をクラウドサービスで身近なものに(2014/05/12)