[新製品・サービス]
「エンタープライズに必要なのはSQLとの互換性」、IBM版Hadoop「InfoSphere BigInsights」の姿
2014年8月11日(月)五味 明子(ITジャーナリスト/IT Leaders編集委員)
「Hadoopは何でもできる道具だとよく言われる。しかし、何でもできる道具は実際には使いどころに困るものだ。Hadoopも、その自由さゆえの不自由さに縛られている。一部のトップノッチなユーザー中心の利用にとどまっている理由がここにある」−−。2014年 8月7日、日本IBMが開催した報道関係者向け説明会で、同社ソフトウェア事業 インフォメーション・マネジメント事業部BigData Technical Salesの一志 達也 氏は、こう指摘した。そして、こうした現状に対するIBMの回答が、「IBM InfoSphere BigInsights」だという。Hadoop市場に対し、IBMはどんな戦略を掲げているのだろうか。
拡大画像表示
Hadoopは、非構造化データを含む様々なタイプのデータを大量に並列分散処理できるOSS(Open Source Software:オープンソースソフトウェア)のシステムとして、この10年で大幅に普及した。だが、その知名度の高さとは裏腹に「Hadoopは現在、大きな転換点を迎えている」と、一志氏は強調する(写真1)。
具体的には、分析すべき非構造化データが増大したといっても、企業、なかでも大手企業においては、ログデータやソーシャルデータ、あるいは既存の業務システムに格納されたExeclやメールなどテキストを中心としたデータであり、これらをHadoop上で汎用的なSQLを使って扱いたい。にもかわからず、「現在のHadoopは、一般ユーザーには敷居が高く、パフォーマンスやセキュリティの面でエンタープライズレベルに達していない」(一志氏)という。
こうした状況に対し、IBMが用意するHadoopソリューションが「IBM InfoSphere BigInsights(以下、BigInsights)」だ。日本企業の事例は少ないが、グローバルでは、通信や金融、製造、メディアといった業界に顧客を持ち、ドイツテレコムやUBS、ニールセンといった名前が挙がる。2014年6月に最新バージョンの3.0がリリースされた。
一志氏は「『IBMがHadoop?』と疑問に思う向きもあるかもしれない。だが、IBMもHadoopにはコミットしている。これまで国内ではあまり知られていなかったが、今後は積極的にアピールしていきたい」とした。
独自ファイルシステムを持ち、SQL互換機能を開発
OSSのHadoopに対し、BigInsightsが差異化点に挙げるのは次の3つである(図1)。
拡大画像表示
(1)単一障害点(SPOF)を排した独自ファイルシステム「GPFS-FPO(General Parallel File System File Placement Optimizer)」
ファイル単位の分析処理を容易にするファイルシステム。HDFSでは、ファイルをファイルシステムにいったんアップロードする必要があるのに対し、直接Linux上のファイルにアクセスできる
(2)MapReduceをC言語で書き換え、改良を加えた独自エンジン「Adaptive MapReduce」
MapReduceの弱点とも言えるパフォーマンスの改善を図ったエンジン。一志氏によれば、「MapReduceの後継と言われる『YARN』や『SPARK』といったエンジンよりも品質面で安定している」という