日本IBMは2015年7月8日、ビッグデータ管理・分析ソフトウェアの新版「IBM BigInsights for Apache Hadoop V4.1」を同月より提供開始すると発表した。新版では、ベースの分散処理プラットフォームであるApache Hadoopに加えて、高速処理や多目的対応などを特徴とするApache Sparkが利用可能になっている。
ビッグデータ=大量・多種・高生成頻度のデータを常に遅延なく処理したり、高度な分析を行ってビジネス価値に転換したりといったデータ管理・分析への取り組みは、今日の企業にとって重要な課題である。ビッグデータ活用の機運上昇に伴い、Hadoopベースの高速・高度なビッグデータ分析/管理基盤の活用を検討する企業が増えているが、Hadoopのようなオープンソースプロジェクトを扱うスキル・ノウハウの不足から、導入に二の足を踏むところもまた多い。
IBM BigInsights for Apache Hadoopは、そうした企業がHadoopベースのデータ管理・分析基盤を容易に導入しビジネスに活用できるようにすることを目指した製品だ。今回リリースされた新版では、新たな分析エンジンとして、インメモリでの高速処理や多目的対応などを特徴とするApache Sparkを利用できるようになった。2015年6月に米IBMが発表した、Sparkへの包括的なイニシアチブの一環と位置づけられる(関連記事:ポストHadoopと呼ばれる「Apache Spark」にブレークの兆し)。
同製品の価格は21万6200円(税別)からで、ユーザーの用途に応じたパッケージが提供される。各パッケージの概要は以下のとおりだ。
IBM BigInsights for Apache Hadoop:ビッグデータ管理・分析機能の基盤ソフトウェアで、最新のオープンソースコンポーネントで構成される。
IBM BigInsights Data Scientist Module:データサイエンティスト業務に必要な分析機能としてIBMの「Big R」(R言語による統計分析/モデリング)、「Big SQL」(Hadoopデータ分析)、「BigSheet」(表計算ソフトライクなUIでのMapReduce処理)、機械学習機能、テキスト分析機能を利用可能にするモジュール。
IBM BigInsights Analyst Module:Big SQL、BigSheetsを利用可能にするモジュール。
IBM BigInsights Enterprise Management Module:Hadoop環境の運用管理機能を提供するモジュール。
IBM BigInsights Quick Start Edition:IBM BigInsights Data Scientist Moduleに備わる一部管理機能を除いた機能を提供する無料エディション(IBMの有料サポートは提供されず、利用環境に制限がある)。
IBM Open Platform with Apache Hadoop:オープンソースのApache Hadoopディストリビューション。Sparkを含むIBMの「Open Data Platform(ODP)イニシアチブ」の最新の成果を利用できるようにする(IBM有料サポートはオプションとして提供)
拡大画像表示