NTTデータは2011年6月2日、Hadoopの商用ディストリビューション「Cloudera's Distribution including Apache Hadoop v3(CDH3)」を提供開始する。パッケージには、Hadoopの導入を支援するソフトウエア群とサポート・サービスが含まれる。価格は1ノードあたり年額25万円(税別)で、5ノード以上で販売する。
CDH3は、米Clouderaが作成した、Hadoopの配布パッケージ。Hadoopを使ったアプリケーション開発で用いる代表的なオープン・ソース群を含むほか、インストール・パッケージ(RPM形式)の提供やGUIベースの独自の運用管理ソフトなど、Hadoopの導入や設定を簡単に行えるようにする仕組みを提供する。無料版に加えて、有料サポートを含む商用版を用意している。
NTTデータは今回、CDH3の商用ディストリビューションを、NTTデータがソフトウエアをサポートするかたちで国内で販売する。CDH3に含まれる主なソフトは、以下の通り。
- Hadoop(分散バッチ処理ソフト)
- HBase(分散データベース)
- Hive(SQLでHadoopに問い合わせられるようにするツール)
- Pig(上位プログラミング言語)
- Zookeeper(分散処理の信頼性を高めるツール)
- Whirr(クラウド連携用ライブラリ)
- Flume(ログや各種データをHadoopに効率的に取り込むツール)
- Hue(WebブラウザのGUIでHadoopを管理/操作するツール)
- Oozie(hadoop処理用のワークフロー・エンジン)
- Sqoop(RDBMSのデータをHadoopにインポート・エクスポートするツール)