NTTデータは2010年7月1日、「BizXaaS」(ビズエクサース)の「クラウド構築サービス」のラインナップとして、「Hadoop構築・運用ソリューション」の提供を同日より開始することを発表した。
「Hadoop」はオープンソースの分散処理基盤ソフトウエアで、大規模データを多数のサーバーに分散して蓄積するとともに、大量・複雑な計算を並列処理させることができるため、データを高速に処理できる。今後の利用拡大が期待される行動情報、センサー情報やライフログなどの大量データを利用したビジネスなど、新領域での活用においても注目されている。
「Hadoop環境・運用ソリューション」の特長は以下のとおり。
- 高いスケーラビリティを持つ分散処理基盤の実現
HadoopとIAサーバーを活用することにより、従来に比べて比較的低いコストで分散処理システムを導入できる。また、サーバー台数を増やすことで性能向上が可能な高いスケーラビリティを実現し、需要に応じが柔軟な設備拡張が可能。Hadoopが持つ耐障害性の仕組みに加えて、NTTデータが開発した冗長化機構を組み合わせることで、業務システムや社会基盤として求められる信頼性を実現する。 - 準定型データの分析やアドホックな分析の実現
従来のRDBMSで扱ってきた定型データだけでなく、個々にフォーマットが変動するような準定型のデータも格納・処理できる。様々なデータソースから集まってくる多様なログデータをそのまま格納しておき、処理する際にデータの意味づけを行うような処理や、ワンタイムでマーケティング分析を行うようなアドホックな処理にも向く。 - 運用コストを低減する仕組みを実現
サーバー台数が増加した場合にも、運用コストの増大を抑える仕組みを実現。ハードウエア故障時の復旧手順などを自動化するなど、人手のかかる作業や判断を最小限に抑える仕組みを持つ。 - 周辺プロダクトとの連携対応、サポート
Hadoopが持つ分散ファイルシステムHDFS (Hadoop Distributed File System) や分散処理フレームワーク「Hadoop MapReduce」はもちろん、連携して動作する「HBase」「Hive」「Pig」「Mahout」「Avro」「Sqoop」などの周辺プロダクトにも対応。また、Hadoopを動作させるために必要なLinuxやJDK (Java Development Kit) などのミドルウエアも含めたソフトウエアサポートサービスも提供される。
NTTデータ
http://www.nttdata.co.jp/