Hadoopディストリビューターの米Clouderaは2015年9月30日、Hadoopでのリアルタイム処理に向けたストレージエンジン「Kudu(クドゥ)」のパブリックベータを発表した。低遅延のランダムアクセスや高いスループットの分析を可能にする。
「Kudu(クドゥ)」は、カラムナ(列指向)型のデータストア。Hadoopアーキテクチャーのリアルタイム処理性能を高めるために、既存のHDFSとHBaseの両機能を補完し、並列高速インサートやアップデート、効率的なカラムナ(列指向)検索を可能にする。
Hadoopのネイティブコンポーネントとして動作し、分析フレームワークと連動する。1つのストレージ階層でリアルタイムな分析処理を実行できるため、複雑なアーキテクチャーを構成する必要がない。時系列分析やマシンデータ分析、オンラインレポーティングといったアプリケーションの開発効率を高められる。
Kuduは、米Intelと共同開発した。Intelの不揮発性メモリープロジェクトで開発した技術を使って設計されている。最新のCPU性能や、RAMやフラッシュの優位性を活かしたインメモリー処理などにより、I/O効率を高めている。
Kuduのパブリックベータは、Apacheオープンソースライセンスとして提供が始まっている。将来的にはApacheソフトウェア財団のインキュベータ・プロジェクトに移される予定である。