[市場動向]
データの場所を問わないデータファブリックを提供─AI/データ統合基盤に舵を切ったCloudera
2025年12月5日(金)日川 佳三、河原 潤(IT Leaders編集部)
米Cloudera日本法人は2025年12月4日、都内で説明会を開き、データ分析プラットフォームベンダーとしての立ち位置や最近の製品強化、今後のロードマップを説明した。データの場所を問わないデータファブリックの提供を主眼に、2024年末にメタデータを自動収集してデータの流れを可視化するOctopaiを買収。2025年にAIシステムの開発・実行機能群をラインアップに追加したほか、Kubernetes管理ツールのTaikunを手中にしている。2026年にはTaikunのコンテナ運用基盤を用いて、オンプレミス/クラウドに分かれていた製品群を統合する。
写真1:Cloudera リージョナル・バイスプレジデント兼カントリーマネージャー/社長執行役員の山賀裕二氏拡大画像表示
Cloudera(クラウデラ)は、2008年に米サンマテオ郡で創業したソフトウェアベンダー。オープンソースソフトウェア(OSS)技術を基盤に、Apache Hadoopディストリビューションの提供によって成長を遂げた(関連記事:米Clouderaと米Hortonworksの合併が完了、幅広い製品・サービスを提供可能に)。
今やHadoopだけの会社ではなく、「現在はAIとデータの統合プラットフォームを提供している」と、Clouderaでリージョナル・バイスプレジデント(RVP)兼カントリーマネージャー/社長執行役員を務める山賀裕二氏(写真1)は述べ、近年の施策や機能強化点を紹介した。
1つが、2024年11月に発表した、イスラエルのソフトウェアベンダーOctopai(オクトパイ)の買収。メタデータを自動収集し、データの発生源から活用先までの流れを追跡・可視化するデータカタログ製品を手中にした。
Clouderaは、場所を問わすに各種データを活用する「Unified Data Fabric(統合データファブリック)」アーキテクチャの主要な構成要素の1つとしてOctopaiを位置づけている(図1)。
図1:場所を問わすに各種データを活用する機能「Unified Data Fabric」の概要(出典:Cloudera)拡大画像表示
Unified Data Fabricの中核にある「Trino(旧名称:Presto)」は、複数のデータソースにまたがる仮想データセットに対して問い合わせる分散クエリーエンジンである。データを移動させることなく、データが保存してある場所でクエリーを実行する。データウェアハウスや各種RDB、NoSQL、Apache Iceberg形式テーブルなど各種データソースにアクセスできる。
●Next:NiFi、Kafka、Flinkがデータをリアルタイムに処理
会員登録(無料)が必要です
- 1
- 2
- 次へ >
Cloudera / データファブリック / データレイク / DWH / Apache / Iceberg / Spark / Kafka / M&A / アナリティクス / 生成AI / 大規模言語モデル



































