データマネジメント データマネジメント記事一覧へ

[Sponsored]

[データマネジメント2026]

AI対応のデータ基盤「レイクハウスアーキテクチャ」が、ビジネス成長を加速させる鍵に

2026年6月3日(水)

データ活用がAIを前提としたフェーズに移行しつつある現在、データレイクとDWHからなる2層アーキテクチャの限界が見えてきた。2026年3月11日に開催された「データマネジメント2026」(主催:日本データマネジメント・コンソーシアム〈JDMC〉、インプレス)のセッションに、データブリックス・ジャパン エンタープライズ第四営業部 部長 窪田正典氏とフィールドエンジニアリング エンタープライズ第四ソリューション部 兼 エンタープライズ第六ソリューション部 部長 石橋慶範氏が登壇し、データエンジニアリング、BI、生成AI/LLMを1つのデータ分析基盤で開発・運用するメリットを解説した。
提供:データブリックス・ジャパン株式会社

AI時代、データのサイロ化が取り返しのつかないビジネスリスクに

データブリックス・ジャパン株式会社 エンタープライズ第四営業部 部長 窪田正典氏

 2023年11月に生成AIが登場してから2年以上が経過し、AI活用は次のフェーズに入っている。新たなフェーズでポイントになっているのが収益性だ。窪田氏は「『儲かるのか』『稼げるのか』という話です。これから生成AIやAIエージェントをどう使い、ROIをいかに証明していくかが問われています」と指摘し、次のように述べた。

 「AIのパイロット利用のなかで利益を生んでいるプロジェクトは5%にとどまります。また、ある程度利益を出しているトップパフォーマーと呼ばれる企業の割合は6%。さらに、AIの全社活用を進めている企業も10%です。ROIの観点でみると、まだまだ黎明期です」(窪田氏)

 生成AIでROIを高めていくためにはデータを生成AIで活用できるように整備していくことが重要だ。逆に、データがAI-Readyでない場合、さまざまなリスクを抱えることになる。窪田氏はその実例として、コールセンター業務にAIエージェントを導入した結果、顧客からの信頼を失ったケースを紹介した。

 この企業では、顧客が「広告メールは送ってこないでほしい」と事前に回答していたにもかかわらず、AIエージェントの導入時にコールセンターの生ログを検索対象としなかったため顧客の意向が無視され、広告メールが配信されクレームにつながったという(図1)。

 「このケースでは、AIエージェントが顧客とのやりとりや事象に関する完全なコンテキストを持てず、誤った回答をしました。その結果、取り返しのつかないビジネスリスクにつながったのです。システム的にみると、データ基盤が2層アーキテクチャになっていることが背景にあります。このアーキテクチャでは、データレイクに生データを蓄積し、加工してデータウェアハウス(DWH)に渡してから分析します。正しいデータが分断(サイロ化)され、エージェントが不完全な情報に基づいて行動してしまったのです」(窪田氏)

 こうした2層アーキテクチャは、従来型のデータ分析基盤で広く採用されてきたものだ。AI時代には、2層アーキテクチャがさまざまなビジネスリスクを生むことになると窪田氏は強調する。

図1:AIエージェントが顧客を正しく理解できないことで、顧客からのクレームにつながる
拡大画像表示

AI-Ready Dataの5つの柱とそれを実現するレイクハウスアーキテクチャ

 ビジネスリスクにつながる2層アーキテクチャのシステム課題はいくつかある。

 まずは、鮮度の喪失だ。データをデータレイクやDWHに移動させるたびにラグが発生する。ラグは数時間から数日に及ぶこともあり、ビジネス上のリアルタイム性も喪失させてしまう。

 また、膨大なETL処理に伴うコストも課題だ。データを異なる場所にコピーする必要があり、それがストレージコストを増加させる。データのエンジニアリングにはデータパイプラインの維持管理やそれを担うエンジニアの工数もかかる。

 さらに、ガバナンスも大きな課題だ。データをコピーするたびにアクセス権管理や監査が必要になる。個人PCやローカル環境へのダウンロードなどにセキュリティ面から対応する必要もある。

 では、こうした課題を解消しながら、AI-Readyなデータを整備していくには、どのような取り組みを進めればよいのか。窪田氏はデータ基盤構築のポイントとして「AIエージェントがデータを理解し、自律的に利用できる状態にすること」を挙げながら、5つの柱で構築することを提案した(図2)。

 「1つ目は、統合性です。あらゆるデータを同じところで扱えるプラットフォームにすることが重要です。2つ目は、コンテキストです。データが持っている文脈を正しくAIに渡せる基盤が必要です。3つ目はガバナンス。データが生まれるところからAIで活用するところまで統合的に管理することが重要です。4つ目は鮮度です。データのリアルタイム性を担保します。5つ目はオープン性です。1つのテクノロジーに依存するのではなく、オープンな技術を採用します。こうした5つの柱を実現し、AI-Ready Dataに最適なデータ基盤のアーキテクチャが『レイクハウスアーキテクチャ』です」(窪田氏)

図2:AIエージェントがデータを理解できるようデータ基盤を再整備する必要がある図2:レイクハウスアーキテクチャ
拡大画像表示

 レイクハウスアーキテクチャは、DWHの信頼性とスピード、データレイクの拡張性と柔軟性を両立させたアーキテクチャだ。データを1箇所にまとめ、SSOT(Single Source of Truth)を実現し、あらゆるユースケースに対応しながら、オープンなテクノロジーを採用する基盤だ。

ストレージ層からAIエージェント活用まで一気通貫で提供

 レイクハウスアーキテクチャは2020年にDatabricksが提唱した概念だ。概念をまとめた論文は幅広く閲覧され、その概念を実装したソリューションも2023年までにグローバル企業73%に導入されるまでに普及した。Databricksはその後、ガバナンス機能や生成AIを利用して、データ分析機能、エージェント開発ツール、AIエージェント向けデータベースを開発、提供してきた。

 窪田氏に続いて登壇した石橋氏は、Databricksが現在提供しているソリューションの全体像を解説した。

データブリックス・ジャパン株式会社 フィールドエンジニアリング エンタープライズ第四ソリューション部 兼 エンタープライズ第六ソリューション部 部長 石橋慶範氏

 Databricksが提供する機能は大きく3つに分かれる(図3)。データにもっとも近い層となるのが、データ統合のためのストレージ層だ。

図3:データ管理からAI活用までをカバーするDatabricksの全体像
拡大画像表示

 「データブリックスでは、PostgresやDELTA LAKE、Icebergなどのテクノロジーを用いて、データをオープンなかたちで保持します。企業が持つデータを1つにまとめ、そのうえでUnity Catalogの機能で、データへのアクセス権限やメタデータ付与などを適切に行い、ガバナンスを効かせます。ガバナンスの効いたデータは、データの取り込み機能やETL機能を提供するLakeflow、DWH機能のLakehouse、オンラインアクセスが可能なOLTPデータベースLakebaseで処理します」(石橋氏)

 ストレージ層の上は、コンテキスト理解などを行うエージェントによる支援層だ。

 「エージェントによる支援層では、データのコンテキストを維持して自社データを専門的に扱えるエージェント機能としてGenieを提供しています。データの中身を見ることで、例えば、売上が下がったときの要因分析から必要なアクションまでをエージェントが自律的に計画し、実行します。データの分析だけでなく、エージェントによるコード作成機能も提供しています」(石橋氏)

 こうしたデータの蓄積・統合とGenieによるコンテキスト理解をしたうえで、さらにAI活用を推進するための層としてAIエージェント活用層がある。この層では、AIエージェントを社内外に提供するための機能であるAgent Bricks、BIやダッシュボードを提供するAI/BI、カスタムアプリ機能などがある。

分析して蓄積された知見がAIのインタフェースになるアーキテクチャ

 Databricksが提供する機能のうち、AI活用の面で重要になる機能の1つがUnity Catalogだ。Unity Catalogを利用することで、データのアクセスコントロールやデータ共有、ガバナンス、データリネージ(データの来歴管理)、コスト管理などが可能になる。実際に、Unity Catalog上で多様なデータソースをまとめて管理しながら、メタデータを含めてデータカタログを作成し、活用する様子がデモで示された。

 また、Lakebaseは、AIエージェント向けに設計されたトランザクション処理用データベースだ。PostgreSQLベースで構築されたオープンなデータベースで、1秒未満での起動や使用した分だけの支払い、コンピューティングとストレージの分離といった特徴がある。

 例えば、DWHとデータレイクの機能をLakehouseで統合しながら、Lakehouseに蓄積したデータをLakebaseから利用できるようにすることで、アプリケーションやAIエージェントがデータを即座にオンラインで利用できるようになる。

 そのうえで石橋氏は、AI時代においては、データガバナンスとデータアクセスが重要になるとし、次のように訴え、講演を締めくくった。

 「これからのAI-Readyなデータ基盤に重要なポイントは、社内外に散在するデータを統合し、一元的に扱えるデータ統合基盤で、ビジネスセマンティクス、データのライフサイクル全体にわたってガバナンスを効かせていくことです。また、AIがデータアクセスの主体となる世界では、人間だけが使うことを前提にした分析結果を、アプリケーションやAIエージェントから即座に利用できる状態にしておくことが重要です。『分析して終わり』ではなく、『分析して蓄積された知見がそのままAIにとってのインタフェースとなる』アーキテクチャこそが、変化の激しいビジネス環境において、価値を生み出し続けるカギなのです」(石橋氏)


●お問い合わせ先

データブリックス・ジャパン株式会社

URL: https://databricks.com/jp/

バックナンバー
データマネジメント2026一覧へ
関連キーワード

Databricks / DWH / データレイク

関連記事

トピックス

[Sponsored]

AI対応のデータ基盤「レイクハウスアーキテクチャ」が、ビジネス成長を加速させる鍵にデータ活用がAIを前提としたフェーズに移行しつつある現在、データレイクとDWHからなる2層アーキテクチャの限界が見えてきた。2026年3月11日に開催された「データマネジメント2026」(主催:日本データマネジメント・コンソーシアム〈JDMC〉、インプレス)のセッションに、データブリックス・ジャパン エンタープライズ第四営業部 部長 窪田正典氏とフィールドエンジニアリング エンタープライズ第四ソリューション部 兼 エンタープライズ第六ソリューション部 部長 石橋慶範氏が登壇し、データエンジニアリング、BI、生成AI/LLMを1つのデータ分析基盤で開発・運用するメリットを解説した。
提供:データブリックス・ジャパン株式会社

PAGE TOP