[データ駆動型社会を支える「データスペース」の実像─ハンズオンで理解するその価値と可能性]
日本で開発されたデータスペース構築用システム「CADDE」を使ってみよう:第4回
2024年9月25日(水)清家 大嗣(東京大学大学院情報学環 特任助教)
ビジネスの高度化はもちろん、社会運営にとってもデータ活用の重要性は論を俟たない。一方で、データがサイロ化しシステムや組織内で留まっていては、その真価は発揮されない。データを十全に生かすには、信頼性を担保しながら組織や国境を越えて共有・連携するためのプラットフォーム、すなわち「データスペース」が必要となる。第4回となる今回は、東京大学大学院情報学環 特任助教の清家大嗣氏が、日本で開発されたデータスペース実現のためのアーキテクチャ「CADDE(ジャッデ)」の全体像や機能、東京大学が運用するテストベッド環境における実証実験について解説する。
本連載の第1回、第2回ではデータスペースの概念を紹介し、欧州連合を中心とした世界および日本でのデータ活用の潮流や、データスペース実現に向けた動向を紹介しました。第3回ではデータスペース技術の研究開発および実証実験環境である「東京大学データスペース技術国際テストベッド(International Testbed of Dataspace Technology:ITDT)」に触れ、データスペースの社会実装に対する期待の高まりについてお伝えしました。
今回は「CADDE(ジャッデ)」と呼ばれるデータスペース実現のためのアーキテクチャにフォーカスし、データスペースを実際に構築・利用する方法を解説します。
データスペース実現に向けた日本発のアーキテクチャ「CADDE(ジャッデ)」
CADDEは、“Connector Architecture for Decentralized Data Exchange(分散型データ交換のためのコネクタアーキテクチャ)”の略称です。内閣府の戦略的イノベーション創造プログラム(SIP)第2期の課題「ビッグデータ・AIを活用したサイバー空間基盤技術」により得られた成果です。
CADDEを構成する各種ソフトウェアのプログラムや利用方法はGitHub上のソースコードドキュメントとして確認できます。公開されているCADDEの最新バージョンは4.0であり、現在は一般社団法人データ推進協議会(DSA)により開発が継続的に行われています。
CADDEは分野を超えたデータの発見・利用を可能にする仕組みの構築を目的としており、図1に示されるようなツール・サービス機能を提供することで、データ提供者と利用者間のデータ交換を可能にします。
拡大画像表示
CADDEを構成するコンポーネント
CADDEは、データの交換、発見、変換など、データ活用の一連のフェーズで必要とされる機能を担う複数のコンポーネントを提供しています。以下では、CADDEを構成するコンポーネントを紹介します。
①コネクタ
データ交換基盤を構築する場合、最も重要なコンポーネントの1つはコネクタ(Connector)です。
データ駆動型社会では、さまざまなデータ連携基盤が相互に接続しながら、協調動作することが予想されます。そのような状況に対応するため、コネクタはデータ取引に関する多くのエンドポイントをAPIとして公開し、他のサービスとの相互運用性を高めています。CADDEコネクタは、データ交換・検索、データ取引に関するログの取得・登録といった機能をREST APIで提供しています。
なお、CADDEユーザーは以下に紹介する横断検索、来歴管理、認証、認可などの機能を持つコンポーネントを、コネクタを介して利用します。
②横断検索
CADDEシステムのデータ提供者は、「CKAN」と呼ばれるオープンソースソフトウェア(OSS)を用いてデータカタログを作成します。データカタログからメタデータを抽出し、まとめたものが連合データカタログ(Federated Data Catalog)です。
メタデータは、データセット名、その要約、URI(Uniform Resource Identifier)などの情報を含んでおり、データ利用者は連合データカタログにおいて、横断検索を用いて必要とするデータを探します。
③来歴管理
来歴管理機能では、データ取引の記録をログとして保存します。CADDEではOSSのブロックチェーンフレームワークである「Hyperledger Ledger Fabric」を用いて、登録されるログデータの完全性を保証します。
④IDプロバイダーと認証
データスペースでは、信頼できるデータ交換を実施するためにユーザー認証を実施します。CADDEも同様に、ユーザー登録するためのIDプロバイダーとユーザーを認証するための仕組みを持っています。
具体的には、OSSの「Keycloak」を用いて、SSO(Single Sign On)のための認証プロトコル「OpenID Connect」に基づき、各種アプリケーションのログインを行っています。
コネクタの利用にも認証が必要不可欠です。CADDEユーザーIDとパスワードによるSSOにより、WebApp、来歴管理、カタログ検索といったさまざまなサービスが利用可能になります。
⑤データアクセスの認可
CADDEでは、データ提供者のデータは、Google DriveなどのクラウドストレージサービスやNASなどのファイルサーバーに保存されます。データ提供者は自身で認可サーバーを運用し、特定のCADDEユーザーに限定して、データのダウンロード権限を付与することが可能です。
この認可機能も、上述のKeycloakを用いて実装されています。これは、自身に関するデータは自ら管理するというデータ主権(Data Sovereignty)の一例と言えるでしょう。
●Next:テストベッド上でデータスペースを動かすには
会員登録(無料)が必要です
- 1
- 2
- 次へ >
- CADDEを動かしてデータスペースを体験しよう[後編]:第6回(2024/10/09)
- CADDEを動かしてデータスペースを体験しよう[前編]:第5回(2024/10/02)
- いますぐデータスペースを試してみよう─東京大学データスペース技術国際テストベッド:第3回(2024/09/18)
- 次代を担うデータ基盤「データスペース」とそのテクノロジー[後編]:第2回(2024/09/11)
- 次代を担うデータ基盤「データスペース」とそのテクノロジー[前編]:第1回(2024/08/28)