データマネジメント データマネジメント記事一覧へ

[データ駆動型社会を支える「データスペース」の実像─ハンズオンで理解するその価値と可能性]

欧州発のデータスペースの動向とOSSプロジェクトの最前線:第7回

2024年10月16日(水)角井 健太郎、土橋 昌、八木 拓馬、渡邊 凜太郎(NTTデータグループ 技術革新統括本部)

ビジネスの高度化はもちろん、社会運営にとってもデータ活用の重要性は論を俟たない。一方で、データがサイロ化しシステムや組織内で留まっていては、その真価は発揮されない。データを十全に生かすには、信頼性を担保しながら組織や国境を越えて共有・連携するためのプラットフォーム、すなわち「データスペース」が必要となる。第7回となる今回からは、欧州を中心に活用が進むデータスペース構築用フレームワーク「Eclipse Dataspace Components(EDC)」にフォーカスする。本稿では、欧州においてデータスペースという概念が発展してきた経緯を整理した上で、EDCおよび関連するデータスペース領域のプロジェクトの概要を解説する。

Eclipse Foundationが運営するデータスペース関連プロジェクト

 本連載でフォーカスするEclipse Dataspace Components(EDC)は、さまざまなオープンソースプロジェクトを運営する欧州の非営利団体、Eclipse Foundation(エクリプスファウンデーション)を中心に開発が進められています。

 Eclipse Foundationは、もともとIDE(Integrated Development Environment:統合開発環境)である「Eclipse」の開発をオープンソースソフトウェア(OSS)コミュニティの下で行うために発足しましたが、現在ではIDEに留まらず、エッジコンピューティング/IoTや自動車業界向けソフトウェアのプロジェクトも傘下に置くなど、幅広い領域を取り扱うようになっています。現在では、本連載で紹介するEDC以外にもデータスペース関連のプロジェクトがいくつか含まれています。

 Eclipse Foundation傘下でデータスペース関連のコンポーネントが開発されることの意義はいくつか考えられます。例えばコミュニティの知名度の高さから各プロジェクトの宣伝・広報的な効果が期待でき、研究者・開発者の注目を集めやすいことが挙げられます。確立されたガバナンスの下で安定的、持続的なプロジェクト運営が行われていることも重要です。以下では、Eclipse Foundationにおけるデータスペース関連のプロジェクトをいくつか紹介します。

Eclipse Dataspace Protocol

 Eclipse Dataspace Protocolは当初、IDSのデータスペース参加者コネクタ間プロトコルとして策定されました。IDSAは同プロトコルの仕様をEclipse Foundationへ寄贈し、現在ではIDSAに加えてEclipse Dataspace Working Groupに所属する開発者が開発を進めています。データスペースのプロトコルとコネクタ等の関連技術の開発が同じコミュニティの傘下で行われることで、より一層のシナジーが期待されます。実際に筆者が参画するIDSAやEclipse Foundationのワーキングにおいても、両コミュニティの利用者・開発者が議論しているさまをたびたび見かけます。

Eclipse Dataspace Components

 Eclipse Dataspace Componentsは当初、「Eclipse Dataspace Connector」という名称で、データスペースのコネクタを中心に開発が行われていました。しかし、データスペースの実装・運用にはコネクタだけでなく、他のコンポーネントも必要です。そこでEDCは現在の名称に改めると共に、さまざまなコンポーネント/機能を拡充しました(※45)。

 現在、コネクタはEDC Connectorとも呼ばれ、コンポーネントのひとつとして「Connector」というソースコードリポジトリで管理されており、本連載の第8回以降で、主にこのEDC Connectorについて解説します。

 なお、EDC Connectorの他には、データスペースへの参加者の証明書を管理するEDC Identity Hubや、データスペースの参加者の提供データをまとめて管理するEDC Federated Catalog、データスペースを最小構成で構築し試すことができるEDC Minimum Variable Dataspace(MVD)などが提供されています。

Eclipse Tractus-X

 「Catena-X」というイニシアティブはご存じでしょうか。自動車業界を中心としたバリューチェーン向上のためにデータチェーンを形成するオープンデータエコシステムの実現を目指す取り組みであり、Catena-X Associationの傘下では様々な企業・組織が連携し、データスペースに関連するルールや標準の策定、コミュニティ形成を行っています。Eclipse Tractus-Xは、Catena-Xの正式なオープンソースプロジェクトであり、上述のEDCも用いて開発されています。

安全なデータ共有をシステマチックに実現する「EDC Connector」

 EDC Connectorは、データ交換や統合を安全かつ効率的に行うためのオープンソースフレームワークです。上述のとおり、EDCプロジェクトの一部として存在し、企業間でデータを共有する際の言わばエージェントソフトウェアとして、データ所有者・提供者のデータ主権保護のためのシステマチックな手続きや管理などの重要な機能を提供します。

 例えば、データの所有者・提供者は、実社会における非デジタルの契約手続きのように、コネクタを介したデータ共有を利用条件の提示・合意を伴って段階的に進めることが可能です。これにより、データ仕様の開示、合意形成、実際のデータ共有に至るまで、一貫してシステマチックに、データの不正利用の可能性を技術的に低減しつつ進めることができます。より信頼性の高いデータ共有モデルの実現が、結果的にデータ共有を伴うデータ活用を促進し、データ価値の高いエコシステムを実現することに寄与します。

 EDC Connectorにおけるデータ共有の合意形成方法として特徴的なのは、ODRL(Open Digital Rights Language)形式のポリシーを用いた契約提示・調整・合意形成の機能です。これらの機能がデータ共有のシーケンスの中に組み込まれていることで、一定の柔軟性(契約内容の表現力)を実現しつつ、システムによる厳密な処理を可能にしています。

 システムで処理できる仕組みとして実現することで、機械的なテストも容易になるので、最終的によりセキュアな仕組みを実現するのにも役立ちます。なお、実際にはODRL形式の言わば「機械可読な契約書」は、非技術者にとってはやや読みづらいと思われます。世の中に広く使われていくためには、使い勝手を良くするための周辺技術の改善や機能追加が重要になるでしょう。

 注意すべき点は、EDC Connector自体は基礎的な機能を提供するためのフレームワークであり、Catena-Xのように実用的なデータスペースを実現する際にはユースケースに合わせた追加開発が必要となることです。ただ、開発者向けの詳細なドキュメントや基礎的なシナリオに対応した複数のサンプルが提供されており、初学者も試すことができます。

 上述のEclipse Tractus-Xのように、すでに一部のユースケースで実用化されていることから、今後は開発に必要な情報が増えていくことが期待できます。また、次回以降で紹介しますが、アーキテクチャが拡張性に富んでいるため、特定のユースケース/クラウドプロバイダーに対応するための拡張機能を実装できます。すでに世の中にOSSとして公開されているものもあります。

 このように、EDC Connectorは高度な柔軟性や拡張性を実現しながら、基礎となる企業間のデータ共有をシステマチックに容易かつ効率的に進めるための機能を提供するフレームワークとなっています。次回からは、EDC Connectorのアーキテクチャを紹介しながら実際に利用してデータを共有する方法をご紹介します。

[参考文献]
※4:Eclipse Dataspace Connector becomes Eclipse Dataspace Components #5, Eclipse Dataspace Components(https://github.com/orgs/eclipse-edc/discussions/5
※5:データスペース技術動向~Eclipse Dataspace Components(EDC)とDataspace Protocol~, DATA INSIGHT, 岩崎 正剛、土橋 昌(https://www.nttdata.com/jp/ja/trends/data-insight/2023/1030/

●Next:欧州を中心としたグローバルな開発コミュニティへの参画

この記事の続きをお読みいただくには、
会員登録(無料)が必要です
  • 1
  • 2
  • 3
バックナンバー
データ駆動型社会を支える「データスペース」の実像─ハンズオンで理解するその価値と可能性一覧へ
関連キーワード

データスペース / データ連携 / EDC / 欧州 / Catena-X / GAIA-X / R&D / データ活用基盤 / NTTデータ / EU / ドイツ / データ流通 / Eclipse

関連記事

トピックス

[Sponsored]

欧州発のデータスペースの動向とOSSプロジェクトの最前線:第7回 [ 2/3 ] ビジネスの高度化はもちろん、社会運営にとってもデータ活用の重要性は論を俟たない。一方で、データがサイロ化しシステムや組織内で留まっていては、その真価は発揮されない。データを十全に生かすには、信頼性を担保しながら組織や国境を越えて共有・連携するためのプラットフォーム、すなわち「データスペース」が必要となる。第7回となる今回からは、欧州を中心に活用が進むデータスペース構築用フレームワーク「Eclipse Dataspace Components(EDC)」にフォーカスする。本稿では、欧州においてデータスペースという概念が発展してきた経緯を整理した上で、EDCおよび関連するデータスペース領域のプロジェクトの概要を解説する。

PAGE TOP