データマネジメント データマネジメント記事一覧へ

[データ駆動型社会を支える「データスペース」の実像─ハンズオンで理解するその価値と可能性]

いますぐデータスペースを試してみよう─東京大学データスペース技術国際テストベッド:第3回

2024年9月18日(水)羽多野 一磨(東京大学大学院情報学環 准教授)

ビジネスの高度化はもちろん、社会運営にとってもデータ活用の重要性は論を俟たない。一方で、データがサイロ化しシステムや組織内で留まっていては、その真価は発揮されない。データを十全に生かすには、信頼性を担保しながら組織や国境を越えて共有・連携するためのプラットフォーム、すなわち「データスペース」が必要となる。第3回となる今回は、東京大学大学院情報学環 准教授の羽多野一磨氏が、データをめぐる状況やデータスペースの必要性を整理した後、近年活発化している、日本におけるデータスペースの普及促進に向けた動きについて説明する。その中心となるのが、東京大学大学院情報学環が運用する「東京大学データスペース技術国際テストベッド」だ。

 東京大学大学院情報学環では、データスペースのテストベッドを構築し、国内外のデータスペースの構築・運用を目指す団体・個人と連携して関連技術の研究開発やユースケースの創出などを目指しています。

 本稿では、データ活用に向けた潮流や、データスペースの早期実現への期待に触れ、いち早くその技術に触れることの重要性を述べます。

データの爆発的増加

 改めて、「データ」とは何でしょうか。広辞苑には、「立論・計算の基礎となる、既知あるいは認容された事実・数値。資料。与件。」とあります。かつて、データは粘土板に刻む、紙に書くといった形で人手により収集、記録、活用されてきました。19世紀にはパンチカードが登場し、データを機械で扱えるようになり、多くの処理が可能になりました。

 そして、今日のデジタル化社会では、大量のデータをIoT機器などから容易に収集し、大規模な記憶装置に記録し、強力なコンピューティング能力で高速に処理することができるようになっています。

 2012年に発表された米IDCのレポートによれば、国際的なデジタルデータの量は、2000年に6.2EB(エクサバイト、1EBは10億GB)だったものが、2010年には988EB、2011年には1.8ZB(ゼタバイト、1ZBは1兆GB)、2020年には40ZBと急激に増えることが予測されていました(図1)。

 さらに2020年の発表では、2025年までに557億のIoTデバイスが接続され、それだけでも80ZBのデータを生成すると推定しています。このように大量のデータが生成される中、2010年代には「ビッグデータ」という言葉の下でデータ活用の検討が進められました。

図1:デジタルデータ量の増加予測(出典:総務省〈米IDCの予測に基づく〉)
拡大画像表示

 こうしてデータの量は爆発的に増え続けており、そこに秘められた価値に大きな期待が寄せられています。総務省が2020年に実施した調査によれば、2015年時点と比較して、POSデータや販売記録データなど、多くのデータの活用が進展しています。

 外部データの活用も広がっています。データを活用している企業のうち、30%程度が外部データを購入、20%程度が外部の公開データを入手、10%程度が共同研究やアライアンス等で入手していると回答しています(図2)。

図2:デジタルデータの入手元(出典:総務省)
拡大画像表示

データスペースはなぜ必要か

 では、データは円滑に流通している状況と言えるでしょうか。現状では、データの探索や入手は、基本的に組織間での個別のやり取りに基づいて行う必要があります。しかし、スムーズにデータをやり取りするには、一定のフレームワークによる統一的な取り扱いが望ましいことは明らかでしょう。

 すなわち、データをカタログ化してサイロ化を解消し、個別に相対契約で仔細を定めるのではなく、一定の共通化したやり取りの仕組みを作れば、データ流通はより活発になると考えられます。

 もちろん、単に自由にデータが流通してよいわけではありません。個人情報や企業秘密など、どの範囲まで流通させていいのか、どのように管理するのかといったフレームワークも必要になります。

 こういったことを実現するアーキテクチャがデータスペースです。データスペースは、英語にすれば Data Spacesと複数形で表記されることがよくあります。これは、単数形のData Spaceが複数あることを示唆しています。

 2021年6月に閣議決定した政府の「包括的データ戦略」では、連携基盤(ツール)、活用環境、データ連携に必要なルールを包括的/有機的に提供する基盤を意味する「プラットフォーム」が、さまざまな分野ごとに作られることを想定していますが、データスペースも同様です。各分野におけるData Spaceを Data Spacesとして連携させるために必要な共通アーキテクチャの提供は、データスペースという概念の重要な役割の1つです。共通アーキテクチャを利用したデータ流通基盤の構築により、上述したZB規模の、そして今後生み出されるさらに多くのデータの活用が促進されることになります。

●Next:企業・団体がデータスペースを試せるテストベッドを東大が提供

この記事の続きをお読みいただくには、
会員登録(無料)が必要です
  • 1
  • 2
バックナンバー
データ駆動型社会を支える「データスペース」の実像─ハンズオンで理解するその価値と可能性一覧へ
関連キーワード

データスペース / データ連携 / データ社会推進協議会 / CADDE / 東京大学 / DATA-EX / R&D / データ活用基盤 / IDSA

関連記事

トピックス

[Sponsored]

いますぐデータスペースを試してみよう─東京大学データスペース技術国際テストベッド:第3回ビジネスの高度化はもちろん、社会運営にとってもデータ活用の重要性は論を俟たない。一方で、データがサイロ化しシステムや組織内で留まっていては、その真価は発揮されない。データを十全に生かすには、信頼性を担保しながら組織や国境を越えて共有・連携するためのプラットフォーム、すなわち「データスペース」が必要となる。第3回となる今回は、東京大学大学院情報学環 准教授の羽多野一磨氏が、データをめぐる状況やデータスペースの必要性を整理した後、近年活発化している、日本におけるデータスペースの普及促進に向けた動きについて説明する。その中心となるのが、東京大学大学院情報学環が運用する「東京大学データスペース技術国際テストベッド」だ。

PAGE TOP