一般社団法人AIデータ活用コンソーシアム(AIDC)は2021年2月10日、AIの学習データをクラウド上で安全に取引するためのサービス「AIDC Data Cloud」を発表した。契約モデルに基づいて、円滑にデータを流通できるとしている。同年3月1日にサービスを開始する。これに先立ち、2021年2月10日にプレビュー版の提供を開始した。
これまで、データの活用というと、マーケット分析などの消費型(1回で完結した利用)が主だった。データが形を変えて製品・サービスに組み込まれて流通することはなかった。昨今では、AI(ディープラーニング、マシンラーニング、統計的学習・統計解析など)が一般的に活用されるに従って、データが学習済みモデルなどに形を変えて、製品やインターネットサービスに組み込まれて利用されることが増えてきている。
一方、データの所有者と、データを活用して研究を行ったり製品・サービスを提供したりする利用者は、必ずしも同一ではない。このため、両者間で円滑にデータを流通させられるシステムが望まれている。さらに、AIの学習用データを流通させる際には、倫理、知的財産、製造物責任、商流に基づく利益配分などを考慮する必要がある。
AIデータ活用コンソーシアム(AIDC)は、データ取引サービス基盤を開発・提供すると同時に、データ取引に欠かせない各種の契約モデルを法律の専門家、有識者とともに開発してきた。今回AIDCが提供するデータ取引サービス「AIDC Data Cloud」は、こうした活動に基づき、データ提供者とデータ利用者が安心して利用できるデータ取引サービスを提供する。
例えば、AIを組み込んだ製品・サービスの製造物責任を果たすためには、学習に用いるデータの適切な来歴把握および管理が重要である(図1)。
データ取引サービス「AIDC Data Cloud」が提供する主な機能とサービスは、以下のとおりである。
- データ提供者が望む条件でデータを登録、カタログとして一覧化されたデータを、利用者が選択し、利用契約の締結が可能
- 様々な商流と知的財産保護、および倫理・製造物責任・保証・来歴に考慮したデータ取引サービスと契約モデルに対応
- 様々な種類・サイズのデータに対応。ファイルのアップロード、ダウンロードだけでなくWeb APIに対応することで、データの提供および取得が可能
- オープンデータからワンタイム、レベニューシェアなど様々なデータ取引形態に対応
取引対象となるデータは、オリジナルデータ、クレンジングデータまたはアノテーションデータである。契約の当事者として、データ生成者、データアノテーター、AI研究者・AI開発者、コンポーネントメーカー、最終製品メーカー、エンドユーザーを想定している。
契約の形態は、データ生成者がデータアノテーターまたはAI研究者・AI開発者にデータをライセンスする場合と、データアノテーターがAI研究者・AI開発者にデータをライセンスする場合の2通りを想定している。