[事例ニュース]
化学メーカーの日本ゼオン、企業間で実験データを共有し、AIモデルの物性予測性能向上を確認
2024年12月3日(火)日川 佳三(IT Leaders編集部)
合成ゴムなどの化学メーカー、日本ゼオン(本社:東京都千代田区)は2024年11月3日、異なる企業間で実験データを共有し、共有したデータの学習によってAIモデルの物性予測性能が向上することを確認したと発表した。今後は、企業が互いのデータを秘匿化したまま共有可能な秘密計算技術の実装を目指す。
古河グループの企業で、合成ゴム、高機能樹脂などを開発・製造する化学メーカーの日本ゼオン。同社は、企業間で安全にデータを連携させるシステム基盤の構築を目指している。2021年からは、複数の企業が持つ実験データを連携させたデータセットを使って物性予測AIモデルの精度を高める試みを進めている。2023年からは、企業が互いのデータを秘匿化したまま共有可能な秘密計算技術の実装に取り組んでいる。
「素材産業に従事する国内企業は現在、それぞれ独自にデータを蓄積し、これを社内だけで活用している。しかし、国際競争力を高めるためには、企業や業界の垣根を超えてデータを集約し、活用する必要がある。一方、各企業ごとに異なるデータを連携させるためには、データの秘匿性などが必要になる」(日本ゼオン)
今回同社は、秘密計算技術を介さない範囲において、異なる企業間のデータ連携に成功し、複数企業のデータを活用することによってAIモデルの予測性能を高められることを確認した。
研究において、日本ゼオンと米ゼオン・ケミカルズ(Zeon Chemicals:ZCLP)の間で、合成ゴムに関する実験データを共有した。ZCLPは、合成ゴムをはじめとするエラストマー製品を製造・開発するゼオンのグループ企業だが、データ管理はゼオンから完全に独立している。
配合物の種類や記名ルールが異なっている状況でも、独自の変換プログラムを適用することにより、データを連携させることに成功した。日本ゼオンのデータベースに載っていないZCLP独自の配合剤については、成分や基本的な物性値などの科学的データを調べてひもづけることで、連携後のデータベースの質を高めた。結果的に7000水準以上の配合データベースになった。
データ連携の前後で、それぞれのデータセットを使ってマシンラーニング(機械学習)を実施し、互いのデータ分布を主成分分析によって可視化した(図1)。互いの手薄なデータ領域を補間し合っている一方で、互いの領域が離れすぎてもおらず、データ共有の有効性が示されている。
また、両社のデータを基に訓練したAIモデルを用い、ゴム物性値(Hardness)に対する予測値を実測値と比較した。この結果、各社単体のデータに比べて、連携させたデータの精度の方が向上していることを確認した。
図2は、ゼオンとZCLPのデータを組み合わせて訓練したAIモデルによる、ZCLPデータに対する実測値と予測値のプロットである。左側のグラフは、ZCLPデータの半分を訓練データにしたケース、中央はゼオンの全データを訓練データにしたケース、右はゼオンとZCLPの両データを訓練データにしたケースである。右の、両データを使って訓練したAIモデルの二乗平均平方根誤差が最も小さく、精度の向上を確認できた。
拡大画像表示
今後は、企業間データ連携において最大の障壁となる秘匿性を担保する秘密計算技術について、SBテクノロジーと共に検証を進める。具体的には、秘密計算技術のTEE(Trusted Execution Environment)を介したデータ連携システムを構築し、今回の成果を再現する。なお、TEEはハードウェア方式の秘密計算技術で、メインメモリー上の計算途上データを暗号化し、CPUに読み込んでから復号して利用する。他のアプリケーションによるデータの読み取りや改竄を防ぐ。