[市場動向]
NEC、画像認識の学習データ作成を簡素化する「弱ラベル学習」、作成時間を75%短縮
2022年5月30日(月)日川 佳三(IT Leaders編集部)
NECは2022年5月30日、理化学研究所(理研)と共同で、画像認識の対象物を追加登録する際に必要になる学習データの作成作業を簡素化する技術を開発したと発表した。AIの学習に曖昧な情報を利用する「弱ラベル学習」技術に基づくアルゴリズムを開発している。検証では、80種類の検知対象物を含む画像認識において、学習データ作成時間を75%短縮することを確認したという。
NECは、画像認識の対象物を追加登録する際に必要になる、学習データの作成作業を簡素化する技術を、国立研究開発法人理化学研究所(理研)と共同で開発した。検証では、80種類の検知対象物を含む画像認識において、学習データ作成時の手間を減らし、作成時間を75%短縮できることを確認している(図1)。
建設現場や工場で画像認識を活用するためには、工具、材料、重機といった新たな検知対象を継続的に登録していく必要がある。「従来は、新たな検知対象だけでなく、既存の検知対象についてもラベルを付けてAIに学習させていたため、学習データの作成が負担になっていた」(NEC)という
NECと理研は今回、AIの学習に曖昧な情報を活用できる「弱ラベル学習」技術を発展させるかたちで新技術を開発した。「一般に、新たな検知対象だけをラベル付けしたデータで学習できれば、作業に必要となる時間は少なくて済む。例えば、トラックやバスなどの車両を認識するAIに“バイク”を追加学習させる場合、トラックやバスや背景にラベルを付けないことは、それらが”バイクではない”という『弱ラベル(その物体が何であるかが曖昧なラベル)』を付与したことに相当する」(同社)。
NECによると、弱ラベル学習の問題点は、精度の高いモデルを学習できないことで、ラベルの曖昧性に起因して学習が不安定になってしまうという。これに対して今回開発した技術では、学習時の不安定性を解消するための補正を加えながら学習する。
「一般に、学習時に補正を加えると、学習が安定する代わりに本来の目的である『対象物を正しく推定するモデルを学習』できる保証がなくなる。そこで、弱ラベル学習の安定化と、正しいモデルの学習の両方を同時に満たすアルゴリズムを開発した」(同社)。