パナソニック ホールディングス(パナソニックHD)は2023年5月23日、画像認識AIにおける学習データ構築コストを半減する技術を開発したと発表した。学習済みAIモデルが持つ事前知識を、少数の現場データの学習に利用する。この際に、学習済みデータと現場データのギャップが大きい場合でも精度が出る手法を開発した。RGB画像で学習済みのAIモデルをベースに遠赤外線画像から物体を検出するケースで有効性を確認済みだとしている。
パナソニックHDは、画像認識AIにおける学習データ構築コストを半減する技術を開発した(図1)。学習済みのAIモデルが持つ事前知識を、少数の現場データの学習に利用する。この際に、学習済みデータと現場データのギャップが大きい場合でも精度が出る手法を開発した。RGB画像で学習済みのAIモデルをベースに遠赤外線画像から物体を検出するケースで有効性を確認済み。
拡大画像表示
背景として、画像から物体を検出するAIモデルを開発するためには、データ収集とアノテーション(画像内の人、自動車などのラベル付け)によって、大量の学習データを用意する必要がある。この作業には、多大な時間とコストを要する。データ構築コストを削減する技術として、少数のデータでも精度の高いAIモデルを実現する技術の需要が高い。
少数のデータでも精度の高いAIモデルを実現する技術の1つが、「少数のラベル付きデータに対するドメイン適応技術(Few-shot Domain Adaptation)」である。公開済みの多数のラベル付きデータ(ソースドメインのデータ)で学習したAIモデルの事前知識を、少数の現場データ(ターゲットドメインのデータ)の学習に利用する。これにより、現場データが少数でもAIモデルを学習できる。
しかし、従来の方法では、例えば、「ソースドメインがRGB画像で、ターゲットドメインが遠赤外線画像」のように、データの「見え方」が大きく異なる場合、ソースドメインとターゲットドメインの知識差(ドメインギャップ)を埋められず、高い精度が得られなかった。
ドメインギャップの大きい条件下でも精度が出る手法を開発
パナソニックHDは今回、ドメインギャップの大きい条件下でも精度が出るように、複数の画像を合成するデータ拡張方法の考え方を応用した新手法を開発した。同手法では、単純に画像を置き換えるだけでなく、画像に写る物体(自動車や人など)の領域情報を利用し、同じ種類の物体同士を置き換えることで、画像中の物体位置や存在確率なども考慮した(図1(a))。
また、敵対的学習により、AIモデルが両ドメイン共通の特徴で画像を認識できるようにした。敵対的学習とは、各画素のドメインを識別し、故意にドメインの識別を失敗するようにAIモデルを更新する学習方法である。AIモデルは、ソースドメインとターゲットドメインの区別ができなくなるため、両ドメイン共通の特徴で画像を認識するようになる(図1(b))。
これらの工夫により、従来の手法では対応が困難な、ソースドメインとターゲットドメインの見えが大きく異なる場合にも適用可能な、少数のラベル付きデータに対するドメイン適応技術を実現した(図2)。
拡大画像表示
現在、パナソニックグループの事業やサービスへの適用を目指し、各種の現場データでの実証実験を進めている。特に難易度が高い「RGB画像をソースドメイン、遠赤外線画像をターゲットドメインとした物体検出」において、今回の手法の有効性を確認済みだとしている。