[市場動向]
パナソニック、画像認識AIの未学習の物体への「知ったかぶり誤認識」を防ぐ技術を開発
2023年7月31日(月)IT Leaders編集部
パナソニック ホールディングス(本社:大阪府門真市)は2023年7月28日、画像認識AIモデルの信頼性を高める技術として、学習していない物体を「未知物体」として認識する技術を開発したと発表した。AIモデルが認識結果にどれくらい自信を持っているか(不確実性)を推定するフローベースの生成モデル「FlowEneDet」を開発した。学習したことのない未知物体に対する誤認識を防ぐことで、モデルの性能と信頼性を高める。車載などAIの信頼性が求められるユースケースに向く。
パナソニック ホールディングスと米Panasonic R&D Company of Americaは、画像認識AIモデルの信頼性を高める技術として、学習していない物体を「未知物体」として認識する技術を開発した。学習したことのない未知物体に対する誤認識を防ぐことで、モデルの性能と信頼性を高める。車載などAIの信頼性が求められるユースケースに向く。
開発の背景として、画像認識AIモデルの1つであるセマンティックセグメンテーション(注1)は、事前に学習させた対象に対しては認識率が高いが、実環境のすべての物体をあらかじめ学習させることは困難で、実際の利用環境では未知の物体に直面することを挙げている。
注1:セマンティックセグメンテーション(Semantic Segmentation:領域分類)は、画素単位で物体の領域を認識し、各画素に何の物体が映っているのかを関連づける画像認識タスク技術。セマンティックセグメンテーションのための代表的なAIモデルとして「DeepLabV3+」や「SegFormer」が挙げられる。
「一方、AIモデルは、未知の物体に直面した際に『知らない』と判断することが苦手で、モデルが知っている範囲で無理やり認識して『知ったかぶる』ことをする。しかし、例えば車載カメラのAIモデルにおいて道路でないものを『道路』と誤認識してしまうと事故につながりかねない。未知物体を『未知物体』と推定できる技術が必要である」(同社)
「知ったかぶり誤認識」の実例が図1である。画像左上の「ビールケース」と、画像左下の「犬」は、画像認識AIモデルが事前に学習していない未知の物体である。学習済みのラベルを無理やり当てはめて推定した結果、そもそも認識できない物体であるはずのビールケースを、一部が車(紺色)で残りが道路(紫)と誤認識している。犬の場合も、一部が木(緑)で一部が道路(紫)と誤認識している。
拡大画像表示
誤認識の問題に対して、パナソニックHDとPanasonic R&D Company of Americaは、AIモデルが認識結果にどれくらい自信を持っているか(不確実性)を推定するフローベースの生成モデル「FlowEneDet」を開発した。これを画像認識モデルの後段に追加するだけで、「未知物体」を棄却し、本質的に認識が可能な学習済みの物体に限って認識可能になる。
フローベースの生成モデルは、逆変換可能な関数の合成として複雑な分布を表現できるモデルである。学習した物体の分布を正確にモデリング可能であることから、「学習した既知の物体」と「学習していない未知物体や誤分類(モデリング結果が実際の分布と合わない)」を分離できる。そのうえで、未知物体(OOD)や誤分類(IDM)領域をより高精度に分離することを目的に、データ密度をモデリングするエネルギーベースモデルと組み合わせている。
FlowEneDetを通常の画像認識AIの後段に追加することで、セグメンテーションモデルを再トレーニングすることなく、認識結果の不確実性を推定可能なセグメンテーションモデルへと拡張する(図2)。FlowEneDet自体は、エネルギーベースモデルにおける低次元の自由エネルギーを処理するモデルで、複雑さが低く、学習・評価コストを大きく増やすことなく利用できるという。
拡大画像表示
事前学習済みのセマンティックセグメンテーションモデルの後段にFlowEneDetを追加し、複数のベンチマークデータセットに対して未知物体や誤分類の認識性能評価を行った結果、従来法を上回る認識結果を達成した(図3)。
拡大画像表示