[市場動向]

富士通とMIT CBMM、照明や視点で見え方が変わっても高精度に画像を認識するAI技術を開発

2021年12月9日(木)日川 佳三(IT Leaders編集部)

富士通と米マサチューセッツ工科大学(MIT)のCenter for Brains, Minds and Machines(CBMM)は2021年12月9日、高精度な画像認識AI技術を共同で開発したと発表した。特徴は、照明や視点の変化によって見え方が変わっても、高い精度で画像を認識できる点である。人の認知特性と脳の構造に着想を得たとしている。観測条件の変化に対応できる交通監視AIや、多種多様な病変を正しく認識できる画像診断AIなどへの応用が期待できるとしている。

 富士通とMITのCBMMは、照明や視点の変化によって見え方が変わっても高い精度で画像を認識できる画像認識AI技術を共同で開発した(図1)。ディープニューラルネットワーク(DNN)を、形や色などの属性ごとのモジュールに分割して学習させる仕組みである。人の認知特性と脳の構造に着想を得ている。

図1:OODデータを高精度で認識できるAI技術の概要。独自に算出したAIの画像認識度合を示す指標を活用する(出典:富士通)図1:OODデータを高精度で認識できるAI技術の概要。独自に算出したAIの画像認識度合を示す指標を活用する(出典:富士通)
拡大画像表示

 背景には、学習時と傾向が大きく異なる未知(out-of-distribution、以下OOD)のデータに対しては、AIの認識精度が大幅に低下するという課題がある。同じモノについて色合いや角度など条件が異なる様々なデータを網羅的に学習させることは難しく、認識精度の向上には限界がある。

 人がモノを認知する際は、形や色などの見え方に違いがあっても、これらの視覚情報を脳内で正確に捉えて分類できる。今回開発したAI技術は、複数の画像データをDNNに入力した際に生じる、ニューロンにおける対象物の見え方と分類の反応から、独自の指標を算出する。指標の数値が高くなるようにDNNの学習を促進させることで、AIの認識精度を向上させる。

 従来は、DNNを分割せず1つのモジュールで学習させることが、認識精度の高いAIを実現する最良の手法だと考えられていた。一方、富士通とMITのCBMMは今回、算出した指標に基づいてDNNを物の形や色などの属性ごとのモジュールに分割して学習させることで、より認識精度が高いAIを実現した。

関連キーワード

富士通 / 画像認識

関連記事

Special

-PR-

富士通とMIT CBMM、照明や視点で見え方が変わっても高精度に画像を認識するAI技術を開発富士通と米マサチューセッツ工科大学(MIT)のCenter for Brains, Minds and Machines(CBMM)は2021年12月9日、高精度な画像認識AI技術を共同で開発したと発表した。特徴は、照明や視点の変化によって見え方が変わっても、高い精度で画像を認識できる点である。人の認知特性と脳の構造に着想を得たとしている。観測条件の変化に対応できる交通監視AIや、多種多様な病変を正しく認識できる画像診断AIなどへの応用が期待できるとしている。

PAGE TOP