富士通研究所は2018年4月16日、少数のデータしか学習に使用できない場合でもディープラーニングによる物体検出を可能とするAI技術を開発したと発表した。少量の正解データ付き画像と、大量の正解データのない画像を用いた、半教師あり学習による物体検出技術を開発した。AI技術をAPIとして提供する富士通の 「Zinraiプラットフォームサービス」 を支える学習モデル構築技術として、2018年度中の導入を目指す。
富士通研究所は、少数のデータしか学習に使用できない場合でもディープラーニングによる物体検出を可能とするAI技術を開発した。今回開発した技術は、少量の正解データ付き画像と、大量の正解データのない画像を用いて、ディープニューラルネットワークの学習を行うことで、画像の位置特定を可能とする、半教師あり学習による物体検出技術である。
拡大画像表示
まずは、京都大学大学院医学研究科との共同研究において、腎臓病の診断を支援する事例に本技術を適用した。腎生検と呼ぶ、腎臓の断片を一部採取して顕微鏡で撮影した画像から、血液のろ過機能を担う糸球体という組織の状態や数を確認する検査である。「人手で診断する場合、画像を拡大しながら目視で糸球体を探す作業に手間がかかるほか、専門家でも状態の判断にばらつきがあるという課題がある」という。
正解データ付き画像50枚だけを用いて学習した従来の物体検出ニューラルネットワークと、これに加えて正解データのない画像450枚を用いた本技術を比較した。この結果、人間と同等である見逃し率10%以下という条件下で、従来の2倍以上である27%の精度を達成した。1画像に平均22個含まれる糸球体に対して、見逃し率10%以下で検出するために必要な検討箇所を77個の候補まで絞り込み、後処理のコストを削減した。
富士通研究所によると、同技術は、腎生検画像といった医療などの特定用途向けだけでなく、正解データ付き画像の少ない分野での物体検出に広く応用できる。「例えば、製造ラインの画像を使った異物の検出、インフラ設備の各種センサーによる診断画像からの異常個所の発見、建築図面からの使用部材のリストアップなどに適用先を拡大することを想定している」(同社)。
「正解データ付き画像を増やすためには、大量の画像に対してニューラルネットワークを用いて物体位置を推定させることで、正解データを補うやり方がある。しかし、従来技術の場合、少量の正解データで学習したニューラルネットワークでは、実際の物体位置と正確に一致する場所を推定させることは困難である。不正確な推定によるデータが学習に加わることで、精度が劣化してしまう」(同社)。
そこで今回、検出用ニューラルネットワークの推定結果を手掛かりに、元の画像を復元させる復元用ニューラルネットワークによって、出力された推定位置がどの程度正しいかを検証する技術を開発した。
「間違った推定位置から復元された画像は元画像と一致しないため、2つの画像を比較することで、推定位置の正しさを検証できる。このように推定と復元を大量の画像に対して繰り返し行い、正解データを増やしながら、徐々に正確な推定位置が出力される状態に近づけることで、精度を上げられるようにした」(同社)。