富士通は2022年7月22日、顔などが映っていなくても、歩き方(歩容)の映像から人物を高精度に照合する「歩容照合」技術を開発したと発表した。人の映り込む位置の違いなどによって照合精度が低下してしまう課題を解決する。約1700人のカメラ映像で検証した結果、従来技術では50%未満の精度だったところを、新技術では約90%の精度で人物を照合したという。2023年度までの実用化を目指す。
富士通は、顔などが映っていなくても、歩き方(歩容)の映像から人物を高精度に照合する「歩容照合」技術を開発した。これまでは、人物の体格や歩く位置などの条件が学習時と異なる場合に照合精度が低かったのを解決する(図1)。
約1700人のカメラ映像で検証した結果、従来技術では50%未満の精度だったところを、新技術では約90%の精度で人物を照合したという。2023年度までの実用化を目指す。
拡大画像表示
富士通は、歩容照合技術のポイントを、「人の関節点の座標から姿勢を推定するディープラーニング(深層学習)モデルと、汎用的に照合可能な関節点座標空間への変換によって人物を照合しやすくする独自技術を組み合わせたこと」にあると説明している。これにより、人が映り込む位置の違いなどによって照合精度が低下してしまう課題を解決している。
歩容照合技術は、事前に取得した人物映像から歩容情報を抽出して登録する時の技術と、人物映像を入力して照合する時の技術の2段階で構成する。登録時には、富士通のAI技術「行動分析技術 Actlyzer」が持つ姿勢推定技術を用い、人の関節点の移動における時系列情報を抽出する(関連記事:学習データなしに基本動作の組み合わせで人の複雑な行動を認識する技術、富士通研究所が開発)。
得られた関節点の時系列情報は、人のサイズや歩く位置などの条件がさまざまである。このため、サイズや位置によらずに汎用的に照合可能な空間に投影し、関節点情報を変換する。こうして変換した時系列の関節点情報から、カメラ映像内の人物特有の歩容の情報である歩容特徴量を抽出し、歩容特徴量データベースに登録する。
一方、照合時には、人物映像に対して、登録時と同様、汎用的に照合可能な空間に投影して変換した関節点情報から歩容特徴量を抽出する。あらかじめ登録した人物映像の歩容特徴量と、新たに入力した人物映像の歩容特徴量との類似度を比較することで人物を照合する。
富士通は開発の背景を次のように説明する。「カメラ映像から特定の人物を照合する技術開発が進む中、顔や服装など人の特徴を視認できない映像でも、歩容の特徴を基に人物を照合可能な技術への期待が高まっている」。