[調査・レポート]

時系列データからAI学習用の教師データを簡単に作成、富士通研究所と熊本大学が開発

2019年5月10日(金)日川 佳三(IT Leaders編集部)

富士通研究所と熊本大学は2019年5月10日、センサーデータなどの時系列データからAI学習用の教師データを簡単に作成できる技術を開発したと発表した。長区間(例えば1時間)に対して、主に「何を」していたか1つだけラベルを付けていくだけで、高精度な教師データを自動で作成できるとしている。時系列データ向け前処理技術として、2019年度中の実用化を目指す。

 富士通研究所と熊本大学は、ある時点での数値を記録した時系列データからAI学習用の教師データを簡単に作成する技術を開発した。時系列データを意味のあるブロックに区切り、それぞれにラベルを付けるアノテーションの作業を自動化する技術である。

 学習データの作成者は、長時間の区間(例えば1時間)に対して、その時間帯に主に何をしていたかを、1つだけラベル付けする。これだけで、精度の高い教師データ、つまり、それぞれの動作ごとに適切なラベルを付与した教師データを自動で作成できる。

 同技術の効果として、工場における研磨などの作業を模した動作からなる加速度センサーの時系列データに対して、ラベルを付与する実験を実施した。結果、92%の時間帯で、正しくラベル付けができたことを確認した。これは、人手でラベルを細かく付与したデータを教師データとした時と同等の精度だとしている。

 開発の背景について、時系列データのAI活用が進んでいない状況を挙げている。「時系列データから教師データを作るためには、手動で、いつ・何をしたかといったラベルを、数値の変化に応じてデータに付与しなければならない。この作業の工数が膨大となる」という。

 「例えば、ランニングの際の加速度センサーのデータでは、走っている状態、歩いている状態、止まっている状態などが混在している。これらのデータをAIに学習させるには、データをそれぞれの区間に切り分けて、走っている・歩いている・止まっているといったラベルを付けた教師データを作成する必要がある」(富士通研究所)

 今回開発した技術の特徴は、時系列データから、同じ特徴を持つ動作の時間帯を、AIを用いて自動抽出することである。時系列データの中で、同じ動作が継続している時の特徴と、動作が変化する時の特徴を学習することによって実現している。熊本大学が所有する技術を活用している。

 もう1つの特徴は、ラベル付けの精度をAIによって高めていることである(図1)。長区間のデータに大雑把なラベルを手動で付与した後、ラベルを予測するモデルをディープラーニングで作成し、予測結果として出てきた推定ラベルから、時系列データのどの区間が最も予測に寄与したかを計算する。この寄与度が高い時間帯をラベル候補として集計していくことで、高度な予測が可能な教師データを作成する。

図1:時系列データ向け前処理技術の全体像(出典:富士通研究所、熊本大学)図1:時系列データ向け前処理技術の全体像(出典:富士通研究所、熊本大学)
拡大画像表示
関連キーワード

富士通研究所 / 熊本大学 / 協業・提携 / R&D

関連記事

Special

-PR-

時系列データからAI学習用の教師データを簡単に作成、富士通研究所と熊本大学が開発富士通研究所と熊本大学は2019年5月10日、センサーデータなどの時系列データからAI学習用の教師データを簡単に作成できる技術を開発したと発表した。長区間(例えば1時間)に対して、主に「何を」していたか1つだけラベルを付けていくだけで、高精度な教師データを自動で作成できるとしている。時系列データ向け前処理技術として、2019年度中の実用化を目指す。

PAGE TOP