日立製作所は2018年11月5日、複数のマイクで拾った音を利用して設備の稼働状態や人の活動状態を高精度に認識するAI技術を開発したと発表した。雑音が存在する環境でも高精度に状況を認識できるとしている。
日立製作所は、複数のマイクで拾った音を利用して設備の稼働状態や人の活動状態を高精度に認識するAI技術を開発したと発表した。雑音が存在する環境でも高精度に状況を認識できるとしている。
環境音(周囲環境から発生するさまざまな音)や反響音(周囲の物体や人から跳ね返ってくる音)などの雑音を含む音を、音源の方向や音色の違いなどの複数の観点に基づいて分解し、分解した音をもとに状況を認識する。
図1:音を分解し、複数のDNNを用いて状況を認識する(出典:日立製作所)拡大画像表示
まずは、複数のマイクで音を録音し、マイク間での音が到達する時間差から推定できる音源の方向や、音色の違いから推測できる反響音かどうかなど、複数の観点に基づいて、雑音が混ざった音を分解する。
さらに、分解した音を、複数のディープニューラルネットワーク(DNN)にそれぞれ入力し、設備や人などが置かれている状況と一致する可能性(確率)をそれぞれ計算する。最後に、多数決によって、総合的な状況認識の結果を出力する。
それぞれのDNNが受け持っている1つの観点だけに頼ると雑音に影響されやすいという問題があるが、複数のDNNの多数決による結果を確認することで、雑音に影響されにくくなる。これにより、多様な種類の雑音が存在する環境でも高精度に状況を認識できる。
今回開発した技術は、音に基づいて設備の状態を自動診断するサービスや、人の活動状態を自動認識する見守りサービスなどへの応用が期待できる。日立製作所は今後、機能向上などの開発を進め、同技術の実用化を目指す。
-
AI時代の“基幹インフラ”へ──NEC・NOT A HOTEL・DeNAが語るZoomを核にしたコミュニケーション変革とAI活用法
-
加速するZoomの進化、エージェント型AIでコミュニケーションの全領域を変革─「Zoom主催リアルイベント Zoomtopia On the Road Japan」レポート
-
14年ぶりに到来したチャンスをどう活かす?企業価値向上とセキュリティ強化・運用効率化をもたらす自社だけの“ドメイン”とは
-
-
-
-
生成AIからAgentic AIへ―HCLSoftware CRO Rajiv Shesh氏に聞く、企業価値創造の課題に応える「X-D-Oフレームワーク」
-
-
-
「プラグアンドゲイン・アプローチ」がプロセス変革のゲームチェンジャー。業務プロセスの持続的な改善を後押しする「SAP Signavio」
-
BPMとプロセスマイニングで継続的なプロセス改善を行う仕組みを構築、NTTデータ イントラマートがすすめる変革のアプローチ
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-



