「音」を適切に認識すれば、画像解析では難しい、あるいはコストがかかりすぎることを実現できる--そんな「音響認識(Computer Hearing)」の可能性に着目したベンチャー企業が増えている。その中でトップを走る1社が米OtoSense(オトセンス)という、2014年設立で社員数12人の小さな企業だ。一体、音響認識とはどんな可能性を持つのか?
人の肉声とTVの音声を聞き分けられる
プライバシーの問題も生じにくい。「例えばビルのトイレやスポーツクラブのシャワー室にカメラは使えません。でも音なら問題ありませんから、それらの稼働状況をモニタリングできます」。こうした比較的単純な音だけではなく、人間には認識困難な音も処理できる。機械の微妙な作動音から故障を予測したり、異常を検知したり、といったことだ。「詳細は言えませんが、米軍も採用しています」。
確かに音を利用すると色々できそうな気がするが、技術的には決して単純ではない。「ディープラーニング(深層学習)を基本に、遺伝的アルゴリズムやベイズ推定を組み合わせて音響認識を行っています。精度はマイクの性能にもよりますが95%以上で、例えば人の肉声とTVの音声を聞き分けることができます」。
そんなOtoSenseは、音響分析、検知・診断を行うためのソフトウェアプラットフォーム「Sound Intelligence Recognition(SIR)エンジン」、特定の音響認識に特化した組み込み用途向けの「IATIS」、異常音を検知、診断するフレームワーク「OM2プラットフォーム」といったソフトウェアを企業向けにライセンス提供している。
「自社で最終製品を開発・販売するには時間も費用もかかります。ライセンス提供なら、早期にビジネスをスケールさせることができます」(Christian氏)。狙うは「OtoSense Insideの製品が溢れる状態」というわけだ。例えばPepperやAsimoのようなロボット事業者、スマートフォン/タブレットなどスマートデバイスのメーカー、監視カメラや産業用機器のメーカー、IT企業などが想定顧客だという。
日本では、伊藤忠テクノソリューションズ(CTC)の子会社で海外製品の輸入販売に強みを持つCTC SPと総代理店契約を結ぶ見通し。OtoSenseと同様に音に着目し、監視や認識技術を開発する企業は米Audio Analytics、日本のアダコテックなど少なからず存在する。IoT(Internet of Things)の領域の1つとして「音」に注目する必要がありそうだ。