QuantumCore(クアンタムコア)は2020年6月1日、Raspberry Piを利用したエッジ処理型の議事録システムのプロトタイプを開発したと発表した。エッジ処理だけで複数の話者を認識し、金融機関のニーズを満たす議事録システムとしての実用化を目指す。
QuantumCore(クアンタムコア)は、金融機関のニーズを満たす議事録システムとして、エッジ処理だけで複数の話者を認識できるプロトタイプを開発した。NTTデータが運営するBeSTA FinTech Labにおいて、金融機関向けサービスの協議を重ねる中で構築した(図1)。
QuantumCoreは現在、少量データをエッジ上でリアルタイムに学習できる、多変量時系列処理ソフトウェア「Qore」を提供している。今回、Qoreをシングルボードコンピュータの「Raspberry Pi」(ラズベリーパイ、ラズパイ)で動作させ、学習から推論までのフル機能をRaspberry Pi内で完結させた。
話者を認識できる機能については、クラウド型のAPIサービスとして、ベータ版を提供済み。これに対して今回は、話者認識機能をエッジ化(メモリー100MB弱で動作)させた。ネットワークを介さずに話者を認識できるため、エッジ処理型の議事録システムを提供できる可能性が生まれる。
背景について同社は、金融業界は情報の機密性が高いため、「誰」が「何」を話したかを金融機関内のサーバーで処理して可視化させるニーズが高いことを挙げる。
「エッジで処理できる音声認識システムは既にあるが、発話者の声から個人を認識できる話者認識の技術は、まだエッジ処理では利用が難しい。議事録システムの多くはネットワーク接続が必須な上に、利用人数やマイクに制限がある」(同社)