[新製品・サービス]

NTT-ATとオルツ、多指向性マイクで文字起こし精度を高めた議事録作成ツール「AI GIJIROKU MAX」

2022年6月29日(水)IT Leaders編集部

NTTアドバンステクノロジ(NTT-AT)とオルツは2022年6月28日、AI議事録作成ツール「AI GIJIROKU MAX」ベータ版を提供開始した。オルツの自動議事録ツール「AI GIJIROKU(AI議事録)」にNTT-ATの多指向性マイクデバイス「Voice Compass」を組み合わせて、話者分離と認識精度の向上を図っている。両社はベータ版の提供に合わせて、検証に参加するパートナー企業の募集を開始した。

 NTT-ATとオルツが提供する「AI GIJIROKU MAX」ベータ版は、AI議事録作成ツールである。オルツの自動議事録ツール「AI GIJIROKU(AI議事録)」にNTT-ATの多指向性マイクデバイス「Voice Compass」を組み合わせて、話者分離と認識精度の向上を図っている。

 オルツはこれまでAI GIJIROKUを販売してきた。「実際の利用シーンで課題だった点が、複数人が参加する会議において同時に発話した音声が混ざってしまい、文字起こしの精度が下がることである。また、発話者の位置によっても、音声認識精度にムラが出ていた」(オルツ)。

 今回提供を開始したAI GIJIROKU MAXでは、AI GIJIROKUにVoice Compassを組み合わせ、複数人が参加した会議での課題を解消した。1台のマイクデバイスで6話者までの集音が可能で、複数人が声を重ねず順次発話した場合に95%以上の精度で文字起こしができ、さらに同時発話の場合でも90%以上の精度を記録したとしている。

図1:多指向性(12方向分離)マイクを特徴とするVoice Compass(出典:NTTアドバンステクノロジ)

 Voice Compassは、多指向性(12方向分離)マイクデバイスである(図1)。NTTコンピュータ&データサイエンス研究所が開発した「IM-ASTER」技術をベースに、NTT-ATが製品化した。アプリケーション開発用に、マイクライブラリと開発者用マニュアル(NTTテクノクロスが提供)をセットで提供する。

 ベータ版の提供にあたり、想定されるシーンでの検証に参加するパートナー企業を募集している。会議室で同ツールを用いて複数人での会議を議事録にし、精度を検証する。「同時発話時の文字起こし精度と話者の切り分け」「複数人話者の発話認識」「オープンスペースのような周辺ノイズのある環境での会話の文字起こしの精度」を想定している。

関連キーワード

NTTアドバンステクノロジ / オルツ / 議事録 / 音声認識 / Web会議システム

関連記事

Special

-PR-

NTT-ATとオルツ、多指向性マイクで文字起こし精度を高めた議事録作成ツール「AI GIJIROKU MAX」NTTアドバンステクノロジ(NTT-AT)とオルツは2022年6月28日、AI議事録作成ツール「AI GIJIROKU MAX」ベータ版を提供開始した。オルツの自動議事録ツール「AI GIJIROKU(AI議事録)」にNTT-ATの多指向性マイクデバイス「Voice Compass」を組み合わせて、話者分離と認識精度の向上を図っている。両社はベータ版の提供に合わせて、検証に参加するパートナー企業の募集を開始した。

PAGE TOP