NTTアドバンステクノロジ(NTT-AT)とオルツは2022年6月28日、AI議事録作成ツール「AI GIJIROKU MAX」ベータ版を提供開始した。オルツの自動議事録ツール「AI GIJIROKU(AI議事録)」にNTT-ATの多指向性マイクデバイス「Voice Compass」を組み合わせて、話者分離と認識精度の向上を図っている。両社はベータ版の提供に合わせて、検証に参加するパートナー企業の募集を開始した。
NTT-ATとオルツが提供する「AI GIJIROKU MAX」ベータ版は、AI議事録作成ツールである。オルツの自動議事録ツール「AI GIJIROKU(AI議事録)」にNTT-ATの多指向性マイクデバイス「Voice Compass」を組み合わせて、話者分離と認識精度の向上を図っている。
オルツはこれまでAI GIJIROKUを販売してきた。「実際の利用シーンで課題だった点が、複数人が参加する会議において同時に発話した音声が混ざってしまい、文字起こしの精度が下がることである。また、発話者の位置によっても、音声認識精度にムラが出ていた」(オルツ)。
今回提供を開始したAI GIJIROKU MAXでは、AI GIJIROKUにVoice Compassを組み合わせ、複数人が参加した会議での課題を解消した。1台のマイクデバイスで6話者までの集音が可能で、複数人が声を重ねず順次発話した場合に95%以上の精度で文字起こしができ、さらに同時発話の場合でも90%以上の精度を記録したとしている。
図1:多指向性(12方向分離)マイクを特徴とするVoice Compass(出典:NTTアドバンステクノロジ)Voice Compassは、多指向性(12方向分離)マイクデバイスである(図1)。NTTコンピュータ&データサイエンス研究所が開発した「IM-ASTER」技術をベースに、NTT-ATが製品化した。アプリケーション開発用に、マイクライブラリと開発者用マニュアル(NTTテクノクロスが提供)をセットで提供する。
ベータ版の提供にあたり、想定されるシーンでの検証に参加するパートナー企業を募集している。会議室で同ツールを用いて複数人での会議を議事録にし、精度を検証する。「同時発話時の文字起こし精度と話者の切り分け」「複数人話者の発話認識」「オープンスペースのような周辺ノイズのある環境での会話の文字起こしの精度」を想定している。
NTTアドバンステクノロジ / オルツ / 議事録 / 音声認識 / Web会議システム
-
AI時代の“基幹インフラ”へ──NEC・NOT A HOTEL・DeNAが語るZoomを核にしたコミュニケーション変革とAI活用法
-
加速するZoomの進化、エージェント型AIでコミュニケーションの全領域を変革─「Zoom主催リアルイベント Zoomtopia On the Road Japan」レポート
-
14年ぶりに到来したチャンスをどう活かす?企業価値向上とセキュリティ強化・運用効率化をもたらす自社だけの“ドメイン”とは
-
-
-
-
生成AIからAgentic AIへ―HCLSoftware CRO Rajiv Shesh氏に聞く、企業価値創造の課題に応える「X-D-Oフレームワーク」
-
-
-
「プラグアンドゲイン・アプローチ」がプロセス変革のゲームチェンジャー。業務プロセスの持続的な改善を後押しする「SAP Signavio」
-
BPMとプロセスマイニングで継続的なプロセス改善を行う仕組みを構築、NTTデータ イントラマートがすすめる変革のアプローチ
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-


