日本生命保険は、会議音声をテキスト化するシステムとして、日立製作所の「音声書き起こし支援サービス」を導入した。特徴は、マイク1台あたり最大8人の発話を、話者ごとに識別・分離してテキスト化できること。1つの会議室に複数のマイクを設置することで多人数の音声認識を実現した。日立製作所が2020年3月10日に発表した。
日本生命保険は、会議音声をテキスト化する仕掛けとして、日立製作所のクラウドサービス「音声書き起こし支援サービス」を導入した。日立製作所独自の音源分離技術により、マイク1台あたり最大8人の発話を、話者ごとに識別・分離してテキスト化する。1つの会議室に複数のマイクを設置することで、多人数の音声認識を実現した(図1)。
図1:日本生命保険は会議音声のテキスト化に「音声書き起こし支援サービス」を導入した(出典:日立製作所) 音源分離技術により、音源の音の到来方向を立体的に検知する。これにより、話者以外からの雑音を除去し、目的の音声のみを抽出する。また、同じ音声を複数のマイクで採取した場合は、各マイクの認識結果で最も精度が高いテキストを判定して出力する。
音声書き起こし支援サービスでは、一般用語集に加えて、ユーザー自身がカスタマイズ可能な辞書を用意している。社内用語や略称などを認識できる。入力可能な音源は、汎用マイクや電話などからの音声入力のほか、音声ファイル(wav、mp3)も扱える。
導入にあたっては、2019年度上期に、日本生命の複数の部署の会議において、本サービスの試用・評価検証を行った。検証において、会議議事録の作成時間縮減や正確性向上などの効果を確認できたことから、今回の導入につながった。
-
AI時代の“基幹インフラ”へ──NEC・NOT A HOTEL・DeNAが語るZoomを核にしたコミュニケーション変革とAI活用法
-
加速するZoomの進化、エージェント型AIでコミュニケーションの全領域を変革─「Zoom主催リアルイベント Zoomtopia On the Road Japan」レポート
-
14年ぶりに到来したチャンスをどう活かす?企業価値向上とセキュリティ強化・運用効率化をもたらす自社だけの“ドメイン”とは
-
-
-
-
生成AIからAgentic AIへ―HCLSoftware CRO Rajiv Shesh氏に聞く、企業価値創造の課題に応える「X-D-Oフレームワーク」
-
-
-
「プラグアンドゲイン・アプローチ」がプロセス変革のゲームチェンジャー。業務プロセスの持続的な改善を後押しする「SAP Signavio」
-
BPMとプロセスマイニングで継続的なプロセス改善を行う仕組みを構築、NTTデータ イントラマートがすすめる変革のアプローチ
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-


