日本生命保険は、会議音声をテキスト化するシステムとして、日立製作所の「音声書き起こし支援サービス」を導入した。特徴は、マイク1台あたり最大8人の発話を、話者ごとに識別・分離してテキスト化できること。1つの会議室に複数のマイクを設置することで多人数の音声認識を実現した。日立製作所が2020年3月10日に発表した。
日本生命保険は、会議音声をテキスト化する仕掛けとして、日立製作所のクラウドサービス「音声書き起こし支援サービス」を導入した。日立製作所独自の音源分離技術により、マイク1台あたり最大8人の発話を、話者ごとに識別・分離してテキスト化する。1つの会議室に複数のマイクを設置することで、多人数の音声認識を実現した(図1)。
音源分離技術により、音源の音の到来方向を立体的に検知する。これにより、話者以外からの雑音を除去し、目的の音声のみを抽出する。また、同じ音声を複数のマイクで採取した場合は、各マイクの認識結果で最も精度が高いテキストを判定して出力する。
音声書き起こし支援サービスでは、一般用語集に加えて、ユーザー自身がカスタマイズ可能な辞書を用意している。社内用語や略称などを認識できる。入力可能な音源は、汎用マイクや電話などからの音声入力のほか、音声ファイル(wav、mp3)も扱える。
導入にあたっては、2019年度上期に、日本生命の複数の部署の会議において、本サービスの試用・評価検証を行った。検証において、会議議事録の作成時間縮減や正確性向上などの効果を確認できたことから、今回の導入につながった。