[新製品・サービス]

大日本印刷、読み間違いやイントネーション/アクセントに留意した音声合成システムを開発

2021年6月16日(水)IT Leaders編集部

大日本印刷(DNP)とDNPコミュニケーションデザイン(DCD)は2021年6月15日、自然な音声を自動生成する音声合成システムを開発したと発表した。音声合成の制作時に起こる読み間違いを減らし、人が読むナレーションのイントネーションやアクセントに留意した自然な音声を生成できることをアピールする。

 大日本印刷(DNP)とDNPコミュニケーションデザイン(DCD)は、読み間違いやイントネーション/アクセントに留意した音声合成システムを開発した。自然な音声の生成を特徴としている(図1)。

図1:読み間違いやイントネーション/アクセントに留意した音声合成システムを開発した(出典:大日本印刷)図1:読み間違いやイントネーション/アクセントに留意した音声合成システムを開発した(出典:大日本印刷)
拡大画像表示

 新しい音声合成システムの開発にあたって、音声合成の制作時に起こる漢字の誤読や、「橋/箸/端」など読み仮名は共通であるもののイントネーションが異なる語句に留意したという。従来のDNPの音声合成と比べて、読み間違いを約50~70%削減するとしている。音声合成を利用する各種の用途(学校教材や電子書籍、生命保険・損害保険の約款や契約書、eラーニングや研修教材)に向く。

 開発の背景として両社は、音声合成の精度が向上している一方で、漢字の誤読やイントネーションの間違いが依然として発生している状況を挙げる。「この課題に対してDNPとDCDは、正しく発音している音声データを機械学習させることにより、誤読が少なくスムーズな発音の音声合成を生成できるAIシステムを開発した」(両社)

 まず、読み間違いのない音声データを機械学習させ、正確な読みを自動で付与するようにした。約款や契約書、自治体・行政機関の公式文書、製品の解説書など、正しい情報提示が必要でテキスト量が多い用途に適するとしている。

 さらに、イントネーションとアクセントを文章の文脈を加味して生成することで、人が読むナレーションに近い自然な音声を生成できるようにした。特に、正しい読みやナレーションを重視する用途である、学校教材や電子書籍などに適するとしている。

 追加学習によって、読みの正確性や自然なナレーション精度の向上を図れるようにした。追加学習によってデータを増やすほど、読みの正確性やイントネーションおよびアクセントの精度が高まるという。複数の生命保険会社の約款で汎用性の検証を実施したところ、「読み」「アクセント」「間」について、約85%以上の正確性を確認している。両社は、追加学習を重ねることでさらなる精度の向上を図る。

関連キーワード

大日本印刷 / 音声合成

関連記事

Special

-PR-

大日本印刷、読み間違いやイントネーション/アクセントに留意した音声合成システムを開発大日本印刷(DNP)とDNPコミュニケーションデザイン(DCD)は2021年6月15日、自然な音声を自動生成する音声合成システムを開発したと発表した。音声合成の制作時に起こる読み間違いを減らし、人が読むナレーションのイントネーションやアクセントに留意した自然な音声を生成できることをアピールする。

PAGE TOP