NTTテクノクロスは2023年1月20日、音声合成エンジンソフトウェア「FutureVoice Crayon」に「クロスリンガル音声合成技術」を追加した。1つの言語の音声から、日本語、英語、標準中国語、韓国語の合成音声を生成できるようにした。自身の声を使った多言語プレゼンテーションや、翻訳技術と連携させた同時通訳のプレゼンテーションなどに活用可能である。なお、FutureVoice Crayonは、サーバーソフトウェアやクラウドサービス、アプリケーション組み込み用のSDK(ソフトウェア開発キット)など、複数の形態で提供している。
NTTテクノクロスの「FutureVoice Crayon」は、テキストデータを音声で読み上げる音声合成エンジンソフトウェア。サーバーソフトウェアやクラウドサービス、アプリケーション組み込み用のSDK(ソフトウェア開発キット)など、複数の形態で提供している。ディープラーニング(深層学習)を活用して合成音声を生成する。
イントネーションや声質の元となる音声データベースを利用し、異なる話者の音声データから読み方やアクセントを補うことで、所望の話者の少量の音声データからその話者の自然な音声を合成する(関連記事:深層学習で少量の音声データから自然な音声を作成、NTTテクノクロスが音声合成ソフト新版)。
今回、1つの言語の音声から、日本語、英語、標準中国語、韓国語の合成音声を生成する「クロスリンガル音声合成技術」を追加した(図1)。自身の声を使った多言語プレゼンテーションや、翻訳技術と連携させた同時通訳のプレゼンテーションなどに活用可能である。製品ページにおいて、クロスリンガル音声合成技術による合成音声の視聴が可能である。