NTTテクノクロスは2023年1月20日、音声合成エンジンソフトウェア「FutureVoice Crayon」に「クロスリンガル音声合成技術」を追加した。1つの言語の音声から、日本語、英語、標準中国語、韓国語の合成音声を生成できるようにした。自身の声を使った多言語プレゼンテーションや、翻訳技術と連携させた同時通訳のプレゼンテーションなどに活用可能である。なお、FutureVoice Crayonは、サーバーソフトウェアやクラウドサービス、アプリケーション組み込み用のSDK(ソフトウェア開発キット)など、複数の形態で提供している。
NTTテクノクロスの「FutureVoice Crayon」は、テキストデータを音声で読み上げる音声合成エンジンソフトウェア。サーバーソフトウェアやクラウドサービス、アプリケーション組み込み用のSDK(ソフトウェア開発キット)など、複数の形態で提供している。ディープラーニング(深層学習)を活用して合成音声を生成する。
イントネーションや声質の元となる音声データベースを利用し、異なる話者の音声データから読み方やアクセントを補うことで、所望の話者の少量の音声データからその話者の自然な音声を合成する(関連記事:深層学習で少量の音声データから自然な音声を作成、NTTテクノクロスが音声合成ソフト新版)。
今回、1つの言語の音声から、日本語、英語、標準中国語、韓国語の合成音声を生成する「クロスリンガル音声合成技術」を追加した(図1)。自身の声を使った多言語プレゼンテーションや、翻訳技術と連携させた同時通訳のプレゼンテーションなどに活用可能である。製品ページにおいて、クロスリンガル音声合成技術による合成音声の視聴が可能である。
図1:「FutureVoice Crayon」のクロスリンガル音声合成技術を活用した例。1人の話者が4カ国語で話すアプリケーションを実現可能である(出典:NTTテクノクロス) - 業務システム 2027年4月強制適用へ待ったなし、施行迫る「新リース会計基準」対応の勘所【IT Leaders特別編集版】
- 生成AI/AIエージェント 成否のカギは「データ基盤」に─生成AI時代のデータマネジメント【IT Leaders特別編集号】
- フィジカルAI AI/ロボット─Society 5.0に向けた社会実装が広がる【DIGITAL X/IT Leaders特別編集号】
- メールセキュリティ 導入のみならず運用時の“ポリシー上げ”が肝心[DMARC導入&運用の極意]【IT Leaders特別編集号】
- ゼロトラスト戦略 ランサムウェア、AI詐欺…最新脅威に抗するデジタル免疫力を![前提のゼロトラスト、不断のサイバーハイジーン]【IT Leaders特別編集号】
-
VDIの導入コストを抑制! コストコンシャスなエンタープライズクラスの仮想デスクトップ「Parallels RAS」とは
-
AI時代の“基幹インフラ”へ──NEC・NOT A HOTEL・DeNAが語るZoomを核にしたコミュニケーション変革とAI活用法
-
加速するZoomの進化、エージェント型AIでコミュニケーションの全領域を変革─「Zoom主催リアルイベント Zoomtopia On the Road Japan」レポート
-
14年ぶりに到来したチャンスをどう活かす?企業価値向上とセキュリティ強化・運用効率化をもたらす自社だけの“ドメイン”とは
-
-
-
-
生成AIからAgentic AIへ―HCLSoftware CRO Rajiv Shesh氏に聞く、企業価値創造の課題に応える「X-D-Oフレームワーク」
-
-
-
「プラグアンドゲイン・アプローチ」がプロセス変革のゲームチェンジャー。業務プロセスの持続的な改善を後押しする「SAP Signavio」
-
BPMとプロセスマイニングで継続的なプロセス改善を行う仕組みを構築、NTTデータ イントラマートがすすめる変革のアプローチ
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-



