NTTは2024年1月17日、大規模言語モデル(LLM)「tsuzumi」の拡張技術として、少量データから“本人らしい会話”を生成する「個人性再現対話技術」と、数秒~数分の音声から本人の音声を合成する「Zero/Few-shot音声合成技術」を開発したと発表した。これらにより、利用者の“デジタル分身”を低コストで実現できるという。
- > 前へ
- 1
- 2
NTTは2024年1月17日、大規模言語モデル(LLM)「tsuzumi」の拡張技術として、少量データから“本人らしい会話”を生成する「個人性再現対話技術」と、数秒~数分の音声から本人の音声を合成する「Zero/Few-shot音声合成技術」を開発したと発表した。これらにより、利用者の“デジタル分身”を低コストで実現できるという。
利用者そっくりの声と話し方で“デジタル分身”を実現─NTT版LLM「tsuzumi」の拡張技術 [ 2/2 ] NTTは2024年1月17日、大規模言語モデル(LLM)「tsuzumi」の拡張技術として、少量データから“本人らしい会話”を生成する「個人性再現対話技術」と、数秒~数分の音声から本人の音声を合成する「Zero/Few-shot音声合成技術」を開発したと発表した。これらにより、利用者の“デジタル分身”を低コストで実現できるという。