- 名称
- Intelli-Z: Toward Intelligible Zero-Shot TTS
- 描述
尽管最近的大量研究提出了使用大规模真实世界数据的零样本 TTS 的新框架,但关注零样本 TTS 清晰度的研究相对较少。零样本 TTS 需要付出额外的努力来确保清晰的发音和语音质量,因为它在推理阶段需要用新参数替换核心参数(扬声器嵌入或声音提示)。在本研究中,我们提出了一种专注于清晰度的零样本 TTS 模型,我们将其称为 Intelli-Z ...
尽管最近的大量研究提出了使用大规模真实世界数据的零样本 TTS 的新框架,但关注零样本 TTS 清晰度的研究相对较少。零样本 TTS 需要付出额外的努力来确保清晰的发音和语音质量,因为它在推理阶段需要用新参数替换核心参数(扬声器嵌入或声音提示)。在本研究中,我们提出了一种专注于清晰度的零样本 TTS 模型,我们将其称为 Intelli-Z ...