VALL_E_X语音克隆带6款模型-整合版

整站源码 3 周前 0 0 9.9

VALL-E X 可以通过仅使用未曾见过的说话者的 3 秒录音作为声学提示，合成高质量的个性化语音，即使是对于一位母语讲者，也可以在另一种语言中执行。此实现支持三种语言（英语、中文、日语）的零尝试、单语 / 跨语言文本到语音功能。

使用教程

1.上传一个持续3到10秒的语音作为音频提示，并键入您想要合成的文本。

2.模型将用您的音频提示相同的声音合成给定文本的语音。

3.该模型还倾向于保留您给定语音的情感和声学环境。

声明：本站所有文章，如无特殊说明或标注，均为本站原创发布。任何个人或组织，在未征得本站同意时，禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益，可联系我们进行处理。