SoulX-Podcast 是 Soul AI Lab 推出的多说话人文本到语音(TTS)模型,专为生成长篇播客对话设计。模型参数为1.7B,支持普通话、英语及多种汉语方言(如四川话、河南话、粤语等),具备跨方言提示功能,可通过普通话提示生成目标方言语音。模型支持副语言控制(如笑声、叹气等),增强语音合成的真实感。SoulX-Podcast 能生成超过 90 分钟的连贯对话,保持稳定的音色和情感连...详情>>
SoulX-Podcast是什么SoulX-Podcast 是 Soul AI Lab 推出的多说话人文本到
SoulX-Podcast 是 Soul AI Lab 推出的多说话人文本到语音(TTS)模型,专为生成长篇播客对话设计。模型参数为1.7B,支持普通话、英语及多种汉语方言(如四川话、河南话、粤语等)