小互

小互

0 关注者

1天前

卧槽 兄弟们 Soul发布的这个语音模型 很强 SoulX-Podcast实现了: 高真实度、长时段、多说话人、多语种(中英双语 + 多方言)播客式语音生成 具备方言与副语言(如笑声、叹气等)控制能力 可连续生成 90 分钟以上 的对话内容而不失稳定性 支持普通话、英语及多种中文方言多人多轮对话 还支持在零样本(zero-shot)条件下完成声音与语气的克隆与迁移