Gorden Sun

Gorden Sun

0 关注者

1周前

beltout:能改变音色的语音模型 这个模型很有意思,不是克隆人声的音色,而是改变人声的音色。6G的3060显卡就能跑,但这是基模,要达到可控的效果,还需要继续训练。 模型:

#语音模型 #音色改变 #6G显卡 #可控训练 #技术原型

相关新闻

placeholder

Tom Huang

2个月前

这个也疯狂了🤯 通过一段提示词就可以激活下面这样的虚拟世界并可以自由的探索⚡️ 想象一下还可以添加其他角色,可以通过 LLMs + 语音模型的方式进行虚拟世界里真实的交谈 直接构建一整个实时互动的虚拟世界 提示词地址 👉

placeholder

小互

6个月前

兄弟们,这个全新的语音模型很厉害 已经无法分辨了 Sesame: “跨越语音“恐怖谷” ,像真人说话一样的语音模型 当人工合成的语音接近真实人声但仍然存在微小差异时,人类会感到奇怪或不适,这就是所谓的“恐怖谷效应”。 Sesame 公司展示了其最新的语音合成模型CSM, 它在个性、记忆、表达能力和恰当性上表现出了非常惊人的能力。

placeholder

Gorden Sun

8个月前

VITA-1.5:开源版视频+语音模型 效果类似ChatGPT APP的视频交互,能看能听能说,但不是原生多模态。视觉多模态LLM使用的是QWen2.5,语音延迟只有1.5秒,且支持打断。 Github:

placeholder
© 2025 news.news. All rights reserved. 0.07588 秒. v1.0.46
我的评论