时政
财经
科技
登录
#语音模型
关注
Tom Huang
2周前
这个也疯狂了🤯 通过一段提示词就可以激活下面这样的虚拟世界并可以自由的探索⚡️ 想象一下还可以添加其他角色,可以通过 LLMs + 语音模型的方式进行虚拟世界里真实的交谈 直接构建一整个实时互动的虚拟世界 提示词地址 👉
#虚拟世界
#提示词
#实时互动
#LLMs
#语音模型
分享
评论 0
0
小互
4个月前
兄弟们,这个全新的语音模型很厉害 已经无法分辨了 Sesame: “跨越语音“恐怖谷” ,像真人说话一样的语音模型 当人工合成的语音接近真实人声但仍然存在微小差异时,人类会感到奇怪或不适,这就是所谓的“恐怖谷效应”。 Sesame 公司展示了其最新的语音合成模型CSM, 它在个性、记忆、表达能力和恰当性上表现出了非常惊人的能力。
#语音模型
#恐怖谷效应
#语音合成
#Sesame公司
#CSM
分享
评论 0
0
Gorden Sun
5个月前
VITA-1.5:开源版视频+语音模型 效果类似ChatGPT APP的视频交互,能看能听能说,但不是原生多模态。视觉多模态LLM使用的是QWen2.5,语音延迟只有1.5秒,且支持打断。 Github:
#VITA-1.5
#开源
#视频模型
#语音模型
#ChatGPT
#视频交互
#视觉多模态
#QWen2.5
#语音延迟
#GitHub
分享
评论 0
0
个人主页
通知
我的投稿
我的关注
我的拉黑
我的评论
我的点赞