时政
财经
科技
虚拟货币
其他
登录
#语音克隆
关注
sitin
2周前
卧槽!程序员兄弟们快看!Cartesia 刚出的 Sonic - 3 语音 AI,实测真的猛到超出预期! 咱搞开发的都懂,之前用的语音模型要么延迟高得让人抓狂,要么适配起来麻烦得要死。 但这 Sonic - 3 不一样,放弃传统 Transformer 用了 SSM 架构,延迟直接压到 100ms 以内,实时交互终于不卡了,响应速度比我之前用过的所有 TTS 都快至少 4 倍,开发效率直接拉满! 而且这玩意儿支持 40 多种语言,还能智能读缩写,完全不用额外做适配工作,省下来的时间多写几行代码不香吗?想搞语音克隆?10 秒就能生成专属语音,企业版还能精细调音色,满足各种定制需求。 而且它刚融了 1 亿美金,后续迭代肯定也稳得一批。有需要的兄弟们可以试试!
#语音AI
#Sonic-3
#SSM架构
#低延迟
#语音克隆
分享
评论 0
0
小互
3周前
Fish Audio S1 语音克隆模型升级 情感表现力与拟真度大幅提升 它能生成富有情绪、节奏感与语气变化的真人级声音,完美再现人类说话时的细微差别。 你只需提供 10 秒钟的声音样本,它就能: 🎙️ 克隆任意人声; 🌍 保留口音、语调与节奏; 💬 还原说话习惯与个性; 🎭 生成几乎与真人无异的语音。 价格比 ElevenLabs 便宜 6 倍
#语音克隆
#Fish Audio S1
#情感表现力提升
#低成本
#人声模拟
分享
评论 0
0
冰河
2个月前
影视级的语音克隆!-IndexTTS2 语气,情绪全部带入。 开源,免费!Ai在加快速度替代我们!
OpenAI新德里发布会:ChatGPT语音翻译功能引发热议· 654 条信息
#语音克隆
#IndexTTS2
#开源免费
#AI替代
#情绪化
分享
评论 0
0
karminski-牙医
7个月前
才发现 GPT-SoVITS 发布新版本了,GPT-Sovits V3 TTS 407M,这个新模型提升了语音clone的效果。 另外,这个工具+模型是国产的哦,仅仅407M大小的模型,笔记本轻松运行。效果也是非常不错的。有需要的同学可以试试。 地址:
#GPT-SoVITS
#语音克隆
#国产工具
#GPT-Sovits V3
#TTS模型
分享
评论 0
0
小互
9个月前
我去 这个语音克隆模型有点牛P 哈哈哈 使用了 250,000 小时的中英双语语音数据训练 只需15秒的声音就能完美克隆声音,保持音色和情感 Llasa-3B 可以通过输入一个带有情感特征的语音提示(Prompt),在生成目标语音时保留提示语音中的情感特征。 基于 LLaMA 语言模型( 1B、3B 和 8B 参数规模),通过整合 XCodec2 的语音 token 提供语音生成功能。
#语音克隆
#Llasa-3B
#情感特征
#语言模型
#语音合成
分享
评论 0
0
个人主页
通知
我的投稿
我的关注
我的拉黑
我的评论
我的点赞