时政
财经
科技
虚拟货币
其他
登录
#语音AI
关注
sitin
1个月前
卧槽!程序员兄弟们快看!Cartesia 刚出的 Sonic - 3 语音 AI,实测真的猛到超出预期! 咱搞开发的都懂,之前用的语音模型要么延迟高得让人抓狂,要么适配起来麻烦得要死。 但这 Sonic - 3 不一样,放弃传统 Transformer 用了 SSM 架构,延迟直接压到 100ms 以内,实时交互终于不卡了,响应速度比我之前用过的所有 TTS 都快至少 4 倍,开发效率直接拉满! 而且这玩意儿支持 40 多种语言,还能智能读缩写,完全不用额外做适配工作,省下来的时间多写几行代码不香吗?想搞语音克隆?10 秒就能生成专属语音,企业版还能精细调音色,满足各种定制需求。 而且它刚融了 1 亿美金,后续迭代肯定也稳得一批。有需要的兄弟们可以试试!
#语音AI
#Sonic-3
#SSM架构
#低延迟
#语音克隆
分享
评论 0
0
小互
10个月前
OpenAI 开发者日,推出了一个实时 API 可以通过语音和3D太阳系进行实时的语音交互 该项目基于 Spline(3D 设计工具)构建,使用 Function Calling 机制来触发应用中的动画和交互。 结合语音 AI、WebRTC 和 3D 交互的演示项目,可用于探索太阳系,也可扩展到其他语音控制 3D 场景应用。 适合开发者学习 Function Calling、WebRTC 实时交互、3D 数据可视化等技术。 可定制 AI 交互方式,或更换 3D 场景,适用于教育、游戏、数据可视化等领域。
#OpenAI
#API
#实时语音交互
#3D太阳系
#Function Calling
#Spline
#WebRTC
#语音AI
#开发者日
分享
评论 0
0
个人主页
通知
我的投稿
我的关注
我的拉黑
我的评论
我的点赞