Gorden Sun
0 关注者
小互
5天前
🎙️ MiniMax Speech 2.6 发布 ⚡ 延迟 <250ms 🧠 智能文本处理:自动识别网址、日期、数字 🎤 真人级语音:支持克隆音色与情感表达 🌍 40+ 语言,流畅混读 但是从演示视频来看,似乎拟人和情感方面没有展示出来,这个演示视频做的太差了。 之前Speech 2.5 在中文情感能力方面很不错... 一次失败的演示...
sitin
1周前
Decart 和 ElevenLabs 联合退出唇形同步 API 让 AI 角色说话时嘴型完全同步、语气自然、有情感 低延迟 + 真唇形:ElevenLabs 负责流式输出情感语音,Decart 的 Lipsync 服务实时把每个音素映射成嘴部动画帧,边说边对齐,不再“对不上嘴”。 能被“礼貌地打断”:用户一开口,VAD(语音活动检测)触发中断信号,角色会自然停下,再接着对话,不会“自顾自说完
独立开发者|欧维Ove
2周前
AI语音生成的赛道跑出来了很多成功的独立开发产品啊
Leo Xiang
3周前
11labs 已经有这么丰富的产品组合了,国内最接近11labs的公司是哪家?
ginobefun
最近听了 ElevenLabs 联合创始人兼 CEO Mati Staniszewski 的一次访谈,让我对 AI 时代的创业机会有了全新的思考。Mati 来自波兰,他创业的初衷非常有趣,源于他从小就无法忍受波兰引进的外国电影——所有角色,无论男女,都由同一个声音用平淡无奇的语调配音。他最初的宏大愿景,就是用 AI 彻底改变这个糟糕的配音行业。 让我感到意外的是,他们放弃了这个性感的梦想,并因此
OpenAI新德里发布会:ChatGPT语音翻译功能引发热议
617
在新德里举行的活动中,OpenAI宣布即将推出o3-Pro模型,取代现有的o1-Pro模型,旨在提升ChatGPT的推理能力和功能。同时,OpenAI还发布了ChatGPT高级语音模式的升级,新增了自然停顿、重音处理、同理心表达和双向自动翻译等功能。这一更新已向所有付费用户开放,预计将进一步增强ChatGPT的用户体验和市场竞争力。随着用户基数的不断扩大,OpenAI的这些新功能引发了广泛关注,尤其是在人工智能语音交互领域的应用潜力。