时政
财经
科技

#TTS

Geek
Geek
2025-05-29 12:18:55

据说这个生产级开源 TTS 模型 Chatterbox 非常屌,在 GitHub 上线仅 12 小时就收获 600+ Star,我不玩音频,转需: Github 试听

#Chatterbox#开源#GitHub
Leo Xiang
Leo Xiang
2025-05-24 23:43:25

Gemini 放出来了一次性合成多个人的对话的TTS,复现NotebookLM 的多人播客效果的门槛也没了。

#Gemini#TTS#NotebookLM
Leo Xiang
Leo Xiang
2025-05-23 21:02:15

好消息是:gemini live api 支持中文了 坏消息是: 中文tts效果基本没法听

#API#中文支持#TTS
向阳乔木
向阳乔木
2025-05-21 09:20:47

昨天大半夜,蝗虫群友在讨论各种免费TTS解决方案。 讨论还挺干的,分享下。 1. 一个实战派群友推荐:GPT-SoVITS,主要比较稳定 2. 另一个群友经验:开始用 GPT-SoVITS,后面用阿里开源的CosyVoice,又换F5,又换了 Index 还有群友补充:文本转语音,还是火山引擎好,声音自然,有感情,并且免费。

#TTS#免费解决方案#技术交流
向阳乔木
向阳乔木
2025-04-03 14:48:44

阿里开源的Cosyvoice2 TTS质量真不错。 Mac M3 24G本地就能运行,0.5b版本就够用,也比较快。 外语支持英文、日文、韩文。 汉语支持普通话、四川话、南京话、天津话等各地方言。 还能通过提示词指定语气、情绪。还能通过特殊标记添加笑声等精细化控制。 本地运行,没审查,什么内容都能合成!

#阿里开源#Cosyvoice2#TTS
Gorden Sun
Gorden Sun
2025-01-23 18:55:28

AI Video Starting Kit:AI时代的视频编辑器 fal开源的网页应用,整合了图片、视频、TTS、音乐的各种AI API,然后在网页里可以生成+编辑。功能目前还比较简陋。 Github: 限时在线体验,可以免费使用可灵1.5和海螺视频模型、Flux Ultra图片模型:

#AI#视频编辑#开源
AI Video Starting Kit:AI时代的视频编辑器
fal开源的网页应用,整合了图片、视频、TTS、音乐的各种AI API,然后在网页里可以生成+编辑。功能目前还比较简陋。
Github:
限时在线体验,可以免费使用可灵1.5和海螺视频模型、Flux Ultra图片模型:
Jerlin
Jerlin
2025-01-15 13:48:17

🪶 挖到宝了,TTS 悄咪咪学会了讲骚话。 这个轻便的 KokoroTTS 可能是市面上唯一能直出 ASMR 效果的??? 音色毫无廉价感,在 Mac 上也能轻松驾驭。(我..……我有个朋友,有个邪恶的想法…… 用 Cursor 把图文音揉成一个小示例看看,模型链接和音色 ID 我放在 1 楼 ⬇️

#TTS#KokoroTTS#ASMR
🪶 挖到宝了,TTS 悄咪咪学会了讲骚话。

这个轻便的 KokoroTTS 可能是市面上唯一能直出 ASMR 效果的???
音色毫无廉价感,在 Mac 上也能轻松驾驭。(我..……我有个朋友,有个邪恶的想法……

用 Cursor 把图文音揉成一个小示例看看,模型链接和音色 ID 我放在 1 楼 ⬇️
没有更多了 🤐