时政
财经
科技
虚拟货币
其他
登录
#语音生成
关注
Gorden Sun
2周前
FireRedTTS-2:小红书开源的TTS 一次性能生成3分钟长的语音,最多支持4个人物,支持多种语音,延迟较低,稳定性高。 Github:
#小红书
#TTS
#语音生成
#开源
#FireRedTTS-2
分享
评论 0
0
AIGCLINK
1个月前
微软昨晚开源新模型:VibeVoice-1.5B TTS,可一次生成90分钟语音、多人对话 效果听起来质量很高,在说话人一致性和自然轮转上都非常不错 VibeVoice能生成90分钟连续语音,支持4个不同说话人,对像播客这种长篇音频内容生成比较实用 基于Qwen2.5-1.5B理解上下文和语义,有两个连续语音分词器,这两个分词器以 7.5Hz的超低帧率运行,在保证音频质量的同时,提高了计算效率,使得处理长序列成为可能 模型最终输出带 AI 声明水印 支持中/英文 MIT许可证 #TTS #VibeVoice
#微软
#VibeVoice-1.5B TTS
#开源模型
#语音生成
#多人对话
分享
评论 0
0
向阳乔木
8个月前
让人物开口自然讲话教程(英文版) 1. Kokoro TTS生成音频。 2. Pixverse 上传图片创建人物角色 3. Pixverse 选角色,上传TTS音频对口型 4. Pixverse处理 ,画质升为4K 5. 剪映导入,添加双语智能字幕,调字体和颜色
#KokoroTTS
#Pixverse
#语音生成
#图像处理
#4K画质
#剪映
#字幕制作
分享
评论 0
0
个人主页
通知
我的投稿
我的关注
我的拉黑
我的评论
我的点赞