Gorden Sun 0 关注者 关注 1周前 VibeVoice-Realtime-0.5B:实时文本生成语音 微软开源,仅0.5B大小(基于LLM: Qwen2.5-0.5B),实时把文本转换成音频,仅300毫秒延迟。英语效果不错。 模型: 在线体验(不支持实时): 前往原网页查看