Gorden Sun 0 关注者 关注 1天前 微软开源语音识别模型VibeVoice-ASR 9B大小,支持中文,能同时识别时间戳、说话人、说话内容,最长可以单次识别60分钟的音频。 模型: 在线体验: 前往原网页查看