AIGCLINK 0 关注者 关注 22小时前 阿里今天还放出来一款实时多模态同传模型:Qwen3-LiveTranslate-Flash,具备视觉能力,能听能看,3秒延迟可实时翻译 能识别18语言和粤语、北京话、四川话等6种方言,能说10种语言 引入了视觉上下文增强技术,可以识别口型、动作、文字、实体,解决在嘈杂音频环境,或者是一词多译词场景下的翻译问题 中英及多语言语音翻译准确度优于Gemini-2.5-Flash、GPT-4o- #AI同传 #Qwen3-LiveTranslate-Flash #多模态翻译 #实时翻译 #阿里 前往原网页查看