AIGCLINK

AIGCLINK

0 关注者

22小时前

阿里今天还放出来一款实时多模态同传模型:Qwen3-LiveTranslate-Flash,具备视觉能力,能听能看,3秒延迟可实时翻译 能识别18语言和粤语、北京话、四川话等6种方言,能说10种语言 引入了视觉上下文增强技术,可以识别口型、动作、文字、实体,解决在嘈杂音频环境,或者是一词多译词场景下的翻译问题 中英及多语言语音翻译准确度优于Gemini-2.5-Flash、GPT-4o-