2个月前

阿里刚刚又发布了新模型 Qwen3-Omni-Flash-20251201 这是个 Qwen3-Omni-Flash 的更新版本, 这个模型是个所谓的"全模态"模型, 可以接受文本,语音,图片,视频输入, 然后可以输出文本和语音. 特别适合用在端侧设备上, 辅助通用任务的执行. 我能想到的比如各种无人场景都可以, 比如无人导购, 无人前台等等. 具体性能提升的话, 看官方评测各个方向的 be

热门新闻