时政
财经
科技
虚拟货币
其他
登录
#Qwen3-Omni-30B-A3B-Captioner
关注
nicekate
2周前
Qwen 开源 Qwen3-Omni-30B-A3B-Captioner,不明白这里的 Captioner 是什么意思,让 GPT 解释了下 Captioner”指的是“音频描述生成器”——一种专门做音频描述(audio captioning)的模型:输入任意一段音频,模型用自然语言生成对声音场景的细致描述,而不是逐字把人声转成文本 举个例子: 给模型一段街头录音,ASR会输出“有人说:‘往左走’”; 而Captioner会输出“傍晚的繁忙街道上,车辆驶过伴随间歇的喇叭声,远处有人交谈”。
#Qwen3-Omni-30B-A3B-Captioner
#音频描述生成器
#audio captioning
#声音场景描述
#自然语言生成
分享
评论 0
0
个人主页
通知
我的投稿
我的关注
我的拉黑
我的评论
我的点赞