Daniel Fang
1 关注者
宝玉
1个月前
让娃用Sora2生成了个生日祝福视频,爷爷没看出来这孙子是AI生成的
dontbesilent
想要“接住这波流量”是对内容不够理解的表现 不是所有的流量都是用来变现的 变现的方式也不是在内容火了之后才开始思考的 如果你不知道下一条爆款什么时候出现,你需要解决的是:让自己知道下一条爆款什么时候出现 而不是“接流量”
5个月前
grok 是如何看懂视频的? 目前好像没有哪个大模型是支持把视频发送过去的吧?
進
8个月前
秒懂川普,原來想做第二個他!狠活兒來了:中美放棄幻想、在這鬥爭!請觀看視頻👇👇👇:
AIGCLINK
西北工业大学开源了一个语音理解模型:OSUM,支持8种语音理解任务,从ASR到情感识别,以及语音到文本的深度理解 支持语音识别(ASR) 带时间戳的语音识别(SRWT) 声音事件检测(VED) 语音情感识别(SER) 说话风格识别(SSR) 说话者性别分类(SGC) 说话者年龄预测(SAP) 语音到文本对话(STTC) 它结合了Whisper和Qwen2,采用ASR+X训练策略,支持多任务同时