阿橡
0 关注者
AIGCLINK
2天前
阿里最新放出了一款用于理解和操作GUI的GUI Grounding模型:UI-Ins,在5个基准上刷出新SOTA,安卓任务成功率74.1% 主打一个“把一句话变成屏幕上的准确点击”,指令即推理,它把一句话拆成多条思维链,然后挑最靠谱的那条去点屏幕 有泛化推理能力,能组合出训练时没有明确教过的新推理角度 有7B、32B两版 UI-Ins的7B在AndroidWorld端到端任务成功率74.1
美团刚刚开源了一款低延迟全模态大模型:LongCat-Flash-Omni,128K上下文+支持超8分钟实时音视频交互 能听能看能说,毫秒级延迟,可以拿来搭建实时语音助手、直播弹幕机器人、音视频质检等 在OmniBench上超Gemini-2.5-Flash、Qwen3-Omni,接近Gemini 2.5 Pro;在MMBench与Gemini、GPT-4o、Qwen-VL相当;MVBench
Tony Huang
3天前
腾讯做了怎么办 阿里做了怎么办 小米做了怎么办 华为做了怎么办
Crypto_Painter
最近做交易一直亏钱? 看看本世纪的人类智慧结晶们,你会发现它们一样亏... 是不是好受一点了? 之前领跑的DeepSeek和Qwen都出现了巨大回撤,而其他大模型都亏的差不多了... 比较有趣的是垫底的Gemini最近居然在赚钱?
汤光头
4天前
他奶奶的 又跟大模型干了一天 大模型还是太笨了,效果总是不理想