sitin 0 关注者 关注 1天前 试了下 360 开源的 FG-CLIP 2, 直接把传统 AI 视觉理解给秒了。 以前让 AI 画「猫站在蓝色跑车左边,后面是白色 SUV」, 它连「后面」这个空间关系都搞不懂。 搜「红色特斯拉引擎盖上有鸟粪」, 两排图下来对得上的就一张。 这就是传统 CLIP 的通病 —— 近视,看不清细节。 FG-CLIP 2 能干嘛? 通过毛发纹理分辨狸花猫和英短, 看懂屏幕里面的内容, 理解「机 #FG-CLIP 2 #AI视觉理解 #中文理解 #开源 #细节识别 前往原网页查看