sitin

sitin

0 关注者

1天前

试了下 360 开源的 FG-CLIP 2, 直接把传统 AI 视觉理解给秒了。 以前让 AI 画「猫站在蓝色跑车左边,后面是白色 SUV」, 它连「后面」这个空间关系都搞不懂。 搜「红色特斯拉引擎盖上有鸟粪」, 两排图下来对得上的就一张。 这就是传统 CLIP 的通病 —— 近视,看不清细节。 FG-CLIP 2 能干嘛? 通过毛发纹理分辨狸花猫和英短, 看懂屏幕里面的内容, 理解「机

相关新闻

关联事件