Ken Wong
0 关注者
KK.aWSB
3小时前
千亿大模型集体翻车,整个AI圈傻了。 3月25日,谷歌悄悄发布了ARC-AGI-3基准测试。 GPT-5:0.26% Claude:0.25% Grok:0%,直接交白卷 人类呢?旧金山街头随便找的测试者,100%满分。 这测试没规则、没目标、没说明。 扔进一个陌生环境,自己摸索,自己推理。 人类天生会的事,AI完全不会。
花花
8小时前
用了同样的问题提问claude gpt gemini,说实话,claude领先能力太强了,gemini和gpt差不多吧。 大家还有啥更聪明的大模型吗?我来学习一下。
Inty News
微软隆重推出 Critique,M365 Copilot 中全新的多模型深度研究系统。 可以同时使用多个模型来生成最佳的回复和报告。
偶像派作手
10小时前
中国人挺撕裂的,前一天还在说“先谈生存,再谈理想,没饭吃的时候,理想一文不值。” 今天就满屏的:“有梦想就去追,因为勇敢我的人生更精彩。” 一天崇尚实用功利主义,一天崇尚理想主义。随时切换。 同一批人同时活在两套需求里。
12小时前
印尼跟进禁令:16岁以下禁用社媒,全球封杀潮来了