奥特曼太鸡贼了，用一个simple-bench排名为34位（LLM基本常识和推理能力测试排名），比grok 2还低。成功抢了世界的眼球，掩盖了Google发布的Genie 3世界模型。我剪辑了精彩Genie 3视频合集。两个字，震撼

#奥特曼 #Genie 3 #LLM #排名 #世界模型

相关新闻

蒜蓉鱿鱼须

21小时前

看到一句话，袁世凯是第一个死于个性化推荐算法的人… 这句话包含了所有我对LLM的担忧。

砍砍.ᐟ

3天前

好他妈烦啊都 2026 年了 LLM 的各种接口都还是各说各话的操

𝙩𝙮≃𝙛{𝕩}^A𝕀²·ℙarad𝕚g𝕞

4天前

harness engineering，我们给了LLM那么多tool-using tag，最终给了他们unix file system。

沉浸式翻译

5天前

你有没有发现：我们每天都在和 LLM 对话，但其实完全不理解它在“想”什么？大多数人以为 AI 是一条路走到黑的“概率复读机”，但真正卡住模型推理能力的，是它缺乏像人类一样“悔棋”和“推演”的过程。这个交互式站点，本质上是 LLM 思考过程的“CT 扫描仪”。在 AI 研究圈子里，它被当成是 2026 年最直观的 MCTS（蒙特卡洛树搜索）原理解释器。你学不会 AI 原理也许是因为

Jesse Lau 遁一子

6天前

G老大对我不薄啊。发现一个中等keywords，2天前上的page，排第三了

奥特曼太鸡贼了，用一个simple-bench排名为34位（LLM基本常识和推理能力测试排名），比grok 2还低。 成功抢了世界的眼球，掩盖了Google发布的Genie 3世界模型。 我剪辑了精彩Genie 3视频合集。两个字，震撼

相关新闻

奥特曼太鸡贼了，用一个simple-bench排名为34位（LLM基本常识和推理能力测试排名），比grok 2还低。成功抢了世界的眼球，掩盖了Google发布的Genie 3世界模型。我剪辑了精彩Genie 3视频合集。两个字，震撼