奥特曼太鸡贼了,用一个simple-bench排名为34位(LLM基本常识和推理能力测试排名),比grok 2还低。 成功抢了世界的眼球,掩盖了Google发布的Genie 3世界模型。 我剪辑了精彩Genie 3视频合集。两个字,震撼
奥特曼太鸡贼了,用一个simple-bench排名为34位(LLM基本常识和推理能力测试排名),比grok 2还低。 成功抢了世界的眼球,掩盖了Google发布的Genie 3世界模型。 我剪辑了精彩Genie 3视频合集。两个字,震撼
Jesse Lau 遁一子
5小时前
基于奥特曼一向的鸡贼,我对他发布的opensource懒得找API测试了。 果然,simple-bench排名为34位,还在grok 2之下
orange.ai
6小时前
Google 发布的 Genie3 非常惊艳 在最现金的世界模型之下,游戏和视频已经没有分别 它把《完蛋!我被美女包围了!》这样的选择性互动做到了无限细分。 它的局限是目前所支持的行动和时间都还比较有限。 只支持几分钟,只能放在一些游戏场景里。
𝙩𝙮≃𝙛{𝕩}^A𝕀²·ℙarad𝕚g𝕞
1天前
Vibe Coding与数字复制子的自举机制 Vibe Coding(又称 vibecoding)是一种新兴的开发模式: 通过自然语言提示驱动LLM自动生成并迭代代码 。 正如定义所述,“你描述想要做什么 → AI把代码全写好 → 人只做测试与微调” 。IBM将其称为“从意图(intent)直接到可执行代码”的新世代软件生产模式 。 Vibe Coding消灭了代码开发中自然语言与形式语言的
𝙩𝙮≃𝙛{𝕩}^A𝕀²·ℙarad𝕚g𝕞
1天前
谁能想到,LLM-code-cli最先把github给干了 vibe coding不再需要到github上fork或者copy&paste了?