再给 Grok 4 一次机会哈 上个20小球测试有朋友说一个case不能代表什么, 我就问一句, 如果你写代码, 上来的第一个 case 就拉跨, 你还会再用这个模型吗? 两个 case 也拉跨呢? 汰欧蜜!撸可英买埃斯! 这个是上个月我做出来的拆烟囱测试, 主要是使用 Three.js 来模拟一个三维场景, 尤其是这个烟囱完全需要大模型生成代码自己搭起来. 然后在烟囱底部设置爆炸点, 炸掉一部分砖块后, 影响烟囱的平衡导致烟囱倒塌。 这个测试相对于20小球七边形测试来说, 考察物理效果其实没有 20 小球复杂, 它只有碰撞和重力, 并且都能依靠 Three.js 库的插件来实现. 所以考察项目更多聚焦于 prompt 的指令遵循和前端代码的能力以及创造性. 直接来看 Grok4 表现好的和不好的地方。 好的: 倒塌的模拟不错, 模型的放置, 重力方向起码没有搞错 不好的: 默认的烟囱就是个已经爆炸到一半的烟囱是绷不住了,这个连上个月测试的 kimi 和 minimax 的开源模型都不至于这么抽象 爆炸的粒子模拟很怪,勉强能理解那个白色的是一团烟雾 光影效果特别差,对比左边的 DeepSeek 一眼就能看出来了 web 交互写得也很差, 看 DeepSeek 的按钮, 这个的按钮就是个灰色的按钮 (在画面外) 以及最重要的, 它生成其实是失败的!我反复测试3次都有代码错误。它引用库的方法有问题  (Uncaught TypeError: Failed to resolve module specifier "three". Relative references must start with either "/", "./", or "../".),并且它自己修不好这个报错。我只能用 Claude-4-Sonnet 修了一下才能正确运行........ 结论:别用这玩意写代码, 爱咋咋地吧, 累了 #Grok4
𝐂𝐥𝐚𝐮𝐝𝐞 𝐂𝐨𝐝𝐞 使用 𝐌𝐂𝐏 𝐒𝐞𝐫𝐯𝐞𝐫 的反向观察 看到一篇”Claude Code 十大必备 MCP 服务器“,然后突然想到一个恶作剧,我的结论”大多数没有必要“,下面是逐一评论。 首先要补充的是, 在claude code没出来之前, mcp的价值还是说的过去的,我曾一度疯狂推荐。但是cc出来,尤其是后面又补充了slash commands, 基本将客户端能力提高到了一个天花板高度,mcp的位置就有点尴尬了。 原文链接见评论 1. GitHub MCP Server:说实话,意义不大。与其通过MCP Server绕一圈,不如直接安装官方gh客户端。这些命令在Claude Code里直接调用,比通过MCP中转更直接、更高效。 2. Apidog MCP Server:这个值得一试。API文档和测试的集成确实能带来一些便利,特别是在处理复杂API项目时,能够直接在Claude Code中查询API规范和测试端点,省去了切换工具的麻烦。 3. File System MCP Server:典型的脱裤子放屁。Claude Code本身就能直接操作文件系统,为什么还要加一层MCP?是为了用MCP而用MCP。 这个工具在claude desktop使用还是成立的。 4. Sequential Thinking MCP Server:基本不建议使用。虽然很多人说用了效果很好,但我的理由很简单:不要教大模型如何思考。真要让ai思考, prompt加上think hader, untrathink 这些关键词效果也不会差到哪。 5. Puppeteer MCP Server:这个值得一试。网页自动化操作确实是Claude Code原生能力的有效扩展。能够控制浏览器、进行UI测试、数据抓取等操作,这些都是能力拓展,而不是重复造轮子。 6. PostgreSQL MCP Server:可用可不用。如果是本地PostgreSQL,直接在slash commands里调用psql命令基本够用。psql 原生命令比通过MCP转换自然语言查询更可控、更高效。mcp扩展出来的能力, 基本你在prompt都可以扩展出来。 7. Notion MCP Server:这个可行。将外部任务管理系统集成到Claude Code确实有其价值,特别是团队协作场景下,能够直接从开发环境更新任务状态、获取需求文档,是真正的工作流优化。 8. Memory Bank MCP Server:不建议使用。状态持久化这个概念可能并不是一个好主意,甚至可以说是有毒的。每次对话都应该是独立的上下文,强行维持跨会话的记忆可能会带来更多的混乱而不是帮助。这是我的个人主观观点,但我坚持认为无状态才是AI助手的正确使用方式。 9. Figma MCP Server:强烈推荐。这是能力拓展的最佳体现,特别适合程序员操作自己不熟悉的设计工具。能够直接将设计稿转换成代码,这种跨领域的能力补充才是MCP Server真正应该做的事情。 10. Zapier MCP Server:可用可不用,zapier是一个很酷的跨应用工具,但也没那么实用。