我刚刚做了一个测试，用同一中文指令让AI做简单程序（从polymarket找相应提问的预测值），然后用Claude 4.6、Codex、GLM4.6、Kimi、Deepseek3.2、Qwen这几个常用的中美Vibe工具测试。结果是Claude、GLM4.6不合格，无法提取结果，其他4个都完成了任务。所以我毫不犹豫退订了没完成任务的AI。

#AI测试 #Claude 4.6 #GLM4.6 #AI工具测评 #用户体验

相关新闻

比特傻

3个月前

我突然意识到我已经抛弃了gpt 有gemini存在，gpt对我似乎是一文不值即便付了费，我也这么多天没用gpt了回答啰嗦，反应慢，准确率似乎比gemini低一点表现形式还比gemini单调一点 OpenAI在我这里，似乎变得一文不值了这就是大模型竞争的残酷用户几乎没有任何粘性我是仅从我这样的用户角度出发我只和第一聪明的大模型交互稍微笨一点，不好意思，对我毫无价值我当然不是说，

Andy Stewart

3个月前

坦克今天更新的浮动歌词模式很不错，终于支持网易云了，而且浮动球的简洁模式比原来的星球模式要好很多，整体不突兀了坦克真的在默默改进产品，听劝，稳扎稳打，点赞👍

嘉叔🚀biantai***🈲

3个月前

无偿帮着推一下，你想感受互联网的皇帝服务吗？买这个👇🏻👇🏻👇🏻👇🏻 别问买了有什么用，情绪价值这一块比有什么用要重要。五千块买个新手机可能开心半天就厌了，五千块买个皇帝服务，你这辈子可能都会记得。

向阳乔木

3个月前

谁用过谷歌搜索的“手气不错”按钮？输入关键词，点击它，直接跳搜索结果第一名网页。直接跳转搜索结果，不展示广告。谷歌每年因此会损失1%搜索广告收入。为什么谷歌会一直保留到现在？给用户好体验、愉悦感，会提升用户忠诚度。谷歌AI模式也能快速给用户价值，未来应该会替换“手气不错”按钮。

陈尔冬是你大爷

3个月前

我必须要吐槽一下 JR 这个破体系。首先，众所周知，JR 是日本的交通命脉，我每天出行都得用。当然了在日本待久了也知道 JR 有九个分公司独立管理，东京属于东 JR。然后呢，我想着攒攒积分吧都花了这么多钱在 JR 上了，就开始注册 JRE point，这是东 jr 的积分系统。然后噩梦就开始了。首先是我要用西瓜卡绑定注册，发现很久没登录，账号密码怎么都不对。折腾了一大堆终于登录上，然后西

关联事件

AI编程工具激战：Claude Code、Gemini Cli崛起

1256

Claude Code持续快速发展，功能不断增加，竞争日益激烈。开发者社区积极探索其功能、应用并分享经验，第三方工具和应用生态系统不断涌现。Prompt工程的重要性日益凸显，Warp等终端Agent崭露头角。Cursor的Diff AI Edit能力被Cline开源。Claude正添加记忆功能以优化用户体验，与ChatGPT竞争。Gemini发布了类似的AI编程产品Gemini Cli。同时，开发者们也在积极探索如grep/ast-grep等工具在LLM时代Code Agent中的应用，以及如何利用AI优化产品经理的工作流程。此外，市场上还出现了“改版Claude-Code+订阅账户”的方案。