Michael Anti 0 关注者 关注 4小时前 我刚刚做了一个测试,用同一中文指令让AI做简单程序(从polymarket找相应提问的预测值),然后用Claude 4.6、Codex、GLM4.6、Kimi、Deepseek3.2、Qwen这几个常用的中美Vibe工具测试。结果是Claude、GLM4.6不合格,无法提取结果,其他4个都完成了任务。所以我毫不犹豫退订了没完成任务的AI。 #AI测试 #Claude 4.6 #GLM4.6 #AI工具测评 #用户体验 前往原网页查看