LinkedIn 上有人分享了如何构建 99% 代码都是 AI 来写的系统。系统性思维很棒,翻译了一下: 到现在我已经用 Claude Code 和 Copilot 来写代码差不多一个月了,基本就是我自己几乎不写——99.9% 的代码都是 AI agent 写的。下面是我能靠 AI 干成的事情,以及大概的花费: Claude Code:大约 12.5 亿 Tokens,花了 ~640 美元 Copilot:1375 次高级请求,企业版(39 美元/月) Claude Chat:几百次对话,同样是企业版(应该和 Copilot 一样) 代码库的变化: * 新增 197K 行代码 * 删除 208K 行代码 * 主分支上有 355 次提交 * 合并了 180 个 PR * 解决了 98 个 GitHub issue 我是怎么做到的? 1) 所有代码都必须过一套非常严格的 CI/CD 流程:静态检查、格式化、代码安全工具,还有完整的测试集 2) 代码库已经模块化了,每个组件都通过清晰的接口来调用 3) 接口和实现完全分开 4) 每个组件都有自己的文档 5) 每个组件的测试、文档、头文件、实现都放在一起 6) 每个组件保持在 5k 行代码以下(包括文档) 7) 每个 GitHub issue 都写得很详细,带代码引用和问题描述 8) 搭建了一个 7 层的提示体系,记录各种规范:工具层(Copilot vs Claude)、语言层(C++ vs Python)、项目层(按仓库)、角色层(开发 vs 测试 vs 架构 vs 审查)、组件层(按目录)、任务层(对应 GitHub issue)、执行层(具体操作) 这样,我只需要分配任务,15-30 分钟就能拿到第一版,然后我再迭代、审查、验证,最后一小时内就能提交——几乎不用我亲手敲代码。 现在真正的瓶颈是我自己,因为我审查代码的速度跟不上。 而且 Claude Code 现在已经包含在企业计划里了。是时候继续玩一玩,让我的“Agent 军团”来帮我缓解这个瓶颈。
Max For AI
1个月前
突发!Deepseek最新模型被外网爆出恶性Bug?? 一早起来,看到群里炸了锅! 主角是我们备受期待的 DeepSeek V3.1 模型。 有用户反馈,该模型在生成文本时,会毫无征兆地随机插入“极”这个汉字(繁体简体都会) 根据相关讨论帖,有人去做了复现: 这个“极”字 bug 最初是在火山引擎、chutes 等第三方 API 平台上被发现的。 当开发者们像往常一样调用模型进行代码生成、数据处理等任务时,冷不丁地就会在输出结果中看到一个「极」字,导致代码编译失败、JSON 格式错乱,让人哭笑不得。 起初,大家普遍猜测这可能是第三方服务商在模型量化、部署配置或硬件上的差异导致的。 然而,经过热心网友们的进一步测试,发现 DeepSeek 的官方 Playground 也同样无法幸免,只是出现问题的概率相对较低。 问题根源猜想: 有技术大神深入分析后发现,这个「极」字在模型中的 token ID 是 2577,而我们常用的省略号(...)的 token ID 是 2576,两者紧密相邻。 大家猜测问题根源可能有两个: 1. 数据集“污染” : 可能是在数据清洗阶段,有些包含特殊或错误字符的数据没有被彻底过滤。 2. 模型“偷懒” : 模型在训练时可能找到了某种“捷径”,在某些情况下会错误地选择相邻的 token。 更令人头疼的是,一旦这个 bug 被触发,模型在后续的对话中似乎会“上瘾”,「极」字的出现频率会显著增加,严重影响了模型的可用性。 影响范围: 目前来看,这个 bug 对于需要高精度、结构化输出的场景是致命的,比如: 代码生成 :随机插入的汉字会让代码无法通过编译。 API 调用 :破坏 JSON 或其他结构化数据的格式。 学术写作 :影响文章的严谨性和专业性。 写在最后: 这个 bug 的出现,无疑给 DeepSeek V3.1 的使用者们带来了不小的困扰。 希望 DeepSeek 官方能够尽快注意到这个问题,并发布紧急修复。 PS:图4️⃣是外国贴吧里的讨论帖,目前无法确认是不是同一批人的反馈。
宝玉
1个月前
简单说下 Cursor 和 Claude Code 什么区别 它们最大的不同是运行环境,一个是命令行,一个是在 IDE 里面,虽然 Claude Code 也能以插件集成到各种 IDE,但还是以命令行方式运行,而 Cursor 是 VSCode 的套客,在 VSCode 基础上集成了自己的 AI 功能。 其次的不同是计费方式和 Token 消耗。Cursor 虽然也有 Agent 功能,但是计费方式是以 Tokens 的消耗来算的,一个长一点的任务可能就要不少钱了(这个我没具体数据);而 Claude Code 是包月的,但也不是无限制,而是每 5 个小时有个最大 Tokens 消耗限额,超过了就需要等下个 5 小时才能继续用,但总的来说还是合算的,而且没有 Tokens 消耗的焦虑。 计费方式的不同导致了它们在实现上的差异,Claude Code 就是简单粗暴,默认不压缩上下文,把所有消息历史都放上下文中发给模型,这样对于模型来说由于上下文没损耗所以生成质量相当好,但 Cursor 的 Agent 可能会压缩上下文导致效果要差一些;另外 Claude Code 一个任务可以很长时间,而 Cursor Agent 可能几轮就停下来,怕不小心消耗了太多 Tokens。 其他还有一些差异,比如 Cursor 有很多模型可以选,而 Claude Code 默认只能用 Claude 4 模型,当然你也可以修改环境变量或者用一些代理软件切换模型。 那么应该怎么选呢? 如果不差钱当然是全都要,Cursor Pro + Claude Max,日常 Claude Code 为主,Cursor 主要用来 Review 代码、手动编辑代码等等。 如果选一个我建议选 Claude Code,因为它是目前最强的 AI Coding Agent,没有之一,再配合免费的 VSCode + Copilot。 当然如果你是轻度用户,Cursor 也还可以。另外如果你是 ChatGPT Plus 或者 Pro 订阅,也可以试试 Codex,能力比 Cursor Agent 强一些,但不如 Claude Code。还有 Gemini cli 也可以作为补充,每天有一点免费额度。 这只是个人观点,每个人的使用方式都不一样,也欢迎留言分享你的建议。