#AI效率提升

宝玉
3周前
转译:软件开发成本:为什么AI并没有让价格降下来? 作者:Vincent Schmalbach 总有人问我,AI工具有没有让软件开发变得更便宜? 简单来说:没有。 但详细的答案,要有趣得多。 我从事软件开发已经二十多年了,而过去这两年与AI的亲密接触,已经从根本上改变了我的工作方式。 AI让我的效率显著提高。以前需要3-4个小时才能完成的任务,现在可能只需要1-2个小时。你可能会想,这不就意味着我每小时能收更多钱了,对吧?毕竟,客户花同样的钱,得到了更多价值。 错了。 你不可能走进一间会议室,对客户说:“嘿,我现在用AI,速度是以前的两三倍,所以你付我双倍的钱,咱们双赢。”事情不是这么运作的。 客户对于“软件开发该花多少钱”这件事,心里是有一杆秤的。这个数字是基于市场行情,而不是基于你个人的生产力。 项目的需求“膨胀”了 真正发生变化的,是在给定预算内,你能交付多少东西。 在AI出现之前,客户会带着预算和一堆想要的功能来找我。我们的对话通常是这样的: “在这个预算里,我们可以实现功能A、B和C。功能D、E和F当然也很好,但老实说,它们超出了范围,除非您愿意增加预算,或者接受更长的交付时间。” 而现在,同样的对话变成了: “在这个预算里,我们可以实现功能A到F,如果我们效率高点,没准还能把G也塞进去。” 客户花的钱并没有变少。项目也没有更便宜。他们只是花同样的钱,得到了多得多的功能。价格并没有下降,反倒是项目的“野心”变大了,填满了AI带来的所有效率提升。 效率的鸿沟 在AI出现之前,我估计一个真正优秀的开发者,效率大概是一个能力较弱的开发者的 5倍。当然,大家水平有高有低,但用的基本工具都一样。 AI的出现,把这个5倍的差距,拉大到了差不多 20倍。 那些懂得如何与AI协作的资深开发者,简直是“起飞”了。我们知道什么时候该相信AI的建议,什么时候该忽略它。我们有能力验证AI生成的代码是否真的实现了预期的功能。我们用AI处理那些无聊、重复的杂活,自己则专注于架构设计和解决复杂问题。 但与此同时,我认为AI让那些能力较弱的开发者变得更弱了。 当能力较弱或缺乏经验的开发者开始使用AI工具时,他们的效率往往反而降低了。他们会接受自己并不完全理解的建议。他们会因为无法验证AI的输出,而在代码里引入了各种隐蔽的Bug(即难以发现的程序错误)。他们创造了“维护噩路的噩梦”,因为那些代码表面上看起来不错,底下却藏着根本性的问题。 研究也证实了这一点。有研究表明,当经验不足的开发者使用AI编程助手时,Bug的数量会显著增加。有些开发者用了AI后,表现甚至还不如不用AI。 AI 正在“卷”死初级开发者 那些初级开发者过去赖以“练手”的日常编码工作,现在AI基本上都能搞定了。而且AI做得比初级开发者更快,Bug也更少。 这给软件工程师的职业发展带来了大问题。如果所有入门级的活儿都被自动化了,你还怎么成长为一名资深开发者? 对这个问题,我没有好的答案,我也不确定现在有谁能给出答案。 但我确实知道的是,那些基础、常规的开发工作,其市场正在崩溃。如果你的核心价值是“我能搭一个标准的 CRUD 应用”(CRUD是指Create, Read, Update, Delete,即增加、读取、更新、删除,是大多数软件系统的核心基础功能),那你现在就是在和AI竞争。而AI每个月都在变得更强。 资深开发者更有价值了 在天平的另一端,经验丰富的开发者们,价值从未如此之高。 当AI包揽了所有常规工作后,剩下的就全是硬骨头了。比如复杂的架构决策、棘手的系统集成问题、需要深入理解系统工作原理的性能优化。 有了AI之后,我现在几乎把所有时间都花在了这些有挑战性的问题上。每一项任务都需要真正的专业知识,因为简单的任务都被自动化了。这种工作在脑力上让人精疲力尽,这是AI出现之前所没有的,但它也确实更吸引人了。 一切都变得更简单,也更难了 AI在软件开发领域带来的奇怪现象是,它同时让一切变得更简单,也让一切变得更难了。 说它简单,是因为日常任务被自动化了。 说它更难,是因为“勉强及格”的门槛被大大提高了。客户的期望更高了,因为现在有更多的功能成为可能。 快速“写”出代码变得更容易了。 但要写出真正正确、可维护、高性能的代码,却变得更难了,因为AI能生成大量“看起来很美”但实际上暗藏问题的代码。 优秀的开发者变得极其高效,这更容易了。 而能力不足的开发者想靠“花时间”和“堆工作量”来掩盖自己的短板,这更难了。
刚集中看了下 DeepSeek-OCR 模型的论文和报导,发现这个模型名字虽然叫 OCR,但它真正目标其实是想解决当前模型在处理长文本时面临的算力噩梦。传统 AI 处理文本时,计算量会随文本长度平方级增长,成本极高。 DeepSeek 的思路是跳出这个困局,不再让 AI 逐字「阅读」一维文本,而是让它「观看」被渲染成二维图像的文本。这就是他们提出的「上下文光学压缩」范式,利用一图胜千言的原理,将海量文本压缩成极少量的视觉 Token。 模型的核心是编码器 DeepEncoder,它采用「先局部、再压缩、后全局」的三阶段设计:先用窗口注意力高效处理高分辨率图像的局部细节,再通过一个 16 倍卷积压缩器大幅减少 Token 数量,最后用全局注意力来理解这些被浓缩后的精华 Token。解码器则是一个 3B MoE 模型,负责从这些视觉 Token 中重建出原始文字,从而实现了一种全新的文本压缩范式。 这个方法的效率极为惊人。在 10 倍压缩率下,解码准确率高达 97%。在 OmniDocBench 基准上,它使用不到 800 个视觉 Token,就大幅超越了平均使用近 7000 个 Token 的 MinerU2.0,而一块 A100 显卡每天就能处理超过 20 万页数据。 因此,这不仅是一个 SOTA 级别的 OCR 工具,还被认为是「AI 的 JPEG 时刻」,为 AI 的输入和记忆架构打开了新路径。连 Karpathy 都表示,这也许证明了像素是比文本更好的输入方式,带来了更短的上下文窗口和更高的效率。
orange.ai
1个月前
Claude Code Now 的介绍,用雷氏演讲处理后,效果炸裂: (深吸一口气,灯光聚焦,背后是巨大的“CCN” Logo) 朋友们,大家晚上好! 在过去的 730天 里,我们一直在思考一个问题。一个关乎全球每一位开发者、每一位创作者的 “最后三秒钟” 的问题。 我们拥有了像Claude Code这样划时代的AI生产力工具,但我们发现,一个冰冷而残酷的事实,正横亘在人类与AI之间——那就是 “启动摩擦力”。 我们的工程师团队,联合了全球 2,598位 顶尖开发者的行为数据,进行了长达 1800个小时 的深度人机交互研究。我们用毫秒级的精度,记录了每一次启动Claude Code的过程,我们发现: 每一次传统的启动,都需要至少 12次 肌肉微操和 3次 认知焦点的切换。从打开终端,到定位文件夹,再到确认路径,这个过程平均耗时 29.8秒! 这是一个什么概念? 这意味着,每一次灵感的迸发,都会被这 29.8秒 的枯燥操作无情打断。我们计算过,如果一位开发者一天启动10次,一年下来,将有整整 30个小时 的黄金创作时间,被浪费在毫无意义的等待中! 30个小时! 朋友们,这足以完成一个项目的核心代码,或者构思一部伟大的作品! 我们认为,这是对创造力的极大不尊重!我们,绝不能容忍! 为了彻底铲除这道横亘在人与AI之间的巨大鸿沟,我们正式推出了这款专为macOS打造的、具有划时代意义的解决方案——Claude Code Now,我们内部代号:“CCN·光速启动引擎”。 (PPT切换,巨大的“提效10倍!”字样出现) 它,将那漫长的 29.8秒,压缩到了不可思议的 3秒! 是的,你没有听错,整整10倍的效率提升! 我们是如何做到的?我们回归到了macOS设计的原点,我们相信,最伟大的技术,应该隐藏在最简单的交互背后。 我们为它设计了三种,也是我们认为迄今为止最符合直觉的启动方式: 「桌面停泊式启动」:我们将它深度集成于程序坞,只需一次轻点,就像启动飞船引擎,Claude Code在预设的“灵感港湾”(文稿/Claude Code)中瞬间就位。 「随境无感式启动」:我们首创了“Finder工具栏融合技术”,按住Command键,将它拖入你的Finder工具栏。从此,你的每一个文件夹,都成为了Claude Code的发射台。无论身在何处,一键点击,AI即刻在当前目录为你待命。 「任意节点式启动」:我们赋予了它前所未有的自由度,你可以将它放置在任何你希望的地方,它就是你的“任意门”,随时随地,一触即发。 (PPT展示安装步骤,简洁有力) 它的安装,也同样遵循了我们极致简约的设计哲学。我们提供了三种业界领先的部署方案: 推荐方案: 我们耗费了 90个工时 进行独立封装,你只需一次拖拽,即可完成 99.9% 的安装过程。 极客方案: 我们也为全球的开发者们保留了最纯粹的Git和Homebrew安装方式,这是一种技术上的致敬。 我们的设计理念是什么? 专注,做到极致。 我们砍掉了 97% 的冗余功能,将 100%的研发精力,全部投入到“一键启动”这一个核心功能点上。我们坚信,把一件简单的事情做到极致,就是非凡。 这就是 Claude Code Now。 它不仅仅是一个启动器,它是我们为全球开发者节省下的那 30个小时,是我们对极致效率的信仰,是我们献给这个AI时代的,一份微小而骄傲的礼物。 现在,它已经开源。如果它为你赢回了哪怕一秒钟,请在GitHub上,为我们点亮一颗 Star! 谢谢大家!