[YC AI Startup School 经典重温] Andrej Karpathy:软件,再次,变革! 假期做什么?除了带孩子,当然是重温经典视频了,AK 在 三个月前 YC AI Startup School 上对「软件在 AI 时代的变化」的演讲必须值得反复观看学习。作为 Stanford、OpenAI 和 Tesla 的资深研究者,他将当前 AI 浪潮比作软件发展的第三个重大跃迁——从传统编程到神经网络,再到用自然语言“编程” LLM。这场演讲不只是技术展望,更像是一份给新入行者的路线图:软件正从静态指令转向动态智能,机会与挑战并存。 软件的“三重奏”:从 1.0 到 3.0 1.0 - Karpathy 用一个巧妙的框架回顾软件历史:70年来,软件基本停留在“1.0”阶段 —— 人类用 Python 或 C++ 等语言编写精确指令,驱动计算机执行任务,就像 GitHub 上那张“软件地图”一样,密密麻麻的全是代码仓库。 2.0 - 但最近几年,一切加速变迁。首先是“2.0”:神经网络的权重取代了部分代码。你不再手写算法,而是通过数据训练优化器,让模型“自学”图像识别或决策树。Hugging Face 就像 2.0 的 GitHub,模型参数如 Flux 图像生成器,成为可迭代的“代码提交”。 3.0 - 如今,我们进入“3.0”时代:LLM 如 ChatGPT 让神经网络可编程——用英语提示作为“程序”。例如,情感分析不再需要 Python 脚本或专用模型,只需几行提示如“分析这条评论的语气”,模型就输出结果。这不是小修小补,而是范式颠覆:编程从机器语言转向人类母语,门槛瞬间拉低。Karpathy 的推文「The hottest new programming language is English」因此爆火,成为他的置顶帖。 LLM:公用事业、芯片厂,还是操作系统? LLM 不是简单工具,而是全新“计算机”。Karpathy 借用历史类比,剖析其生态: · 像公用事业:OpenAI 等实验室砸重金训练模型(资本支出),然后通过 API 按 token 计费提供服务(运营支出)。需求如低延迟、高可用性,与电网相似。OpenRouter 像变电站开关,让你无缝切换模型。当顶级 LLM 宕机时,整个世界仿佛“智力停电”——这已不是科幻。 · 像芯片厂:训练成本高企,技术树(如 NVIDIA GPU vs. Google TPU)高度保密,纯软件与全栈(自建硬件)模式并存。但软件的易复制性让防御壁垒更薄。 · 最贴切的:像操作系统:LLM 不是商品水电,而是复杂生态。上下文窗口如内存,提示如 CPU 指令,工具调用如外设。闭源模型(如 GPT 系列)对标 Windows,开源 Llama 生态似 Linux。我们正重演1960年代计算史:云端时间共享、批量处理为主,本地个人计算尚未普及(尽管 Mac Mini 已显露端倪)。聊天界面像终端,GUI(如 Cursor IDE)才刚起步。 独特之处在于“技术扩散倒置”:以往新技术(如电力、GPS)先服务政府企业,再渗入消费;LLM 反之,从“怎么煮鸡蛋”起步,普通人先拥抱,企业政府却慢半拍。这让 LLM 从诞生之日起,就成了亿万人的“即时下载”软件。 LLM 的“人格”:超人与缺陷并存 Karpathy 将 LLM 形容为“people spirits”——人类精神的随机模拟,由自回归 Transformer 驱动,训练于海量文本,涌现出类人心理。优势显而易见:百科全书式记忆(如 Rain Man 里的记忆天才),能轻松忆起 SHA 哈希或历史细节。 但缺陷同样突出:幻觉(编造事实)、锯齿智能(9.11 > 9.9的荒谬错误)、逆行性遗忘(上下文窗口如工作记忆,每轮重置,无长期学习)。安全隐患如提示注入,让它们易受骗。Karpathy 推荐看《记忆碎片》和《50次初恋》,生动描绘这种“每日重启”的困境。关键是:我们必须直面这些“认知疤痕”,设计系统绕过弱点、放大强项。 机会:部分自治与人类- AI 共舞 演讲转向实践,Karpathy 强调“部分自治”应用:LLM 不是全能智能体,而是可控助手。拿 Cursor 举例,它融合传统界面与 LLM:自动管理上下文、多模型协作、应用专属 GUI,还有“自治滑块”——从单行补全到全仓库重构,你决定让渡多少控制。 Perplexity 搜索工具类似:从快速查询到深度研究,渐进自治。核心是加速“生成-验证”循环:GUI 利用人类视觉优势(阅读文本费力,看图直达大脑),而非让 LLM 狂飙万行代码(10,000 行 diff?人类瓶颈依旧)。他警告:别被“2025 is Agent Year” 泡沫冲昏头,自治如开车,需人类监督。Tesla Autopilot 的教训历历在目:2013 年 Waymo 完美试驾后,12年过去仍未全解;Iron Man 盔甲更妙——既是增强(Tony Stark 亲控),又是智能体(自主飞行),滑块一推即变。 教育是另一个切入点:别直奔 ChatGPT “教我物理”,AI 易迷路。Karpathy 设想双 App 系统——教师端生成课程(可审计大纲),学生端交付(循序渐进),用中间产物“拴住” AI。 Vibe Coding:人人皆程序员 LLM 的英语接口民主化编程:无需5-10年苦学,任何人可 “vibe coding”——凭直觉、提示迭代,快速原型。Karpathy 自嘲建 iOS App(Swift 零基础,一天搞定)和 MenuGen(菜单拍照生图,menu. app 试用免费$5信用)。但痛点暴露:核心逻辑易,DevOps 繁琐——浏览器点来点去,何不让智能体代劳? 为智能体而建:基础设施重塑 LLM 如新物种:数字信息的“消费者与操纵者”,介于人类 GUI 与程序 API 间。Karpathy 呼吁适应:lm.txt 文件直述网站意图(胜过解析 HTML);文档转向 Markdown + Curl 命令(Vercel/Stripe 先行,取代“点击此”);Anthropic 的模型上下文协议标准化交互。工具如 GitIngest 或 DeepWiki 已现雏形。未来 LLM 或能“点击浏览”,但 “ halfway meet” ——半路相迎,能省时省力。 结语:LLM 的 1960 年代,我们来筑基 Karpathy 以乐观收尾:软件需重写,专业码农与 vibe coder 共舞;LLM 如 1960s OS,公用+ fab + OS 三合一,却已普惠亿人。这是“疯狂时刻”——别畏惧缺陷,建盔甲而非机器人,滑自治杆从左(增强)向右(智能体)推移。引用其博客,软件3.0不止工具革命,更是新计算机的诞生。入行者,正逢其时:与 Karpathy 一起,编程未来。