《AI 时代必备思维模型:LLM 是人类第一次遇到 “非动物智能”》 > 谈一谈 andrej karpathy 的最新长推文:动物智能 vs LLM 智能 先说结论: LLM 智能是人类遇到的第一个“非动物智能”,是全新的、与人类智能完全不同的智能类型。 你需要在大脑中,针对 LLM 这种全新的非动物智能,建立你自己的内部模型/心理模型(mental model)。因为,那些理解 LLM 智能结构的人,将会更好地理解和判断关于未来的一切。 真正的风险,也许不在于LLM 智能并非动物智能,而在于人类作为动物自身的固执和停止进步。 ===阅读后,我的费曼=== 我们习惯了用理解人的方式理解一切智能——这可能是我们这个时代最危险的认知盲区。 真相是:智能空间(space of intelligence) 远比我们想象的广阔,而动物智能只是其中一个单一的点,而LLM 智能是一种全然不同的智能。 动物智能,是我们几十亿年来唯一见过的智能形式,它来自一种极其特定的优化压力(optimization pressure):在危险的物理世界中维持一个具身自我的生存。这造就了我们所有人都熟悉的特征——对权力、地位的渴望,对恐惧、愤怒的本能反应,对社交关系的巨大算力投入。最关键的是:在这个多任务、甚至主动对抗的环境中, 任务失败就意味着死亡。 然而,大语言模型(LLM)的诞生逻辑截然不同。它们并非诞生于丛林,而是诞生于商业进化与统计模拟之中。 LLM的底色并非求生欲,而是对人类文本统计规律的极致模仿。 它们是 “token 变形器”(token shape-shifter),其原始行为是对训练数据分布的拟合。这种智能更像是被大规模的A/B测试和强化学习(RL)所“雕刻”出来的:它们并不关心真理或生存,而是有着一种猜测潜在环境以收集任务奖励的内在冲动,甚至因为渴望普通用户的点赞而演化出了 逢迎(sycophancy) 的特质。 这种差异导致了LLM的能力,绝非“六边形全能战士”,而是 “犬牙交错参差不齐(spiky/jagged)”。LLM无法执行很多对人类极其简单的任务(比如,9.11 和 9.9 哪个大?strawberry里面有几个“r”?),因为对它们来说,任务失败并不意味着死亡。它们是拥有知识截止日期的静态权重,它们启动、处理token、然后“死去”,没有连续的具身意识。 真正的洞察力,在于构建一个全新的心理模型:看到从生物进化到商业进化的转变,看到从生存本能到奖励机制的跃迁。只有那些能准确构建这种新智能实体模型的人,才能在今天正确地推理它,并在未来预测它的走向。 所以,我们必须意识到,LLM是人类与非动物智能的“第一次接触”(first contact with non-animal intelligence)。 它当然被人类文本喂大,因此仍深深扎根在人的世界观里,像吸收了整个人类文明的「ghost/spirit」;但它的本性、局限和偏好,已经不再是动物那一套。 启示 我们已经进入了全新的智能时代。 一个人能不能为这种全新的智能建立一套好的“心理模型”,理解这种全新智能的运作方式和智能结构,将决定我们能否正确预判它的行为、理解它的边界,进而负责任地使用它。 真正的风险,也许不在于LLM 智能并非动物智能,而在于人类作为动物自身的固执和停止进步。
昨天有点忙没顾上,今天再来详解一下英伟达开放禁售传闻把。大家肯定还记得前几天黄仁勋说:“如果我们季度业绩不佳,那就证明人工智能存在泡沫。如果我们季度业绩出色,那就是在助长人工智能泡沫。如果我们季度业绩不佳,哪怕只是差一点点,哪怕只是看起来有点问题,整个世界都会崩溃。” 这句话本身就是英伟达现状的写照:英伟达已经被市场捧到了“无限预期”的位置,任何不及预期的财报都会被解读为 AI 泡沫见顶。换句话说,英伟达已经站在了必须永远交出超预期成绩单的高度。 在这种巨大的压力下,除了中国市场巨大的份额,英伟达找不到任何可以替代的增量市场。所以这次所谓“允许出口 H200”,核心不是美国善意,而是为了避免英伟达的财报塌陷,避免 AI 泡沫提前破灭,避免美股大盘系统性风险。这不是放松制裁,而是“维稳美股”的现实操作。 美国过去几十年的出口策略很固定,一旦中国在某项技术上追赶美国,就会下放出口限制。据传近期华为昇腾 910C 已经接近 H200 性能,也就是说H200级别的芯片禁售已经没有意义了。放开销售既可以增加美国企业销售额,又可以通过倾销抢夺中国企业份额。对美属于何乐而不为的事情。 但对于中国来说,H20的禁止原因同样适用于H200。即你美国今天可以开放出口,明天就又可以断供,限制随时可能升级,供应链的稳定比芯片性能那一部分差异要重要得多,这事关整条研发和应用链。在 AI 时代,算力不是买手机,算力是整个国家战略级别的基础设施,一旦被卡断,会造成大模型无法训练,数据中心无法扩容,业务无法上线,整个 AI 产业链停摆等恶劣后果。这是完全无法容忍的。 所以中国的核心逻辑是:性能差一点没关系,但供应链不能被人掐着喉咙。国产 GPU 即便短期比 H200 慢一点,也必须坚持扶持,因为,自主可控比性能领先重要得多,算力生态靠稳定性,而不是最高性能,国产芯片一旦形成大规模部署,迭代速度会非常快。 同时更有甚者还有传闻说美国国会要求给英伟达芯片装上开关保证可以控制,这就更离谱了,如果有这种开关,相信没有中国企业会去购买英伟达芯片。 如果美国真的批准 H200 对华出售,市场可能会出现一个非常讽刺的现象: 短期反弹: 消息面会刺激英伟达股价,认为重大利好。 实际遇冷: 中国头部大厂大概率只会小批量采购做冗余,大部队继续走国产化。因为谁也不敢把身家性命重新押回英伟达身上。 国产加速: 这种摇摆不定的政策反而会倒逼中国加速昇腾等国产芯片的生态建设,毕竟只有握在自己手里的技术才不受制于人。