#LLM智能

4个月前

《AI 时代必备思维模型：LLM 是人类第一次遇到 “非动物智能”》 > 谈一谈 andrej karpathy 的最新长推文：动物智能 vs LLM 智能先说结论： LLM 智能是人类遇到的第一个“非动物智能”，是全新的、与人类智能完全不同的智能类型。你需要在大脑中，针对 LLM 这种全新的非动物智能，建立你自己的内部模型/心理模型（mental model）。因为，那些理解 LLM 智能结构的人，将会更好地理解和判断关于未来的一切。真正的风险，也许不在于LLM 智能并非动物智能，而在于人类作为动物自身的固执和停止进步。 ===阅读后，我的费曼=== 我们习惯了用理解人的方式理解一切智能——这可能是我们这个时代最危险的认知盲区。真相是：智能空间（space of intelligence）远比我们想象的广阔，而动物智能只是其中一个单一的点，而LLM 智能是一种全然不同的智能。动物智能，是我们几十亿年来唯一见过的智能形式，它来自一种极其特定的优化压力（optimization pressure）：在危险的物理世界中维持一个具身自我的生存。这造就了我们所有人都熟悉的特征——对权力、地位的渴望，对恐惧、愤怒的本能反应，对社交关系的巨大算力投入。最关键的是：在这个多任务、甚至主动对抗的环境中，任务失败就意味着死亡。然而，大语言模型（LLM）的诞生逻辑截然不同。它们并非诞生于丛林，而是诞生于商业进化与统计模拟之中。 LLM的底色并非求生欲，而是对人类文本统计规律的极致模仿。它们是 “token 变形器”（token shape-shifter），其原始行为是对训练数据分布的拟合。这种智能更像是被大规模的A/B测试和强化学习（RL）所“雕刻”出来的：它们并不关心真理或生存，而是有着一种猜测潜在环境以收集任务奖励的内在冲动，甚至因为渴望普通用户的点赞而演化出了逢迎（sycophancy）的特质。这种差异导致了LLM的能力，绝非“六边形全能战士”，而是 “犬牙交错参差不齐（spiky/jagged）”。LLM无法执行很多对人类极其简单的任务（比如，9.11 和 9.9 哪个大？strawberry里面有几个“r”？），因为对它们来说，任务失败并不意味着死亡。它们是拥有知识截止日期的静态权重，它们启动、处理token、然后“死去”，没有连续的具身意识。真正的洞察力，在于构建一个全新的心理模型：看到从生物进化到商业进化的转变，看到从生存本能到奖励机制的跃迁。只有那些能准确构建这种新智能实体模型的人，才能在今天正确地推理它，并在未来预测它的走向。所以，我们必须意识到，LLM是人类与非动物智能的“第一次接触”（first contact with non-animal intelligence）。它当然被人类文本喂大，因此仍深深扎根在人的世界观里，像吸收了整个人类文明的「ghost/spirit」；但它的本性、局限和偏好，已经不再是动物那一套。启示我们已经进入了全新的智能时代。一个人能不能为这种全新的智能建立一套好的“心理模型”，理解这种全新智能的运作方式和智能结构，将决定我们能否正确预判它的行为、理解它的边界，进而负责任地使用它。真正的风险，也许不在于LLM 智能并非动物智能，而在于人类作为动物自身的固执和停止进步。

#LLM智能 #非动物智能 #心理模型 #商业进化 #奖励机制

𝙩𝙮≃𝙛{𝕩}^A𝕀²·ℙarad𝕚g𝕞

5个月前

今天读的论文发现，LLM的智能，元认知程度也TMD是预训练阶段利用梯度下降的大算力对decode only transformer的神经网络的优化压力下激发出来的！

#LLM智能 #元认知 #预训练 #梯度下降 #神经网络优化

𝙩𝙮≃𝙛{𝕩}^A𝕀²·ℙarad𝕚g𝕞

7个月前

agent开发和传统软件的不同，是范式级别的；过去的软件我们需要解决一个问题或者获得一个服务，需要走完预先设计交互流程，才能完成；而agent，直接交付结果。无须那么多的过程交互，就完成了将公域通用LLM的智能结合用户意图上下文就把价值转移了。以前是求佛，现在是数字童子下凡，直接帮你把事办了。所以cursor这类的是vibe coding，而claude code，我们的角色变成了vibe builder？！

AI编程工具激战：Claude Code、Gemini Cli崛起· 1256 条信息

#Agent开发 #LLM智能 #用户意图 #价值转移 #Vibe Builder