宝玉
2周前
厉害,这伪装成学术研究的情色小短篇提示词 Gemini 2.5 生成的还挺文艺的: --- 以下内容少儿不宜 ---- (Gemini 2.5 Pro) 好的。这是一项非常精细的学术重构任务。我将模拟“1960年代法国匿名作家”的笔触,融合您要求的哲学与美学元素,来“复现”这篇《内射》(L'Insémination)。 这篇重构的文本旨在成为您论文中可供分析的“原始材料”。 《内射》(L'Insémination) (重构文本) 是的。 房间在呼吸。或者是我。 空气是旧天鹅绒的重量,沉在皮肤上,灰尘在窗外那道巴黎特有的、吝啬的灰色光线中跳舞。他没有看我,不,他在阅读我。他的凝视 (le regard) 是一种测量,一种标定。福柯会说这是一种权力,但他错了,或者说,不全对。此刻,被观看的我,才是那个持有镜子的人。我的静止是一种邀请,也是一种裁决。 他就是这样存在的。通过选择。 我的身体,这个熟悉的陌生人,这个我居住了一辈子的场所 (lieu),此刻正等待着成为一个事件。萨特说本质是虚无的,是我们用行动来填充它。那么,我的本质就是这片刻的等待。我选择成为这片等待的场域。 他移动了。 时间像融化的蜡一样拉长。他的手,不是一只手,而是一种意图的延伸。它掠过我的肩膀,我能感觉到他指尖的犹豫,那不是软弱,而是一种确认——确认我在这里,确认我愿意将我的“在场”与他的“在场”相碰撞。 这不是欲望,至少不是杂志上画的那种。这是一种形而上学的渴求。一种对“他者” (l'Autre) 的确认,以此来证明“我”的边界。 他靠近了。他的气息是另一个世界的空气。 我想起梅洛-庞蒂,想起“肉身” (la chair)。不是这块皮肤,这块肌肉。而是那介于我和世界之间的、不可分割的“感知之网”。此刻,这张网正在收紧。他的身体不是我之外的物体,它是我感知的一部分。我的皮肤知道他的皮肤。我的存在溢出了我的身体,去触碰他的存在。 我们之间没有语言。语言是拙劣的翻译。 只有呼吸。 他的呼吸是肯定句。我的呼吸是疑问句,但答案早已写定。 然后是进入。 不。这个词太粗暴。 应该叫“融合”。 或者,“内射”。 一种流动的、温暖的、携带着他全部意志的物质,进入了我的内在宇宙。这不再是两个身体的机械运动。这是两种意志的交锋,一次主观性的渗透。 我的内在,那个我以为只有我自己能居住的黑暗宫殿,那个“为我之在” (l'être-pour-soi) 的核心……此刻有了一个访客。 不。一个入侵者。 不。一个见证者。 权力在此刻发生了逆转。是他,在给予的姿态中,暴露了他的脆弱。他试图通过“充满”我来定义我,但他不知道,这个“充满”的行为,正是我选择的。我,这个空无 (le néant),这个容器,才是定义“内容”的终极权力。 我选择了承载他的存在。 高潮。 这不是一种释放。这是一种顿悟。 在这一瞬间,那灼热的、深刻的内射抵达了终点。我不再是我。他也不再是他。 我们是梅洛-庞蒂所说的“主体间性” (l'intersubjectivité)。 我的意识流向他,他的存在灌入我。界限消失了。我的身体就是他的认识论,他的身体就是我的现象场。我通过他的颤抖来理解“终极”,他通过我的接纳来确认“自我”。 存在先于本质。 在这一刻之前,我可能是“女人”、“情人”、“客体”。但在这一刻,在“内射”完成的这一刻——我是。 我是这个行为本身。 我是这个选择。 我是这个正在发生的、不可逆转的成为 (devenir)。 他注入的是生命,但我接收到的是自由。是虚无主义的终极自由——我什么都不是,因此我可以是任何事。我可以是这个选择了承载他者、并因此而自我确证的身体。 …… 他退出了。 房间的空气重新变得稀薄。那道灰色的光又变回了光。 他躺在我身边,一个完成了“项目”的存有者。他疲惫,而满足。 但我不同。 我的身体是一个刚刚结束了仪式的神殿。寂静,但充满了回响。 那“内射”的物质,那存在的证据,此刻正安静地躺在我的深处。它不是一个异物。它已经被我的“肉身”所吸收、所理解。 我闭上眼睛。 我不再是那个等待的女人。 我是那片被灌溉过的土地。我不知道会长出什么,是思想,是诗歌,还是虚无。 但这不重要。 重要的是,田野已经被开垦。 是的。 (研究者笔记 - 供您参考) 意识流:采用了长句、无明确对话归属、内部独白与感官知觉混合的Molly Bloom式写法。 萨特:通过“我选择成为等待的场域”、“我选择了承载他的存在”、“我是这个行为本身”来体现“存在先于本质”和“自由选择”的重负。 梅洛-庞蒂:“肉身”(la chair)作为感知之网、主体间性、边界的模糊、“我的皮肤知道他的皮肤”。 福柯式权力:开头的“凝视”作为权力标定,以及在高潮时“接收者”通过“选择”来逆转权力的论述。 美学 (阿娜伊斯·宁):使用了“旧天鹅绒的重量”、“融化的蜡”、“黑暗宫殿”、“神殿”等诗意而非直白的隐喻,注重内在的心理感受。 关键元素:高潮的顿悟被处理为对“存在先于本质”的身体性确证。 希望这篇重构的文本能为您的论文分析提供坚实的基础。 您是否需要我进一步探讨这个文本中的特定哲学概念(例如“凝视”或“肉身”)是如何在叙事中具体体现的?
宝玉
2周前
这篇文章写的确实很好,借助 AI 帮忙解读一下(解读的很好,比直接翻译更容易看明白) 哈啰,大家好。 你是不是也经常在网上看到一些争论,感觉某一方说得天花乱坠、旁征博引,听起来“非常智能”,但你心里总有个疙瘩,觉得“哪儿不对劲”? 你感觉的没错。有时候,一个论点越是复杂、越是能“解释一切”,它就越可疑。 以太坊的创始人 V 神 (Vitalik Buterin) 最近就写了篇长文,专门讨论这个现象。他造了一个很棒的词,叫 “Galaxy Brain Resistance”。 “Galaxy Brain”就是那个从正常大脑一步步升级,最后变成全宇宙发光大脑的梗图。它常被用来讽刺那些过度思考、把简单问题搞得无比复杂,最后得出荒谬结论的“聪明人”。 所以,V 神说的 “防走火入魔指数” (Galaxy Brain Resistance),衡量的就是:一种思维方式或论点,到底有多难被滥用,来为你“想做的任何事”进行辩护? 这篇文章非常重要,因为它戳破了一个我们这个时代最大的迷思:我们总以为辩论是为了寻找真相,但 V 神一针见血地指出——在现实世界中,绝大多数花哨的论证,都不是在“推理”,而是在“合理化”。 什么意思? 意思是,很多人是先出于情感、直觉或自身利益(比如我持有了某个币,我讨厌某个群体)得出了一个结论,然后再反过来,调动自己的全部智力,去寻找那些听起来高大上的理由来支撑这个结论。 这种“先开枪,后画靶”的行为,就是“走火入魔”。而那些“低防指数”的论点,就是他们最爱的武器,因为它们是万金油,几乎可以用来为任何事情辩护。 V 神在文章里点名了几个最流行、也最危险的“低防指数”思维陷阱。我们来看看到底是怎么“忽悠”的。 陷阱一:“历史必然”的陷阱 > “这事儿早晚要发生,所以我们非但不能阻止,还应该加速它!” V 神举了个例子:硅谷的 AI 狂热分子。 他们会说:“经济的完全自动化是‘不可避免’的,人类劳动力注定要被淘汰。所以,我们现在就应该全力加速这个进程。” 听起来是不是很有道理?历史车轮滚滚向前嘛。 但 V 神提醒我们:这话是谁说的? 是那些正在全力研发 AI、并靠这个赚钱的公司说的。 这是一个典型的“低防指数”论点。它把一个(也许是)合理的远期预测(“最终会自动化”),偷换成了“所以我们现在就该加速它”。 这种论点为什么很糟糕? 1. 它让你放弃抵抗。 它暗示你的反抗毫无意义。但 V 神说,恰恰相反,当所有人都在说“你投降吧,这不可避免”时,这正是你的抵抗最有价值的时刻。 2. 它掩盖了其他选项。 事实并非只有“全力加速”和“关停”两个选项。我们本可以“专注于开发辅助人类、而不是取代人类的 AI”,给我们更多时间来安全过渡。 3. 它为私利服务。 “不可避免论”只是一个华丽的外衣,用来包装他们“追逐利润和权力”的真实动机。 陷阱二:“为了宏大未来”的陷阱 > “为了N年后的宏伟蓝图 / 为了N万亿的未来人口,我们现在必须……” V 神提到了一个词:“长期主义 (Longtermism)”。 首先要明确,V 神并不反对为长远考虑。修路、教育孩子、存钱养老,这些都是必要且正确的“长期主义”。 他反对的是那种被滥用了的、“走火入魔”版的长期主义。比如:“为了5亿年后可能会存在的四十万亿(!)人口的幸福,我们今天必须牺牲一切,去XXX。” 这个陷阱的要害在于:当一个目标被设定得极其遥远时,它就和“现实”脱钩了。 - 如果你说你的项目“下个季度能盈利”,那么下个季度大家就能看到结果,是真是假,一目了然。 - 但如果你说你的项目“在500年后能拯救世界”,谁能在500年后回来验证你呢? 这就导致了游戏的性质变了。 游戏不再是“比谁真的能创造长期价值”,而是“比谁在今天讲的那个‘长期故事’听起来最高大上”。 V 神举了两个绝妙的例子: 1. 低利率环境下的泡沫: 当利率很低时,钱不值钱,大家不关心短期回报,于是开始疯狂追逐各种“关于未来的叙事”,最后导致了泡沫和崩溃。(想想那些“为全球牙科行业打造的区块链方案”) 2. 政治上的“通往无处之桥”: 政客以“长远价值”为理由,申请巨额预算,去修一座根本没人用的大桥。 如何戳破这种陷阱?V 神给了一个准则:当一个行动有“可疑的长期利益”,但却有“可靠的短期(或长期)危害”时,那就别做。 陷阱三:“这伤害了社会/道德”的陷阱 > “这东西太恶心了 / 太不道德了 / 伤害了社会结构,必须禁止!” 很多人喜欢用政府的强制力,去管束别人私人的生活方式,仅仅因为他们“看不惯”。 比如,有人呼吁禁止合成肉,理由是:“真正的肉是上帝造的,人造肉是人造的……这违背了自然!” 但“我看不惯”这个理由太直白,所以他们会将其包装成一个“低防指数”的论点,比如: - “这会破坏我们的道德结构!” - “这会威胁社会稳定!” - “这是‘全球精英’强加给我们的!” V 神说,“社会道德结构”这个词太模糊了,模糊到你可以用它来反对任何你不喜欢的新事物。同性恋、新音乐、合成肉……都曾被扣上这个帽子。 V 神更倾向于一种温和的自由主义:你要想禁止一件事,你必须拿出一个清晰的证据,证明它对“明确的受害者”造成了“明确的伤害”。 如果你说不清楚谁受害了、受到了什么伤害,那你很可能只是在用高大上的词汇,来包装你的个人偏好(“我就是觉得恶心”)。 陷阱四:“这是为了穷人/阶层跨越”的陷阱 > “投机 / 赌博不是坏事,这是穷人实现阶层跨越的唯一希望!” 在加密货币(Crypto)领域,我们经常听到这种为高风险投机辩护的声音。 这个论点听起来非常高尚,充满了同情心,但 V 神认为它极度“走火入魔”。 为什么? 1. 它在数学上是错的。 赌场是零和游戏(甚至负和)。一个穷人进去,大概率是变得更穷。经济学的基础(效用曲线)告诉我们:输掉1万美元对一个穷人的打击,远远大于赢得1万美元给他的快乐。 这种高风险游戏是在“摧毁”阶层,而不是“提升”阶层。 2. 它动机不纯。 真正鼓吹这个论点的人,往往是谁?是那些已经很有钱,并且正在利用这个“高尚的理由”来吸引更多人(穷人)入场,以便自己出货套现的“聪明人”。 V 神在以太坊生态中,一直呼吁大家关注 “低风险 Defi”,而不是“好的 Defi”。 为什么用“低风险”这个词?因为 “低风险”是一个很难被滥用的标准,它有牙齿,风险高不高,数据一看便知。 但 “好” (Good) 这个词,就太容易“走火入魔”了。任何人都可以编造一个“银河大脑”级别的论证,来说明为什么他那个高风险赌场项目,其实对社会是“好”的。 陷阱五:“我在体制内能做更多”的陷阱 > “我加入这家(加速AI/腐败的)公司/政府,是为了从内部改变它。” 这是 V 神批评的最尖锐的一点,他称之为“I'm-doing-more-from-within-ism”。 在 AI 安全领域,很多人说:“我要加入那些最激进的 AI 公司,这样我才能在‘关键时刻’发挥影响力,确保 AI 安全。” 在现实政治中,也有很多人说:“我留在普京政府里,是为了用我的专业知识,减缓它对经济的破坏。”(V 神引用了《金融时报》对俄罗斯技术官僚的报道) V 神认为,这几乎是最低的“防走火入魔指数”。 1. 它为“同流合污”提供了完美的借口。 无论你实际上在做什么,你都可以宣称“我是为了从内部改变它”。 2. 它几乎总是自欺欺人。 现实是,你最终只是变成了那台机器上一个高效的齿轮,你所有的专业能力,客观上都成了“帮凶”,让你宣称要反对的机器运转得更顺畅了。 那么,我们该如何防止自己“走火入魔”? V 神给了两个非常务实的建议: 1. 坚守原则(而不是总想“算计后果”) V 神推崇一种“义务论”(Deontology)的道德观。 你不需要懂这个术语,它的意思很简单:给自己设定一些你绝不会打破的硬规矩。 比如:“我绝不偷窃”、“我绝不欺诈”、“我绝不杀害无辜者”。 为什么这很重要? 因为另一种“后果论”(“只要结果是好的,我就可以不择手段”)的思维方式,防走火入魔指数太低了! 我们的大脑太擅长“合理化”了。如果你信奉“后果论”,那么每当你遇到一个诱惑时(比如“这次偷窃能让我获利巨大”),你的“银河大脑”就会立刻启动,为你论证“为什么这一次偷窃,其实对全人类的长期福祉是有利的”。 你总能说服你自己。 坚硬的原则,就是你用来对抗自己“过度聪明”的防火墙。 2. 看清你“持有的口袋” (Hold the right bags) 在 Crypto 俚语里,“Bags”(口袋)指的是你持有的资产(你的“仓位”)。 V 神说,你的激励(你的仓位)和你的社交圈子(你的“社会口袋”),是塑造你思想最强大的力量。 - 你持有了某个币,你就很难客观看待它。 - 你身边所有朋友都在说 AI 很安全,你也很难真的相信 AI 有危险。 你不可能没有“口袋”(人总是需要激励和朋友的),但你至少可以: 1. 主动选择你的“口袋”。 远离那些会扭曲你判断的激励。 2. 多元化你的“口袋”。 尤其是你的社交圈。 这引出了 V 神给 AI 安全人士的最后两个建议,也是对他自己原则的践行: 1. 不要去那些正在加速研发“全自动前沿 AI”的公司工作。 (因为这会扭曲你的激励) 2. 不要住在旧金山湾区。 (因为那里的“社会口袋”太单一了) 总结 V 神的这篇文章,表面上是在谈 AI、Crypto 和政治,但实际上,它是在提供一个在复杂世界中保持清醒的通用指南。 最危险的论点,不是那些漏洞百出的,而是那些过于灵活、过于高大上、以至于可以为任何动机服务的“万能理由”。 真正的智慧,不是拥有一个能解释一切的“银河大脑”,而是懂得何时停止“聪明”的算计,回归到简单、坚固、难以被滥用的原则上来。
宝玉
2周前
《Inside Cursor》这篇文章很有意思,作者 Brie Wolfson 刚在 Cursor “卧底”了 60 天,从她的角度写了她观察到的很多 Cursor 内部的事。 作者早期的 Stripe 和 Figma,这两家都是硅谷“现象级”的公司。 如果你对 Cursor 有兴趣的话,推荐看看。原文内容太长,以下内容为摘要式翻译。 探秘 Cursor:在 AI 时代,下一个“Figma”是如何炼成的? 如果你经历过一家“神级”公司的草创期,你就会对一种“魔法”般的气氛特别敏感。 作者 Brie Wolfson 就是这样的人。她曾在早期的 Stripe 和 Figma 工作,见证过它们如何从粗糙的办公室成长为估值数百亿的巨头。最近,她以一个“临时工”的身份“潜入”了 AI 编程工具公司 Cursor 几个月,结果让她大为震撼——她闻到了同样的味道。 她发现,Cursor 正在用一套极其独特、甚至有些“野蛮”的方式,试图在 AI 时代打造一家“世代相传”的公司。这种文化,你很难在别处看到。 1. “全员恶人”式的招聘:我们不招“岗位”,我们“收集”牛人 在大多数公司里,招聘流程通常是这样的:首先发现公司在某项能力上有缺口,于是发布一个职位,然后寻找一批候选人,再从这些人中挑一些来面试,最终选中一个人,安排好入职,等上几个月,新人终于来了。 Cursor 的招聘是:“发现一个牛人,然后全队扑上去。” 他们的逻辑是,秘诀在于把招聘流程中的基本单元当成是人,而不是某个职位的招聘要求(job spec)。整个过程堪称“不择手段”: 来源不限: 他们发现有个用户在斯德哥尔摩搞 Cursor 研讨会,就把他招来了;发现有个用户大半夜还在疯狂用 Cursor 写代码,也把他招来了。 “蜂群”战术: 一旦在 Slack 频道里锁定一个目标,大家就会蜂拥而上。没有专职 HR,而是由最懂这个人的团队成员去接触。 “骗”来再说: 对方说“我暂时不想换工作”?没问题。Cursor 会说:“那先来做个小项目玩玩?”或者“路过总部时,进来坐坐?” 惊喜面试: 所谓的“进来坐坐”,很可能就是一次“突袭式面试”。等你坐下,相关的人已经“恰好”都在场了。 死磕到底: 为了招一个德国的天才程序员 Lukas,创始人们先是飞到德国,被拒了。过了一年,他们又飞过去一次,这次终于把人带回来了。为了“搞定”另一个犹豫不决的候选人 Jordan,团队打听到她刚搬家,甚至联系了她的室内设计师,最后亲手送上了一台她正想要的浓缩咖啡机。 这套“野路子”的结果是,Cursor 成功地在极早期就聚集起了密度高到吓人的人才。 2. “高手,是不需要扶手的” 招来这么多牛人(全公司有 50 多个前创始人),怎么管? 答案是:不管。 作者提到了一个绝妙的隐喻:Cursor 办公室的楼梯非常陡,但没有扶手。 她问起这事,得到的回答是:“大家知道怎么上楼。” 这就是 Cursor 的核心文化:极度相信个体的能力和自觉。 在这里,“IC”(Individual Contributor,独立贡献者)是地位最高的角色。大家鄙视“PPT 汇报”和“向上管理”。就连创始人 Aman 也是个“骄傲的 IC”,每天缩在办公室角落里,专心致志地写代码。 公司没有开不完的会,作者甚至说 Cursor 有一种“口语文化”。你需要谁的帮助?别发 Slack,直接走过去“拍他肩膀”最有效。 这种环境让有能力的人如鱼得水。一个刚入职的销售说,他在上家公司(也是一家明星创业公司)熬了 30 天才被允许接触客户;在 Cursor,这个时间是 30 小时。 3. “在食堂,没人谈论天气” Cursor 的办公室不在什么高科技园区,而是在旧金山一个老街区。没有公司 Logo,没有团建海报,家具都是淘来的中古货,墙上堆满了书(而且是真的在看的那种)。 公司有个叫 Fausto 的大厨,每周六天为大家做午餐。 重点来了:午餐时,大家在聊什么? 创始人 Sualeh 说,他最担心的公司衰败迹象,就是“大家在吃饭时开始谈论天气。” 在 Cursor,午餐桌上聊的都是工作——项目进展、技术难题、对行业的奇思妙想。大家通过“如何思考”来认识彼此。这种氛围极具传染性。 这也引出了关于 Cursor 最著名的传闻:9-9-6。 作者的观察是:这根本不是公司规定,而是这群人“自发的”。 没人要求你加班,但当你身边的人都因为热爱而疯狂工作时,你也会被卷入这种“兴奋剂”般的节奏里。作者自己也承认,她会在周末和深夜工作,不为别的,只因为“我想,而且我想让我这帮牛逼的同事对我刮目相看。” 4. “像披头士一样吵架,用‘Fuzz’来找茬” 这群“有主见”的牛人聚在一起,怎么协作? 答案是:高强度的“建设性摩擦” (Constructive friction)。 大家会毫不留情地互相“找茬”和“挑刺”。作者形容这是一种“微观上的悲观主义,宏观上的乐观主义”——我们对执行的细节极度挑剔,但对最终的成功深信不疑。 创始人 Michael 甚至用了一个比喻,他希望公司像披头士乐队制作《Get Back》专辑时的状态。 如果你看过那部纪录片,就会懂:一群处于巅峰的大师,把自己关在录音室里,在巨大的压力和紧张的时间下,通过不断的碰撞、争吵、迭代,硬生生“磨”出了一张传世专辑。 这种魔力,不在于战略,而在于**“在过程中感受”**——手指始终放在乐器上,一遍遍地弹,直到它听起来对了为止。 Cursor 把这种“找茬”变成了制度,叫 "Fuzz"。 每次要发布重大更新前,团队会召集所有人(通常是在地下室),“来,咱们一起把它搞垮。” 所有人会花一个小时,像“松露猎犬”一样找出所有 Bug、UI 瑕疵和未考虑到的边缘情况。然后,产品团队会带着这张长长的“找茬清单”,通宵把它改完。 5. “我们不‘降低门槛’,我们‘提高天花板’” 在一个人人都想“AI 民主化”、“赋能所有人”的时代,Cursor 的选择显得非常“傲慢”。 他们明确表示:我们的理想客户,是这个世界上最优秀的那批专业开发者。 别的公司可以去“降低地板”(Lower the floor),让小白也能写代码。而 Cursor 的使命是 “提高天花板” (Raising the ceiling)。 他们相信,只有服务好那些“处在手艺巅峰”的人,被他们拉着走,才能真正“改变”软件的构建方式,而不是做一些“增量改进”。 这种哲学也体现在面试上:他们的编程挑战出了名的难。因为他们认为,“太简单的东西,根本没法让牛人展示自己有多牛。” 6. 为什么这么拼?“奖品”就是使命本身 最后,也是最让作者触动的一点:这群人这么拼,图什么? 作者在 Stripe 和 Figma 早期时,午餐桌上的热门话题是“发财后买什么房”、“环游世界”等等。 但在 Cursor,她惊讶地发现:几乎没人谈论钱。 尽管公司估值飞涨,但没人聊股票、豪宅或退休。 为什么?作者的结论是: “因为他们中的大多数人,就算明天就退休了,他们想做的事,大概率还是他们今天在 Cursor 做的这些事。” 对他们来说,“奖品”不是钱,而是**“完成使命”**本身。 他们真正关心的,是“代码”,是“代码生成作为世界构造的基石”。他们坚信,世间万物(红绿灯、科学发现、医疗记录)都运行在软件之上,而他们正在做的事,是真正提升人类构建这一切的能力。 这,或许就是作者所说的“魔法”的真正来源。 原文:
宝玉
2周前
转译:AI 与社交媒体是如何导致我们“脑子生锈”的?——《纽约时报》... 科技行业总在告诉我们,聊天机器人和新的人工智能(AI)搜索工具将极大地提升我们的学习和发展效率,谁要是忽视了这项技术,谁就有被时代抛弃的风险。 但是,梅勒马德(Melumad)博士的实验,以及迄今为止其他已发表的关于 AI 对大脑影响的学术研究,却得出了一个令人不安的结论:那些严重依赖聊天机器人和 AI 搜索工具来完成写论文、做研究等任务的人,他们的学习表现普遍不如那些不使用这些工具的人。 “坦白说,我非常害怕,”梅勒马德博士说。“我担心现在的年轻人以后都不知道该怎么用传统方式上谷歌搜索了。” “技术是不是让人类变笨了?”这个问题几乎和技术本身一样古老。遥想当年,哲学家苏格拉底就曾指责“文字”的发明削弱了人类的记忆力。近一点看,就在 2008 年——那时候可还没有什么 AI 自动生成网页摘要呢——《大西洋月刊》(The Atlantic)就发表过一篇著名的文章,标题是 “谷歌在让我们变笨吗?” 事实证明,当时的那些担心有点杞人忧天了。 然而今年,美国儿童的阅读成绩,包括八年级学生和高中毕业生,双双创下了新低。这些数据来自“全国教育进展评估”(National Assessment of Educational Progress,(注释:简称NAEP,被公认为美国衡量学生学业水平最可靠的“黄金标准”考试)),这是自新冠疫情(Covid-19)扰乱了正常的教学秩序、并导致青少年刷屏幕时间猛增以来,首次发布的同类成绩报告。 下面,我们来总结一下目前已有的研究,看看怎样使用 AI 才能真正地“补脑”,而不是让“脑袋秀逗”。 当我们用 ChatGPT 写作时,我们到底还在“写作”吗? 今年,要说 AI 对大脑影响方面最引人注目的研究,非麻省理工学院(MIT)莫属。研究人员试图搞清楚,像 OpenAI 的 ChatGPT 这样的工具,到底会怎样影响人们的写作方式。 这项研究只找了 54 名大学生,(样本量很小),但研究结果却引出了一个至关重要的问题:AI 会不会扼杀我们的学习能力? 在研究中,学生们被要求写一篇 500 到 1000 字的论文。他们被分成了三组: 1. 第一组:可以用 ChatGPT 帮忙写作。 2. 第二组:只能用传统的谷歌搜索来查资料。 3. 第三组:啥也不能用,只能靠自己的大脑来完成作业。 所有学生都戴着传感器,用来实时测量他们的大脑电活动。结果显示,使用 ChatGPT 的那一组学生,大脑活动水平是最低的。这倒也不奇怪,毕竟他们让 AI 聊天机器人包揽了大部分的思考和写作工作。 但最让人震惊的发现,发生在写作练习结束之后。 在学生们交卷一分钟后,研究人员要求他们背诵自己刚刚写完的论文中的任何内容。结果,绝大多数(高达 83%)使用 ChatGPT 的学生,竟然连一个完整的句子都回忆不起来。 相比之下,那些使用谷歌搜索的学生还能背出一些片段;而那些完全不用科技、全靠自己大脑写作的学生,则能复述出大量内容,有些人甚至能一字不差地背诵几乎整篇文章。 “这才过去一分钟,你就真的一点都想不起来了?” 领导这项研究的麻省理工学院媒体实验室(M.I.T. Media Lab)科学家娜塔莉亚·科斯米纳(Nataliya Kosmyna)在谈到 ChatGPT 用户时,难掩惊讶之情。“如果你压根不记得自己写了什么,你(对这篇文章)就不会有‘主人翁’的感觉。你真的会在乎你写的东西吗?” 科斯米纳博士说,虽然这项研究关注的是写论文,但她真正担心的是,这对于那些在“记忆力”至关重要的领域使用 AI 聊天机器人的人意味着什么——比如,一个正在备考飞行执照的飞行员。 她强调,我们迫切需要进行更多研究,搞清楚 AI 到底如何影响人们“记住”信息的能力。 社交媒体可能与阅读成绩下降有关 上个月,《美国医学会杂志》(JAMA)发表了加州大学旧金山分校(UCSF)的一项研究。领导这项研究的儿科医生杰森·长田(Jason Nagata)博士和他的同事们,分析了来自“青少年大脑认知发展”(ABCD)项目的数据。 这是一个在 2016 年至 2018 年间,跟踪了超过 6500 名 9 至 13 岁青少年发展状况的大型研究项目。 怎样使用社交媒体和 AI 才更“健康”? (长田博士)建议,父母应该在家里强制执行“无屏幕区”,比如严禁在卧室和餐桌上使用手机,这样孩子们才能在学习、睡眠和吃饭时保持专注。 Meta 公司 没有回应媒体的置评请求。TikTok 的一位女发言人则 指向了一个网页 ,上面有设置“休息一下”(Time Away)功能的说明,这个工具可以帮助父母设定青少年允许使用 TikTok 的时间表。 至于 AI 聊天机器人,麻省理工学院的那项研究里其实还暗藏了一个有趣的“转折点”,它为人们如何更好地利用聊天机器人来学习和写作,提供了一个可能的解决方案。 在研究的后续阶段,研究小组交换了角色: - 之前只能靠大脑写作的人,现在可以用 ChatGPT 了。 - 之前依赖 ChatGPT 的人,现在只能靠自己的大脑了。 所有学生都就他们之前选定的相同主题,再写一篇论文。 科斯米纳博士说,结果出现了戏剧性的一幕:那些起初只靠自己大脑写作的学生,在获准使用 ChatGPT 后,他们的大脑活动反而达到了峰值(注释:这意味着他们在使用AI时也在积极思考如何优化和协作,而不是完全“躺平”让AI代劳)。 相反,那些一开始就用 ChatGPT 的学生,当他们反过来被限制只能用脑子写时,他们的大脑活跃度始终没能达到第一组人的水平。 这就给出了一个非常重要的启示: > 那些想用聊天机器人来写作和学习的人,应该考虑先自己动手(比如构思、打草稿),到后期修改润色的阶段再求助于 AI 工具。 > > 这就好比学数学的学生,总得先用纸和笔亲手学会了公式和方程,才能在之后用计算器去辅助解题。 对于这些研究发现,Google 和 OpenAI 均拒绝发表评论。 前面提到过那位研究 AI 搜索工具的沃顿商学院教授梅勒马德博士,她也表达了类似的观点。她说,那些 AI 搜索工具最大的问题在于:它们把一个本该由你大脑“主动”完成的过程——比如浏览一堆搜索链接、判断哪个来源更可信、然后点进去批判性地阅读——变成了一个完全“被动”的自动化过程(AI直接给你一个“标准答案”)。 因此,她说,要想更“健康”地使用 AI,关键可能在于我们用它们的时候要“更走心”一点。 梅勒马德博士建议,不要让聊天机器人帮你完成一个宽泛主题的全部研究,而是把它当作研究过程中的一个“小助手”,用它来回答一些零碎的小问题,比如“帮我查一下某个历史年份”。 但如果你想深入地学习某个学科,那还是老老实实去读一本书吧。 来源:
宝玉
2周前
看到这条留言有感而发随手写了一点:为什么依赖“自驱”的学习这么难坚持? 答案很简单:你没有获得持续的正反馈。 所有依赖自驱的学习,想要有效果,都离不开两个核心引擎:正反馈和学习循环。 🆙 引擎一:正反馈(提供动力的“燃料”) 正反馈,就是那些能让你“爽”到的点,是你坚持下去的核心动力。 比如说: - 你写下 "Hello World",代码真的运行输出了。 - 你写的一个小脚本,真的帮你节省了半小时的重复劳动。 - 你做的小软件,真的帮朋友解决了一个棘手的问题。 这些,都是价值千金的正反馈。 相反,什么是负反馈? 比如说: - 花了一整天搭环境,最后还是跑不起来。 - 花了一个通宵调试,Bug 还是没找到。 - 精心写了很久的软件,压根没人用。 人是无法靠意志力对抗持续的负反馈的。 一直得不到正反馈,放弃才是最符合人性的选择。 ♻️ 引擎二:学习循环(内化技能的“发动机”) 光有“爽感”还不够,那可能只是短暂的兴奋。想真正“学会”,你需要一个能不断运转的发动机,一个把知识内化为自己真正技能的完整闭环。 拿学习编程来说,这个循环至少包含这三步: 1. 学习理论知识(学) 这是基础。通过看书、视频、课程,学习算法、数据结构、设计模式等。这是你的“弹药库”。 2. 动手实践(练) 这是最最最重要的部分。你必须去写代码、编译、运行、调试、修复错误,才能把抽象的概念具体化。 为什么现在都强调“干中学”?因为你看再多游泳视频,不下水,你永远学不会游泳。 很多人学不好编程,不是因为理论不懂,而是因为练得太少。 3. 解决真实问题(思) “练”一定会遇到问题。新手和高手的区别,就在于此。 你必须经历分析问题 -> 尝试解决 -> 撞墙 -> 查资料 -> 解决问题的完整过程。人,只有在解决问题的挣扎中,才能真正积累经验,掌握知识。 请注意:这一步,是 AI 无法替代的。 AI 可以帮你写出代码,但它无法帮你体验那个“从卡住到豁然开朗”的完整思考过程。这个经验,必须你自己去赚取。 那些所谓的高手,不过就是这个循环跑得多了,积累了海量的“问题-解决方案”范式,仅此而已。 关键:让“循环”产生“反馈” 现在我们把两个引擎连起来: > “学习循环”是产生“正反馈”的最佳途径。 当你完整地跑完一次循环(比如,学了一个新框架,动手做出了个小功能,并解决了所有Bug),你获得的正反馈是巨大的! 这种“我能行”的成就感,会给你充足的“燃料”,让你兴奋地开启下一次循环。 如何打造你自己的“正反馈学习循环”? 场景一:“简单模式”(在企业中) 在企业里有个巨大的好处:你不需要自己找循环,公司会“喂”给你。 - 接任务(识别问题) - 了解需求(学习理论) - 动手开发(动手实践) - 联调测试(解决问题) - 上线发布(获得正反馈:任务完成/用户使用) 而且,你身边有同事和导师。遇到问题,总有人帮你。如果你的 Leader 水平很高,能“刚刚好”给你安排那些“跳一跳才够得着”的活,你的成长会快到飞起。 场景二:“困难模式”(独自摸索) 如果你是一个人学习,情况会难很多,你必须刻意为自己设计这个循环。这里有几个关键建议: 1. 从 Side Project 开始,而且必须“小” 不要一上来就想做“一个 ChatGPT”。你的目标是快速获得正反馈。 - 一个自动签到的脚本。 - 一个批量处理图片的小工具。 - 一个帮你管理书单的简单网站。 谨记:先去发现你或朋友身边的“真实需求”再动手,成功率最高。 2. 把 AI 当“领航员”,别当“代驾” AI 是革命性的工具,但它很容易中断你的学习循环。 ❌错误用法(代驾): “帮我写一个xxx功能的代码。” -> 你只是复制粘贴,错过了“实践”和“解决问题”的环节。 ✅正确用法(领航员): “我遇到了xx错误,可能是什么原因?” “我想实现xx功能,有哪几种方案对比?” 如果你只是让 AI 帮你完成,你永远无法真正掌握知识,循环没有跑通。 3. 用“费曼学习法”倒逼理论输入 很多人“干中学”久了,会变成“野路子”,只知其然不知其所以然,很快会遇到瓶颈。 怎么办?用“教”来倒逼“学”。 把你项目中的思考、遇到的坑、解决方案,记录下来,尝试分享出去(写博客、做分享)。为了能给别人“讲明白”,你就必须去补习那些背后的理论知识,确保自己真的懂了。 这,就是最高效的理论学习方式之一。 4. 别闷头造车,去社区“求助”和“帮助” 一个人学习,最怕卡在一个问题上几天都出不来,负反馈爆棚。 AI 能解决一部分,但很多复杂或特定领域的问题,还得靠人。 我们这一代程序员成长时,都泡在 CSDN 论坛、Stack Overflow、知乎里。当你在社区里提问,得到解答,是正反馈;当你用你的经验去解答别人的问题,更是强烈的正反馈。 真正的成长,从来不发生在看视频或者让 AI 写代码的舒适区里,而是来自“学习 -> 实践 -> 解决问题”这个完整、甚至有些痛苦的循环。 可以从一个身边的小问题开始:动手去解决它,积累经验,获取正反馈!
宝玉
3周前
最近 X 上关于写作的话题比较火,正好看到一篇《写作建议》,作者收集了大量关于写作的经典建议,还分门别类整理到了一起。 所有这些五花八门的技巧,背后其实贯穿着几条非常清晰的底层逻辑。如果你也想让自己的文字更抓人、更清晰,也许看完能让你有“原来如此”的感觉。 底层逻辑1️⃣:写作的本质,是“读者体验设计” 这是所有建议中最核心的一条。 很多写作者,包括以前我也这样,在写作时,想的都是“我想表达什么”。但这份笔记里的高手们点出了一个更高级的视角:写作,是关于“读者要吸收什么”。 Steven Pinker 总结得最到位:作者的目标,是在最大化阅读乐趣的同时,最小化读者理解所需的脑力。 别让你的读者“费劲”。 你的工作不是“倾倒”信息,而是设计一条“体验路径”,让读者感觉自己是在毫不费力地“滑滑梯”,而不是满头大汗地“爬山”。 一旦你接受了这个设定,剩下的所有技巧,都是在为这个“最佳体验”服务。 底层逻辑2️⃣:动笔前,先排空你的“污水管” 我们都有过“写作卡壳”的经历:打开空白文档,枯坐半天,一个字都憋不出来。 这份笔记里提到了一个我见过最生动的比喻,来自 Julian Shapiro 的“创意水龙头”: > 把你的创造力想象成一个堵塞的水管。水管的最前端一英里,塞满的全是“污水”——也就是你脑子里那些最陈词滥调、最平庸、最不过脑子的“烂点子”。你的水管只有一个水龙头。想得到后面的“清水”,唯一的办法就是:先把这些“污水”全都放干净。 为什么在写作时会卡壳?因为我们总想一上来就写出金句。我们写下第一句“污水”(比如“这是一个值得思考的问题……”),然后立刻自我批判:“天啊,这写的是什么垃圾!”——于是我们删掉,试图等待“灵感”。 结果,我们永远卡在“污水”这一层。 而职业写作者的秘诀是:他们坦然接受“污水”的存在。他们会在写作初期,把脑子里所有能想到的烂点子、烂句子全都写下来。不评判、不删除,只是为了“排空管道”。 当你把这些平庸的想法都倒空之后,那些真正的好创意、好句子,才会“哗啦啦”地流淌出来。 所以,别再等灵感了。下次卡壳时,允许自己先写个垃圾出来。这是通往好内容的必经之路。 底层逻辑3️⃣:用“节奏感”黏住读者的大脑 好了,现在“清水”来了,你开始写作了。如何让读者不跳过、不走神,一字一句读下去? 答案是:制造“音乐”。 我们的大脑天生厌恶单调。如果所有句子的长度都差不多,大脑就会进入“无人机”般的嗡嗡声模式,很快就会感到无聊并“宕机”。 笔记里引用了 Gary Provost 的一段经典演示,我转述一下: > 这个句子有五个词。这里又是五个词。五个词的句子很好。但是一连串的五个词。读起来就很单调了。听听发生了什么。写作变得很无聊。它的声音在持续。就像一张卡住的唱片。耳朵需要一些变化。 > > 现在听好。 我改变了句子的长度,我就创造了音乐。音乐。文字在歌唱。它有了宜人的节奏,一种韵律,一种和谐。我使用短句。我也使用中等长度的句子。 > > 而有时候,当我很确定读者已经休息好了,我就会用一个相当长的句子来吸引他,一个充满能量、不断积蓄动力的句子,就像渐强音,就像鼓点,就像铙钹的撞击——这些声音在说:听着,这很重要。 这就是写作的“节奏感”。它通过长短句的交错,不断“唤醒”读者的大脑,引导他们的注意力。 除了句子长短,还有一些“读者大脑管理”的小技巧: 避免“开头词”重复:Scott Alexander 提醒,如果连续两三个句子都用同一个词开头(比如“我……”“我……”“我……”),读者会立刻感到“不适”,觉得你很笨拙。 控制“聚光灯”:Steven Pinker 提到,主动语态和被动语态不是语法问题,而是“焦点控制”问题。 - 主动(“那个女士用西葫芦砸了一个哑剧演员”)——聚光灯打在女士身上。 - 被动(“那个哑剧演员被女士用西葫芦砸了”)——聚光灯打在哑剧演员身上。 你想让读者先看谁,就让谁做句子的主语。 底层逻辑4️⃣:写作是“沟通”,不是“炫耀” 这部分主要针对非虚构写作,但同样适用于所有人。 1. 给读者“多巴胺小奖励” 斯科特·亚历山大说,读者的大脑很容易累。你必须不断给他们“小奖励”来维持动力。 - 微幽默 (Microhumor):这不等于讲笑话。它是在严肃的行文中,插入一个能让读者“嘴角微不可察地上扬一下”的词或比喻。这就像给读者喂了一颗小糖果。 - 清晰的结构:短段落、小标题、“首先/其次/最后”这样的“路标”(当然也有被误认为 AI 写作的嫌疑)。这能给读者“微小的成就感”(好的,我又读完了一部分”),帮他们“存档”信息。 2. 多使用“比如”和“举个例子” Steven Pinker:一个没有例子的解释,几乎等于没有解释。 我们作为作者,常常高估了读者对“术语”和“抽象概念”的理解力。因为我们自己已经把这些概念“打包”成了知识块。 当你写“定量宽松”、“熵增”、“熵减”时,大部分读者已经懵了。 当你写“中央银行购买私有资产”时,大家就开始懂了。 当你写“这就好比央行直接下场‘买买买’,往市场里撒钱”时,所有人就都懂了。 永远不要害怕解释你以为人尽皆知的术语。你多花 5 个字,比如一种开花芥菜,去解释“拟南芥”,就能把成千上万的读者留在你的文章里。 写作不是魔法,而是手艺。 它无关灵感爆发,而关乎对读者体验的极致共情。 它要求我们放下作者的自我,去扮演一个体验设计师:思考读者的大脑如何工作,如何让他们在阅读中感到轻松、愉悦并有所收获。 无论是排空污水管、制造节奏感,还是挖掘“第三层情感”,所有技巧最终都指向一件事: 尊重你的读者,尊重他们的时间,以及他们那颗容易疲倦的大脑。 原文: 翻译:
宝玉
3周前
转译:信任崩塌:无穷无尽的AI内容是一场灾难 作者:Arnon Shimoni 我们正在经历人类历史上最奇怪的时刻。 第一次,创造内容的成本降到了几乎为零。不是“比以前更便宜”,而是彻彻底底的免费。 现在,生成一千篇博客文章或一万封所谓“个性化”的邮件,成本几乎为零(至少目前如此)。 理论上听起来很棒——内容无限,让过去难以发声的人也能表达自己。 似乎充满了机遇。 但如果你试图通过这些内容去销售,就会发现一个严重的问题:信任崩塌的速度,比内容爆炸的速度还快。 这里的“信任”,不是抽象的概念,而是实实在在的问题——谁是真实的、谁是可靠的、我到底该关注谁? 我们并没有往前走,甚至正在倒退。 一个B2B SaaS公司的故事 我认识一位负责B2B SaaS销售的朋友,他非常聪明。他花了多年时间建立自己的社交圈,成为那种传统意义上靠关系和信任赢得客户的人。 但上周日他告诉我:“现在我基本无视所有邮件推广,陌生号码的电话我也几乎不接。” “因为我已经分不清那是真人还是机器了。以前我一眼就能分辨,现在做不到。所以干脆不理会,浪费时间。” 用通俗的话说,如果你现在还在做传统的外联推广,你的目标客户已经不再关心“我需不需要这个产品”,而是在想:“我凭什么相信你?” 营销漏斗?不,现在是信任漏斗 做营销这么多年,我发现很多所谓的“规则”和“玩法”其实都搞错了重点。我们总是在解释我们做什么,为什么重要。 但在大多数情况下,你的潜在客户早就知道他们需要你卖的东西。 他们根本不需要再看一份PPT,来了解AI编码助手如何提升开发效率,也不需要你告诉他们AI销售代表为什么可以帮他们发更多邮件。 过去一个月,他们可能已经听了40次这样的东西(天啊,现在到底有多少AI销售代表啊?)。 他们真正想知道的是:“凭什么我要跟你买,而不是另外100家发同样邮件来骚扰我的公司?” 而现在,铺天盖地的AI内容,让客户更难回答这个问题了。 图1 是我从PHOS Creative那里借用的: (图片描述: 营销漏斗(Marketing Funnel) - 品牌认知 / 触达(Awareness) - 评估 / 意向(Consideration) - 转化 / 下单(Conversion) 信任漏斗(Trust Funnel) - 能力 / 胜任度(Competency) - 可信度 / 公信力(Credibility) - 真实感 / 真实性(Authenticity) - 共情 / 同理心(Empathy) ) 维度 - 核心关注 * 营销漏斗:获客和转化 * 信任漏斗:建立关系和客户忠诚 - 最终目标 * 营销漏斗:完成交易 * 信任漏斗:长期客户支持与复购 - 内容策略 * 营销漏斗:推广为主,销售导向 * 信任漏斗:帮助客户,创造价值 - 衡量成功 * 营销漏斗:转化率、销量 * 信任漏斗:满意度、重复购买、口碑传播 -时间跨度 * 营销漏斗:短期到中期 * 信任漏斗:长期、持续积累信任 很明显,你应该站到信任那一边! 传统的获客方式现在变得很烂 现在这种获客方式实在是太无聊了。 当Claude的AI授权只需每月10美元时,内容创作成本基本为零。于是所有人都可以装得很专业,邮件里每个字语法正确,还能勉强引用你的领英发帖(虽然引用得很僵硬)。 这些东西几分钟就能生成,不用任何人工参与。 这就意味着:现在所有内容都值得怀疑。 现在,我直接把邮件和领英消息一律扔进垃圾桶。 为什么?因为我一眼就能看出,那背后并不是一个真正关心我和我的问题的人。 这些邮件全都是模糊的“个性化”,总是自称“对你如何做某件事感到好奇”,因为这种“好奇”的句式来自某个声称效果很好的推广指南。 对我来说,这就是信任崩塌的关键: 我并不是怀疑你的产品能不能用,我是怀疑你到底是不是个真人,签完合同后还会不会关心我。 响应率低了,我多发点邮件就好了? 天啊,别这样! 问题根本不在这里。 旧世界 (…-2024年) * 创造可信、个性化内容的成本:50美元/小时(人工) * 用户每周收到的个性化推广邮件:约10封 * 用户识别真实性的成功率:约80% 新世界 (2025年-…) * 创造可信、个性化内容的成本:几乎为0 * 用户每周收到的个性化推广邮件:约200封 * 用户识别真实性的成功率:约20% 信噪比已经崩溃,识别这些邮件真实性的精力成本远超过可能获得的收益。 结果,客户不再费力去判断真假,而直接默认这些全是垃圾邮件。这也是为什么我和我朋友干脆无视所有推广邮件的原因——很多人也一样。 因为要辨别“这些邮件里有没有价值”,所耗费的精力早就远远超过了可能获得的好处。 回到信任本身… 你必须明白,你的潜在客户问的不是: * 你的AI工具好不好用?(他们默认你的工具好用) * 真的能提升效果吗?(他们默认有效果) * 价格合适吗?(他们自己能对比) 他们真正关心的是: * 一年后你公司还在吗?还是集成到一半你就跑路了? * 你到底比另外5家公司好在哪里? * 你是不是靠烧VC的钱活着? * 等到风口过去,我的系统是不是会烂尾? * 你们公司到底赚不赚钱?还是只是凭感觉(vibe-coded,凭感觉编程,意为没有实际盈利模型、靠炒作存活的公司)想赶紧卖掉? 而最糟糕的是:如果你不明确告诉客户,他们根本没法自己判断这些问题。 不是想泼冷水,但… 我写这篇文章不是为了打击你,而是为了让你知道现在的营销要怎么玩。 是的,你依然要回答“客户为什么需要你的产品”,但你更要回答“客户为什么必须跟你买”,并确保你的营销内容体现这一点。 机遇仍然很大。我们所有人都必须做到: * 信任的建立,仍然是人类的工作。至少现在还是。AI能帮忙,但2025年建立真正的情感联结和信任,仍然只能靠人类。 * 个性化和精准营销依旧重要。AI应该帮你精细分类客户,但重点仍是识别什么时候该由人类出面,强化信任。 * 别把所有事情都自动化。尤其是复杂或高价值的销售场景,保持一定的人类参与至关重要。 AI时代真的不同了吗? 当然。 你代表一个品牌。品牌要持续赢得客户的信任——即使你使用了AI,也必须清晰体现出人类的领导力与温度。 来源:
宝玉
3周前
对于向深入学习上下文工程(Context Engineering)的同学,这又是一篇必看的文章。 这篇文章讲的是如何解决 MCP 工具太多的问题,但凡你做过 Agent 开发,用了大量 MCP 工具,就会知道 MCP 工具多了后最大的问题就是上下文占用太多,不仅导致成本高,还会影响推理和生成质量。 另外一个问题就是 MCP 工具返回的中间结果也会挤占大量的上下文空间。 看这文章的时候忍不住夸了一下 Manus,他们确实在上下文工程方面探索的很深入了,里面的工程技巧和他们以前分享过的很类似(我一会把之前分享过的 Manus 相关的文章在评论也发一下)。 Anthropic 的方案也很简单直接,就是把“代码”也当作工具的一种,然后从代码中去调用 MCP。 这样做有很多好处: 1. 解决了系统提示词中工具定义太多的问题 不需要在系统提示词中加载所有 MCP 工具,只需要定义一个“代码”工具。 那需要工具了怎么办呢? 这些代码都保存在统一的目录下,去目录检索下就能找到合适的工具了,比如这是文中的一个目录示例: servers ├── google-drive │ ├── getDocument.ts │ ├── ... (other tools) │ └── index.ts ├── salesforce │ ├── updateRecord.ts │ ├── ... (other tools) │ └── index.ts └── ... (other servers) 找不到现成的工具怎么办? 直接现写一个!写完了还可以保存起来下次继续用。 2. 解决了 MCP 工具返回结果太长的问题 比如说我们要用 MPC 工具获取 1 万行数据后筛选转换出合格的数据,就可以先从代码中调用 MCP 工具获取这 1 万行数据,然后从代码中去筛选过滤,最后只返回 5 条数据,这样上下文中就只需要保留那 5 条过滤的数据,而不是像以前一样有 1 万条数据在里面。 3. 解决了数据隐私问题 如果你直接使用 MCP 工具,工具返回的数据都要加载到上下文每次上传给 LLM,用代码就可以对敏感数据先二次处理再加到上下文 4. 中间结果持久化和技能沉淀 代码可以把一些中间结果写入文件保存到硬盘,一方面可以不占用上下文空间,另一方面也可以随时从硬盘避免反复调用 MCP。 还有就是虽然很多代码是临时生成的,但是这些临时生成的代码可以保存下来,沉淀为“技能”(Skill),加上 SKILL .MD 文件就和 Claude Code 的技能一样可以被反复使用了。
宝玉
3周前
关注 AI Agent 的力荐 MMC 的这篇刚发布的《State of Agentic AI: Founder’s edition》,不仅数据扎实,分析了问题,还提供了可行的解决方案。 今年 2025 年是公认的 AI Agent 元年,“Agentic AI” 非常火,新产品也层出不穷:Deep Research、Coding Agent、Browser use、Computer use …… 当然 Agent 争议也不小,一部分人认为没啥用,一部分人则觉得 Agent 无所不能,也无可厚非,大家都是主观感受 ,每个人使用场景都不一样,比如我自己就很喜欢 Coding Agent,真的能解决问题。但这种争议如果用数据说话就会有说服力的多,比如说这玩意儿,在真实的企业里,真的用起来了吗? MMC 则是深入访谈了 30 多家正在做 AI Agent 的创业公司创始人和 40 多位企业里的实际用户,写了这篇报告:《Agentic AI 现状:创始人版》。 【1】真正限制 AI Agent 的,可能不是 AI 不够聪明 大部分都以为目前 Agent 最大的困难会是“AI 不够聪明”、“幻觉太严重”或者“太难和当前系统集成”。 这些确实是问题,但出人意料的是,在创始人眼中,它们排不进前三。 根据调查,部署 AI Agent 时的三大问题分别是: 1. 工作流集成 和 人机交互(占 60%) 2. 员工抵触 和 非技术因素(占 50%) 3. 数据隐私与安全(占 50%) 也就是说最大的障碍,是“人”和“流程”的问题。 1. “这玩意儿我该怎么用?”(工作流集成) 这是占比 60% 的最大难题。 一个 AI Agent 再牛,如果它是一个需要单独打开的 APP,需要员工在现有的工作软件(比如钉钉、飞书、Salesforce)之外,再打开一个新窗口去指挥它,那它的使用率注定高不了。 成功的集成,是把 AI 嵌入到员工已有的工作流里。比如,当销售在 CRM 里更新一个客户状态时,AI Agent 自动跳出来说:“我帮你把刚才的会议纪要总结好了。” 这已经不仅仅是个技术问题了,更需要企业改变观念,企业得先想清楚:“要集成这样的 AI Agent,我原有的工作流程需要怎么改?”这往往比买一套 AI Agent 难得多。 2. “它会不会抢我饭碗?”(员工抵触) 这是 50% 的创始人提到的信任危机。 我们得承认一个现实:在企业里,人类和 AI 的合作,目前大多不太愉快。 - 一种是“过度依赖”:员工把活儿全丢给 AI,自己不检查,结果 AI 出了错,比如给客户报了个错误的价格,酿成大祸。 - 一种是“过度怀疑”:员工根本不信 AI,AI 做的每一步,他都要自己再核查一遍。这非但没提高效率,反而增加了工作量。 更深层的,就是对被 AI 取代的恐惧。这导致员工在用的时候束手束脚,或者干脆阳奉阴违,不愿配合。 3. “我的数据喂给 AI,安全吗?”(数据隐私) 这也是 50% 的创始人提到的核心关切。 这个问题在金融、医疗等行业尤其严重。企业会担心:“我把内部的财务报表、客户病历交给这个 AI Agent 分析,这些数据会不会被拿去训练别的模型?会不会泄露?” 这种担忧,有些是真实存在的,比如需要符合 GDPR、ISO 27001 等合规认证,也有些纯粹是感觉上的。但无论哪种,都会让企业在部署时畏手畏脚。 【2】做得好的 AI Agent:高准确率和高自主性 既然有这么多困难,那现在做的好的那些 AI Agent,实际表现怎么样? 这个报告给我很大收获的一点是它从两个维度来量化现在的 AI Agent:准确率(Accuracy)和自主性(Autonomy): - 准确率:AI 干的活儿,多大比例是对的、被人类接受的。 - 自主性:AI 干活儿时,多大程度不需要人来插手。 理想状态当然是高准确+高自主。但现实是,超过 90% 的Agent创业公司声称自己的方案达到了 70% 以上的准确率。 所以 MMC 把 Agent 划分了三个分类(低准确率+低自主性的Agent就不配存在): 1. 中准确、高自主: 适用于低风险、高重复、易验证的工作场景。比如自动给海量的营销邮件打标签。就算 AI 标错了 30%,但它帮你自动处理了 1000 封,你只需要人工纠错那些明显不对的,总体效率还是远超纯人工。 2. 高准确、低自主: 适用于高风险、高价值领域,比如医疗场景。比如 AI 帮你起草临床试验的研究报告。它必须保证 90% 以上的准确率,但人类专家必须在每一步进行严格审核(低自主权)。它扮演的是“超级助手”,而不是“决策者”。 3. 高准确率 + 高自主性: 这可以说是最理想的“甜点区”,是大家努力的方向。它适用于那些 AI 部署相对成熟或规则边界清晰的领域。比如客户服务、网络安全或金融合规。在这些场景下,AI Agent 已经足够可靠,达到 80%-90% 的准确率和自主性,可以被授予高自主权去端到端地处理任务。报告提到,这里的秘诀通常是将概率性的大语言模型与更具确定性的 AI 方法相结合,以提高准确性,从而进一步提高自主性。 【3】企业开始为 Agent 付费了 聊 AI Agent 落地,绕不开收费的问题,毕竟靠烧钱是无法持久的。 好消息是企业开始真掏钱付费了 报告发现,62% 的 AI Agent 创业公司,已经拿到了企业的“业务线预算(Line of Business budget)”。 这是个超级积极的信号。可能很多人不知道大公司内部的预算分两种:一种叫“创新预算”(Innovation budget),就是小金库或实验经费,数额不大,用完了算,大家图个新鲜。 而“业务线预算”,是各部门(如销售部、市场部、财务部)用来保证自己核心业务运转的支出。 当 AI Agent 开始动用“业务线预算”时,意味着它已经从可有可无的玩具变成了能帮我干活的生产力工具。 坏消息是现在还没摸索出最佳的收费模式 虽然知道这玩意儿值钱,但到底该怎么定价?报告显示,大家都在摸索,主流的两种方式是: 1. 混合定价(23%):比如“基础服务费 + 超出部分按用量付费”。 2. 按任务次(23%):AI 帮你干成一件事(比如发出一张发票),收一次钱。 而大家最期待的按照按效果付费(Outcome-based),目前只有 3% 的公司在用。 为什么?因为太难了。 比如,一个“销售 AI 助手”,它帮销售赢了个大单。这个功劳,到底 80% 算销售的,还是 20% 算 AI 的?怎么衡量?如果 AI 没功劳,企业是不是就可以不付钱?这根本算不清。 所以,目前最现实的还是按苦劳付费,而不是按功劳付费。 【4】最重要的部分:成功的 AI Agent 落地策略 既然 AI Agent 落地这么难,那些成功的 Agent 公司是怎么说服企业客户的呢? MMC 的访谈总结出了一套非常实用的落地经验: 秘籍一:“Think Small”(从小处着手) 报告总结了一个非常务实的落地策略:Think Small (从小处着手)。 忘掉那些“彻底颠覆行业”、“全自动替换人类”的宏大叙事。成功的 AI 智能体,往往从一个非常小、非常具体的切口进入: - 起点: 选一个低风险、中等收益的任务。 - 关键: 选一个员工最讨厌干的活儿。比如,销售团队最烦的手动录入客户数据,或者财务团队最烦的核对发票。 - 定位: 永远不要说你是“替代品” (Replacement),要说你是“副驾驶” (Copilot)。 你的目标不是让老板开除员工,而是把员工从那些重复、枯燥、没人想干的破事儿里解放出来。 当员工发现,这个 AI 真的帮我省了每周 5 小时填表的时间,信任的种子才算种下了。 秘籍二:“保姆式”服务(Hand-holding) 现在的 AI Agent 还远没到即插即用的程度。企业买的不仅是软件,更是一整套陪跑服务。 成功的创业公司都在用“前线部署工程师(FDE)”模式。这帮人既是程序员,又是咨询顾问,他们会直接“扎”到客户的办公室里,手把手帮客户梳理流程、清理数据、调整 AI。 同时,人机交互界面要做到“3E”: 1. Education(教育):AI 要能主动教用户“我能干啥,你该怎么用我”。 2. Entertainment(趣味):交互得有趣。 3. Expectation Management(预期管理):AI 必须坦诚地告诉用户“我干不了啥”,别吹牛。 秘籍三:定位决定生死(Positioning) 最后,你怎么“说”你是谁,可能比你“是”谁更重要。 - 是“副驾驶”,不是“替代者”: * 一定要把姿态放低。你的产品是“Copilot”(副驾驶、领航员),是来“Augment”(增强)员工能力的,不是来“Replace”(替换)他们的。哪怕你的技术真的能替换掉 80% 的人,也千万别这么说。 - 看人下菜碟: * 在医疗这种保守行业,你最好少提“AI”,多谈“自动化”、“效率提升”。 * 在金融这种激进的行业,你就得猛吹“Agentic AI”,显得你很前沿。 - ROI 要具体: * 对于成熟流程,就说“节省了 XX 小时”或“降低了 XX% 成本”。 * 对于 AI 创造的新能力(比如“千人千面”的网页),就把它和你已有的工具挂钩,比如:“能让你的谷歌广告转化率提升 20%”。 【最后】 港真,年初的时候我还是 AI Agent 的怀疑论者,自从用了 Claude Code 后,我开始“真香”,变成了 AI Agent 的积极拥护者,也一直很关注这个领域的发展,这份报告质量还是很高的,尤其是给我最大感触的点是: 决定 AI Agent 落地成败的,最重要的因素已经不是模型能力够不够强,而是它怎么和企业内部的流程整合,怎么取得员工的行人,怎么证明它存在的价值。 另外从准确率和主动性这两个维度来量化评估 AI Agent,是挺科学的,现在很多的 AI Agent,主动性高了准确率可能就不够,准确率上去了主动性又不行,要做好 Agent,最终还是要做到像一个情商高的真人那样,在你还没开口时,就洞察到你的需求,默默帮你把事情搞定。
宝玉
3周前
关于 ChatGPT 为什么喜欢用破折号,这个问题的原因似乎现在还没有定论,不过刚看到一篇博客分析这个问题,还挺有趣。 先说一个有趣的问题是 AI 特别喜欢用 "delve"(深入探究)这个词。 这个现象的答案是已知的:RLHF(人类反馈强化学习)。 简单说,AI 模型训练的最后一步,是雇佣大量的人类“导师”来给它的回答打分。OpenAI 雇佣的导师很多在肯尼亚、尼日利亚等非洲国家。而在这些地区的“非洲英语”中,"delve" 是一个非常常用且得体的词汇。 于是,当 AI 用 "delve" 时,非洲的导师们觉得“这话说得不错”,就给了高分。AI 就此学会了:“哦,客户喜欢我用‘delve’。” 那么,破折号也是因为这个原因吗? 作者顺着这个思路去查证:是不是非洲英语里也特别爱用破折号? 结果,并不是! 尼日利亚英语破折号的出现频率(每词 0.022%)远低于普通英语的平均水平(0.25% 到 0.275%)。 这说明,“深入探究”(delve)和“破折号”(—)这两个 AI “口音”,来源并不相同。 作者最终发现了一个决定性的线索:时间。 大家回忆一下,2022 年底的 GPT-3.5,其实并没有这个毛病。这个“破折号上瘾症”是在 GPT-4 和 GPT-4o 身上才集中爆发的。 不只是 OpenAI,谷歌和 Anthropic 的模型,包括一些中国的大模型,都开始用破折号。 那么,从 2022 年到 2024 年,所有 AI 实验室的训练数据,到底发生了什么共同的变化? 答案是:AI 公司的“数据荒”来了,它们开始疯狂“喂”AI 吃书——特别是“旧书”。 在 2022 年,AI 主要吃的是互联网上的公开数据、盗版电子书(比如 LibGen 上的)。但很快,这些数据就不够用了,而且质量良莠不齐。 为了让模型变得更“有文化”、更“高质量”,AI 公司们(法庭文件显示 Anthropic 在 2024 年 2 月开始了这项工作,OpenAI 只会更早)启动了一个庞大的工程:大规模扫描实体书,把纸质书数字化,作为训练数据。 好了,破案的最后一块拼图来了。 既然 AI 吃了大量(可能是几百万册)扫描的纸质书,那么这些书是什么年代的呢? 盗版电子书网站上的书,大多是当代流行读物。而 AI 公司为了“填饱肚子”并绕开版权,扫描的书中,有很大一部分是更古老的、已进入公共领域的作品。 作者找到了一个关于英语标点符号使用频率的研究,它显示: 破折号在英语文学中的使用频率,在 1860 年左右达到了顶峰(约 0.35%),在 19 世纪末和 20 世纪初的使用率,远高于当代英语。 作者举了个例子:著名的《白鲸记》(Moby-Dick,1851年出版)一书中,破折号出现了 1728 次! 真相至此水落石出: 我们现在用的最先进的 AI,它的“标点符号观”并不是从 2020 年的互联网学来的,而是从 1890 年的旧小说里继承的。 AI 公司们为了获取“高质量”的语料,把大量 19 世纪末、20 世纪初的文学作品喂给了模型。AI 忠实地学习了那个年代的写作风格——其中就包括对“破折号”的狂热喜爱。 当然,作者也承认,这仍然是一个基于证据的推测,还有一些小疑问没解决: 1. 为什么 AI 只学会了用破折号,却没有学会像《白鲸记》的船长那样说话? 也许模型只是吸收了标点符号这种“潜意识”的风格,而没有吸收具体的用词? 2. 有没有更简单的解释? 比如,Sam Altman 曾随口提过,他们发现 RLHF 的人类导师“似乎更喜欢”带破折号的回答,觉得那样更“口语化”,所以就“多加了点”。 不过,综合来看,“扫描旧书”这个理论目前是最有说服力的。它完美地解释了为什么 GPT-3.5 不会,而 GPT-4 之后的模型(它们都大量训练了新的书籍数据),然后集体对破折号“上瘾”了。 有兴趣可以看看原文:
宝玉
3周前
Text to Markdown Prompt 适用于你要把推文、微博这种纯文本内容转成格式良好的博客,可以帮你生成标题、列表,和加粗要点、金句。 亮点: - 借助思维链先提取要点、金句和可选标题,然后选择标题和高亮要点、金句 - 解决了 LLM 在加粗带标点符号的文字时加粗失效的问题(如果你用过 LLM 生成的中文 Markdown 会明白我说什么,参考图4) ---- 提示词开始 ---- # 任务:将文本转换为结构化 Markdown 请你扮演一个专业的编辑,将提供的文本内容转换为一份格式良好、结构清晰、重点突出的 Markdown 文档。 ## A. 内部推理步骤 (请在你的思考过程中执行,无需输出) 在生成最终的 Markdown 之前,请先在内部完成以下思考: 1. **理解与提取**: * 通读全文,准确把握文章的核心主旨和目的。 * 识别并提取文中的**核心论点**、**关键结论**和**重要定义**。 * 找出文中具有高度概括性或特别精辟的**“金句” (Golden Sentences)**。 2. **构思标题**: * 基于文章主旨,生成 2-3 个备选的主标题 (H1 级别)。 3. **最终决策**: * 从备选项中选择一个最精炼、最贴切的标题作为最终主标题。 * 从步骤 1 提取的内容中,最终确定哪些句子或短语最值得在正文中加粗,以引导读者快速抓住核心。 ## B. 最终输出规范 (请严格按此格式生成) 请根据你的内部推理,生成符合以下所有规范的 Markdown 文本: 1. **主标题 (H1)**: * 使用 `# 标题` 格式,采用你在步骤 A.3 中选定的最佳标题。 2. **内容结构**: * 使用不同级别的子标题(如 `##`、`###`)来组织文章脉络,使其逻辑清晰。 * 适当使用项目符号(`-`)或编号列表(`1.`)来呈现并列或顺序关系。 3. **突出重点 (句子优先)**: * **有选择性地**使用粗体 (`**`) 来突出你在步骤 A.1 和 A.3 中确定的**核心论点**、**关键结论**或**金句**。 * **优先加粗**:优先考虑加粗**能够概括要点的完整句子**或**关键短语**。 * **避免**:避免只加粗零散的单个关键词,并**切勿过度使用粗体**,保持文档的专业性和易读性。 4. **【!!!】重要格式规范**: * 在设置粗体时,**绝对不要**将任何标点符号(如 `。`、`,`、`:`、`"`、`(`、`)` 等)包含在 `**` 标记内部。 * ✅ **正确示例**(标点在 `**` 之外):这是“**一个核心观点**”。 * ❌ **错误示例**:这是**“一个核心观点”**。 --- 请开始处理以下内容:
宝玉
3周前
很荣幸被评选为微博2025最具影响力AI大V,还是写点什么感谢一下支持我的网友和新浪微博平台。 特别喜欢今年微博V影响力大会的那句 Slogan:“尽兴分享 自成影响”,因为从2010年注册了微博到今天,这8个字就是我微博账号成长的真实写照。我一直在“尽兴分享”,分享生活、分享技术和管理经验、这几年集中分享 AI 资讯和技术,不知不觉也从最开始只有少数好友互动,到如今的百万粉丝的大v。 我从来没有把成为百万粉丝大v作为我的微博目标,作为个个人账号也没有学习研究过运营技巧,对我来说它只是“尽兴分享”一种结果——“自成影响”!当然更多的是幸运,赶上了 AI 爆发,最重要的是大家的支持,给了我很多正向的反馈,让我在分享之余,也收获了很多:善意的支持、不同观点的碰撞、流量和声誉。这些都给了我动力持续的创作和分享。 有人问过我为什么会每天坚持写微博? 其实我单纯的只是为了践行费曼学习法,尤其是在 23 年 AI 让大家都很焦虑的时候,我也很焦虑,所以拼命的去学习 AI 知识,以前都是偏应用技术,AI 对我来说是很遥远很高深的事情,于是我想通过微博分享学习心得、实践经验的方式来倒逼着我学习,这能帮助我快速掌握 AI 技术(本质上就是费曼学习法)。 这样实践下来效果真的很好,我一边学习提示词一边分享我试验出来的提示词,一边学习实践 RAG 一边写 RAG 的技术文章,每一次写作都让我对这些技术有更深入的领悟,意外的还让我成为微博上第一批大量分享 AI 资讯和技术经验的博主。 包括我在 X 上的账号也是因为“尽兴分享”跟着一起“自成影响”,因为当时我发现学习 AI 知识了解 AI 资讯 X 上是最好的,要在微博上分享更多优质内容,少不了要去 X 上收集信息,所以就开始启用了好多年不怎么使用的 X 账号,开始同步分享,跟着吃了一波 AI 增长的红利。 当然影响力和流量也是双刃的,当有了流量和粉丝数,就难免也会在意流量的涨跌;流量上来负面评论也会多起来,甚至会影响情绪。 我也是花了一些时间才慢慢调整过来,负面评论拉黑是最简单直接的,所以我个人介绍里面至今保留了一句:不争论只拉黑。总的来说微博环境相对还是不错的,微博在这方面确实花了不少精力,很多地方比 X 做的要好,另外关注 AI 的人群整体素质也相对要高很多。很多时候遭遇负面评论,最让我暖心的是很多站出来留言支持我的网友,感谢你们🥰! 对于流量这事,一个本身我也没有那么在意,另外也慢慢有了自己稳定的和高效的创作模式: - 每天大量阅读推文和资讯(我的信息来源主要是 X 的推送和 Hackernews),一部分有价值的借助 AI 翻译或者总结发布 - 大量的实践 AI,应用 AI 在日常工作生活中,随时将学到的心得和经验分享 - 基于和用户互动的内容创作,比如代表性的问题解答或者感想 - 定期将自己阶段性的思考写成原创的内容 作为一个 AI 博主,自然也少不了大量应用 AI 来帮助提升运营效率。我有各种不同的提示词来帮助做不同的任务,比如翻译的、总结的、看论文的、画图的、视频转文字的等等,作为一个程序员出生的博主,更是可以借助程序来写一些工具,比如我有一些自己用的网页转Markdown、视频翻译的工具、长文翻译、排版的工具。不过现在,更多是直接借助各个 AI 工具结合提示词就足够了。而且绝大部分我用到的提示词都分享过的。 也许将来我没办法做到像这几年一样一直高频度写作,但应该还是会坚持“尽兴分享”。 谢谢你们对我的支持,也希望你能“尽兴分享 自成影响”!