宝玉

统计数据

774

文章

0

粉丝

0

获赞

6912

阅读

1周前

来自 X 账号 TestingCatalog 的爆料：Google 在 Gemini 企业版（Gemini Enterprise）里新增多智能体「自动做研究」模式 Google 正在 Gemini for Enterprise 里打造一个多智能体系统。你给它一个主题，再配上一套评估标准，它就能自己生成一大堆点子，然后拉起一整支智能体团队，像打锦标赛一样一轮轮评审这些点子。这个系统一次可以连续干活大约 40 分钟。对一个面向普通企业用户的产品来说，这已经是非常长的一次连续推理过程了。在这 40 分钟结束时，用户会收到一大串点子清单，按你一开始设定的标准从优到劣排好名。整个规模也不小：系统一次能产出大约 100 个点子。对每一个点子，你都能拿到： - 一个概览 - 一个更详细的说明 - 一份点评总结 - 一份完整长评 - 以及一份专门的「锦标赛表现报告」（tournament performance report）这个「表现报告」还是一个单独的输出，可以单独打开慢慢看。所有生成出来的点子都是可选择的，你可以点进任意一个，继续深入展开。在当前的内测版本里，Google 看起来内置了三个智能体，其中有两个就是搭在这个多智能体「锦标赛」系统之上的。第一个叫 “Idea Generation”（创意生成）在这个模式里，你只要给一个主题，这个智能体就会启动整套多智能体工作流，用「锦标赛式评估」（tournament-style evaluation）来生成和排序各种相关点子。（所谓锦标赛式，就是不断让方案互相“对决”，胜出的留下，弱的被淘汰）第二个叫 “Co-scientist”（联合科学家）这个则更偏向科研和研究场景。你可以指定一个研究主题，再提供一些额外数据，然后一整个智能体团队会先生成研究方向和方案，再用同样的锦标赛机制去评估这些想法，只是这次会更强调科研和科学探索的需求。这里最有意思的一点，是它背后明显投入了非常夸张的算力。允许智能体在一个任务上连续工作大约 40 分钟，这在现在的大多数智能体工具里都算是「豪华配置」了。在整个 40 分钟里，系统会不断迭代这个问题，不停生成、筛选、打分、重组。目前，这一切都还只出现在 Gemini for Enterprise 里，属于内部开发阶段，对普通用户是隐藏的，还没有以正式功能形式对外开放。跟现有的智能体实现相比，这一套看起来是个明显的前进一大步。就算是那些已经带浏览器模式的高级智能体，通常也会受限于上下文窗口和时间预算（time budget）。而这次，Google 的做法，是直接把一大块算力「摆在台面上」给企业客户用，做成一个正儿八经的前端产品界面。这也和所谓的「Level 3 AI」的概念非常契合：这一层级的 AI 智能体，被描述为可以在同一个问题上持续工作一段较长时间。（这里的 Level 3 并不是统一标准，更像是行业里对“能长时间连续工作的智能体”的一种非正式分级说法）从这个角度看，让智能体在单个任务上跑满 40 分钟，是一个非常典型、甚至偏激进的例子。在实际使用中，这套系统输出的核心是「被充分筛选和精炼过的点子集合」。但它们远不只是随手抛出来的一堆建议，而是可以视为一组结构化的研究方向：在你给定的数据和问题背景下，这些方向有可能真正指向高价值的洞见。所以，Google 正在推进这种极其强力的智能体能力，专门服务于组织、公司和研究团队，这件事本身非常耐人寻味。等这项功能真正对外发布时，很可能会是一次不小的跃迁，尤其是如果这些智能体最终由 Gemini 3 Pro 来驱动的话。现在，Gemini 3 Pro 还没有进入 Gemini Enterprise，所以目前还不清楚这些实验性智能体背后具体用的是哪一个模型。这里依然有很多东西需要测试和验证。当你把一个提示词（prompt）提交给这套系统时，它首先会给出一份「计划做什么」的概要：会在哪些维度上评估、打算从哪些方向出发生成和筛选点子。只有在你确认这份概要之后，系统才会真正启动那次「大任务」。这相当于在烧一大笔算力之前，先和你对齐「我到底打算怎么理解你的问题」。除了多智能体锦标赛工作流之外，Gemini Enterprise 里还有另一个智能体，叫 “chat with your docs”（和文档聊天），它配了一套独立的 UI。这个智能体允许用户上传大小最高 30MB 的 PDF，然后面向这些文档进行专门对话。这个功能同样属于 Gemini Enterprise 的一部分，目前还没有对外发布，而且在生产环境中暂时不可用。它的设计思路是：最多 30MB 的 PDF 内容可以被分析并写入模型的上下文里，这样用户就能从现有文档中抽取更有价值的信息，而不是只靠人自己翻页看。在 Gemini Enterprise 里，还有不少其他功能正在开发中，但真正最抢眼的，还是这两条线： 1. 多智能体锦标赛式工作流 2. 面向文档的专用智能体特别是那个基于锦标赛的多智能体架构，看起来就是一种突破性的产品路线——其他大语言模型（LLM）服务商，目前似乎还没有在这个层级上，给用户提供类似的东西。多智能体锦标赛在面向终端用户的工具里依然非常少见。也许可以拿 Grok Heavy 来做某种对比，但很可能也不能算是和 Google 这套完全同一个方向的东西。等这些智能体成熟之后，如果能看到一套正式的评估结果和基准测试，那会非常有价值。光从现在的描述来看，那个 Co-scientist 智能体已经足够让很多大型组织和研究团队心动——尤其是那些正在探索新科学方向的团队。至于这些智能体具体什么时候会正式上线，或者会不会开放给非企业用户，目前还都是未知数。来源：

Google Gemini 2.5发布引发AI模型性价比热议· 465 条信息

OpenAI新德里发布会：ChatGPT语音翻译功能引发热议· 854 条信息

#Gemini Enterprise #多智能体 #锦标赛式评估 #AI研究 #算力

1周前

转译：也许你并没有真正尝试——能干的人，也会选择性地无能为力作者：Cate Hall 转译：也许你并没有真正尝试——能干的人，也会选择性地无能为力作者：Cate Hall 五年前的假期里，有两件事情同时发生在我身上：我去了戒毒康复中心，并且遭遇了一名网络跟踪者。这两件事并非完全没有关联。那个跟踪我的人来自印度，他是在我玩扑克牌时开始关注我的。他逐渐认定我们之间存在某种亲密关系，并坚信我的每条推特都是专门发给他的暗号。当我连续两个月停止发推后，他确信我一定出事了，于是找到我的邮箱和电话号码，开始疯狂给我发消息，逼问我的下落。当我意识到这一切时，情况已经失控了。我明确地知道，自己永远不会回应他。我开始不断拉黑他的账号，但他总能换个号码、注册新账号或用其他方法找到我。他每天给我发几十条消息，从威胁到哀求都有。半年后，他甚至找到了我的公司申请职位，我由此得知了他的真实姓名，试图通过他的一位旧友来寻求帮助。然而，那位朋友却因为害怕惹祸上身而拒绝帮忙。我感觉自己束手无策，只好寄希望于他迟早会放弃。但他从未放弃。数年过去了，我从未回复过他，他却每天依旧给我发数条消息。这些消息越来越恐怖，越来越色情，甚至威胁称会来伯克利伤害我。去年11月，情况终于到了极点：短短几天内，他向我发来了他刚办好的护照和签证申请的照片，并宣称即将前往美国。同时，他通过伪装我的电话号码向我哥哥勒索了一笔钱，声称绑架了我。「受够了！」我愤怒地想，我决定立刻行动起来。但事实上，我什么都没做。我只是蜷缩成一团哭泣，朋友们劝我报警，我却绝望地认为，自己在美国，他在印度，报警根本没用。可我的丈夫并不这样想。他坚持认为一定有更好的办法，并请求我允许他代我处理此事。他迅速联系了FBI和美国驻印度领事馆，并在他朋友Govind的帮助下（Govind在印度有亲戚），成功联系到当地警方。短短几个月后，问题得到彻底解决。那个跟踪者再也无法踏上美国的土地。这件事最有意思的一点是，我丈夫采取的策略并不特别新颖。他所用的方法，和我帮别人处理类似问题时能想到的几乎一模一样。那么，为什么非得另一个人介入，我才明白自己并没有真正尝试过？我想原因可能是这样的：当跟踪者进入我生活时，我正处于人生的低谷期——孤独、迷茫又穷困潦倒。当时我采用的唯一应对办法，就是忽略并寄希望于他自己放弃，这似乎是当时我唯一有能力做的事。但问题在于，我对这个问题的态度，从那时起就被固定住了。后来，我的生活状况逐渐改善，我的能力也增强了，可我从未重新评估过当时的做法是否正确。我想，我们所有人都是如此。人并非简单地高能或低能，而是选择性地拥有行动力（selectively agentic）。假设我们把生活分成三大领域：工作、与他人的关系（包括所有人际关系）、以及自我关系（身体健康、自我探索、情绪成长等等）。事实上，每个人可能都有至少一个领域，仍然停留在早年未成熟的阶段。在那个领域，我们面对问题时就像十几岁的孩子一样幼稚和无助，而事实上我们早已成年。在我所处的圈子里，有许多工作领域的高成就者。他们在科学、技术和政策领域不断创新，改变世界。但他们中的不少人，却没有将同样的聪明才智应用到内心的成长和人际关系中。他们能在异国他乡成功推出新产品，却抱怨在约会软件上找不到有趣的人。默认情况下，我们面对一个曾经失败过的问题时，总是停留在最初尝试并失败的那种无助状态。比如，假设你20岁时曾尝试过心理治疗，但并未有效缓解焦虑。你逐渐认定这是个无法解决的问题，于是接受焦虑就是你性格的一部分。但现在，你可能已经32岁了，是一家创业公司的技术主管。当工作中遇到难题时，你总能竭尽全力，尝试各种方法，不断学习。可对待自己的焦虑问题时，你却不再尝试了。你可能从没认真想过自己是否能： - 仔细检查自己的营养和睡眠状况； - 了解各种补剂或药物； - 投资改善自己的休息与恢复； - 问问朋友们最有效的治疗方法，寻找最优秀的治疗师或教练； - 研究一些专为你这样的人开发的新疗法。你没做这些事，只是忍受，或者用最初学到的需要极大意志力的方法来抵抗焦虑。这种挣扎让你觉得自己很努力。然而感受到辛苦，并不意味着你真正尝试过了。这让我想起了亚历山大技巧（Alexander Technique）的一个相关概念：“感知失真”（faulty sensory appreciation）。长久习惯的身体紧张会扭曲你的感官，让你误以为僵硬的姿势才是“良好的体态”。同理，那些选择性无能的人可能也有感知失真的情况。比如你觉得人际关系总是困难重重，需要不断付出意志力，这种辛苦甚至成了你努力的证明。然而，不断地挣扎可能只是说明你的生活结构存在问题。我建议你假设，在你的生活中肯定存在某个领域，你不自觉地被冻结在了过去的某个状态。这非常值得你仔细排查。仔细审视一下工作、与他人关系和自我关系这三个方面，找出你面对的最大问题。有时候，它可能看起来并不像个具体问题，而只是一种悲伤或愤怒，比如没人理解的悲伤，或工作缺乏意义的挫败感。找到它们后，问问自己：“我真的已经尽了全力、用尽了所有资源去想办法了吗？如果换成朋友遇到同样的问题，我能否给出更好的建议？我如何确定自己是真的尝试过了？” 注：作者的新书《You Can Just Do Things》即将出版。 --- 来源：五年前的假期里，有两件事情同时发生在我身上：我去了戒毒康复中心，并且遭遇了一名网络跟踪者。这两件事并非完全没有关联。那个跟踪我的人来自印度，他是在我玩扑克牌时开始关注我的。他逐渐认定我们之间存在某种亲密关系，并坚信我的每条推特都是专门发给他的暗号。当我连续两个月停止发推后，他确信我一定出事了，于是找到我的邮箱和电话号码，开始疯狂给我发消息，逼问我的下落。当我意识到这一切时，情况已经失控了。我明确地知道，自己永远不会回应他。我开始不断拉黑他的账号，但他总能换个号码、注册新账号或用其他方法找到我。他每天给我发几十条消息，从威胁到哀求都有。半年后，他甚至找到了我的公司申请职位，我由此得知了他的真实姓名，试图通过他的一位旧友来寻求帮助。然而，那位朋友却因为害怕惹祸上身而拒绝帮忙。我感觉自己束手无策，只好寄希望于他迟早会放弃。但他从未放弃。数年过去了，我从未回复过他，他却每天依旧给我发数条消息。这些消息越来越恐怖，越来越色情，甚至威胁称会来伯克利伤害我。去年11月，情况终于到了极点：短短几天内，他向我发来了他刚办好的护照和签证申请的照片，并宣称即将前往美国。同时，他通过伪装我的电话号码向我哥哥勒索了一笔钱，声称绑架了我。「受够了！」我愤怒地想，我决定立刻行动起来。但事实上，我什么都没做。我只是蜷缩成一团哭泣，朋友们劝我报警，我却绝望地认为，自己在美国，他在印度，报警根本没用。可我的丈夫并不这样想。他坚持认为一定有更好的办法，并请求我允许他代我处理此事。他迅速联系了FBI和美国驻印度领事馆，并在他朋友Govind的帮助下（Govind在印度有亲戚），成功联系到当地警方。短短几个月后，问题得到彻底解决。那个跟踪者再也无法踏上美国的土地。这件事最有意思的一点是，我丈夫采取的策略并不特别新颖。他所用的方法，和我帮别人处理类似问题时能想到的几乎一模一样。那么，为什么非得另一个人介入，我才明白自己并没有真正尝试过？我想原因可能是这样的：当跟踪者进入我生活时，我正处于人生的低谷期——孤独、迷茫又穷困潦倒。当时我采用的唯一应对办法，就是忽略并寄希望于他自己放弃，这似乎是当时我唯一有能力做的事。但问题在于，我对这个问题的态度，从那时起就被固定住了。后来，我的生活状况逐渐改善，我的能力也增强了，可我从未重新评估过当时的做法是否正确。我想，我们所有人都是如此。人并非简单地高能或低能，而是选择性地拥有行动力（selectively agentic）。假设我们把生活分成三大领域：工作、与他人的关系（包括所有人际关系）、以及自我关系（身体健康、自我探索、情绪成长等等）。事实上，每个人可能都有至少一个领域，仍然停留在早年未成熟的阶段。在那个领域，我们面对问题时就像十几岁的孩子一样幼稚和无助，而事实上我们早已成年。在我所处的圈子里，有许多工作领域的高成就者。他们在科学、技术和政策领域不断创新，改变世界。但他们中的不少人，却没有将同样的聪明才智应用到内心的成长和人际关系中。他们能在异国他乡成功推出新产品，却抱怨在约会软件上找不到有趣的人。默认情况下，我们面对一个曾经失败过的问题时，总是停留在最初尝试并失败的那种无助状态。比如，假设你20岁时曾尝试过心理治疗，但并未有效缓解焦虑。你逐渐认定这是个无法解决的问题，于是接受焦虑就是你性格的一部分。但现在，你可能已经32岁了，是一家创业公司的技术主管。当工作中遇到难题时，你总能竭尽全力，尝试各种方法，不断学习。可对待自己的焦虑问题时，你却不再尝试了。你可能从没认真想过自己是否能： - 仔细检查自己的营养和睡眠状况； - 了解各种补剂或药物； - 投资改善自己的休息与恢复； - 问问朋友们最有效的治疗方法，寻找最优秀的治疗师或教练； - 研究一些专为你这样的人开发的新疗法。你没做这些事，只是忍受，或者用最初学到的需要极大意志力的方法来抵抗焦虑。这种挣扎让你觉得自己很努力。然而感受到辛苦，并不意味着你真正尝试过了。这让我想起了亚历山大技巧（Alexander Technique）的一个相关概念：“感知失真”（faulty sensory appreciation）。长久习惯的身体紧张会扭曲你的感官，让你误以为僵硬的姿势才是“良好的体态”。同理，那些选择性无能的人可能也有感知失真的情况。比如你觉得人际关系总是困难重重，需要不断付出意志力，这种辛苦甚至成了你努力的证明。然而，不断地挣扎可能只是说明你的生活结构存在问题。我建议你假设，在你的生活中肯定存在某个领域，你不自觉地被冻结在了过去的某个状态。这非常值得你仔细排查。仔细审视一下工作、与他人关系和自我关系这三个方面，找出你面对的最大问题。有时候，它可能看起来并不像个具体问题，而只是一种悲伤或愤怒，比如没人理解的悲伤，或工作缺乏意义的挫败感。找到它们后，问问自己：“我真的已经尽了全力、用尽了所有资源去想办法了吗？如果换成朋友遇到同样的问题，我能否给出更好的建议？我如何确定自己是真的尝试过了？” 注：作者的新书《You Can Just Do Things》即将出版。 --- 来源：

#网络跟踪 #选择性无能 #心理困境 #人际关系 #自我成长

1周前

根据Replicate官方博客11月17日发布的消息，AI模型部署平台Replicate宣布将加入Cloudflare。 Replicate是一家致力于构建“AI原生工具”的公司，旨在让软件开发者能更轻松地使用AI，而无需深入了解其底层的复杂技术。他们开发了开源工具Cog（一种标准化的模型格式）以及Replicate平台，允许开发者分享AI模型并通过API运行它们。公告将这些AI工具比作在云端运行的“分布式操作系统”。因为运行AI模型需要专业的GPU和庞大的集群，所以“网络就是计算机”。而Cloudflare拥有全球领先的网络，并且已经构建了这个“操作系统”的许多其他部分，例如用于运行代码的Workers、用于管理状态的Durable Objects以及用于存储的R2。为什么合并？ Replicate认为，通过将其底层的AI抽象（如模型运行、数据输入输出）与Cloudflare强大的开发者平台相结合，双方可以构建更高级别的AI工具，例如用于编排模型、构建AI代理（Agents）以及在边缘运行实时模型。对用户有何影响？公告明确表示，Replicate将继续作为一个独立的品牌运营，并且会变得“更好”——速度更快、资源更充足。对于现有用户最关键的信息是： - API不会改变。 - 用户当前使用的模型将继续工作。 - 所有构建在Replicate上的应用将继续照常运行。 Replicate的联合创始人表示，Cloudflare是构建Web应用的默认选择，而通过这次联手，他们的共同目标是成为“构建AI应用的默认选择”。

#replicate #CloudFlare #AI模型部署 #收购 #开发者平台

1周前

Peter Yang 对 Cursor 设计负责人 Ryo Lu 的访谈中，其中两点尤其认同： 1. 在 AI 原生（AI-native）公司里，角色边界会变得很模糊。在 Cursor，设计师、产品经理、工程师之间的分工并不是传统那种各管一摊。 Ryo 的说法是：大家会根据自己的长处来做事，谁更擅长就多承担那一块，然后用 AI Agent 把这些工作串起来，形成一个完整的产品体验。 2. 模型越强，规格说明（spec）就越重要，而不是越不重要。 Ryo 的预测是：随着大语言模型能力越来越强，它们会变得非常擅长“严格按规格实现需求”。这意味着：你的 spec 写得有多清晰、具体、准确，很大程度上就决定了 AI 帮你做出来的东西质量有多高。 3. 分批发布，每一轮都会根据反馈打磨调整 Ryo 讲了 Cursor 内部发布的节奏：第一步，先发给公司内部员工用；第二步，再把最新的 nightly build 发给 Cursor 的忠实用户；第三步，才逐步推给普通用户；最后，才是企业用户（enterprise）。每一批用户都是一次打磨机会，让他们在小范围发现问题、修细节，再扩大范围。

AI编程工具激战：Claude Code、Gemini Cli崛起· 1242 条信息

#AI原生公司 #角色边界模糊 #规格说明重要性 #分批发布 #用户反馈打磨

1周前

前几天 Anthropic 发布的那份报告《挫败首例由 AI 策划的网络间谍活动（Disrupting the first reported AI-orchestrated cyber espionage campaign）》已经被很多人骂过了，这几天在 Hacker News (HN) 上也是被群嘲。报告的核心指控是：他们发现并阻止了一个“复杂的”网络间谍行动，该行动由一个他们定性为“中国政府资助”的组织（代号 GTG-1002）发起。而最关键的一点是，这个组织使用 AI（特别是 Claude）来“编排和执行”其 80-90% 的战术行动。社区的开发者和安全专家们非但没有感到震惊，反而将这份报告扒了个底朝天。结论几乎一边倒：这与其说是一份威胁情报，不如说是一份精心包装的营销噱头。首先是一位安全行业的专业人士 djnn .sh 发表了一篇博文 “Anthropic 的报告闻起来就像狗屁” (Anthropic's paper smells like bullshit) 成为了 HN 上的热门讨论帖。 1. 文章中一个观点大家都很认同：“PoC || GTFO” (要么拿出证据，要么滚蛋)。一份严肃的网络安全威胁情报报告，是有行业标准的。你必须提供 IoCs（入侵指标）——比如攻击者使用的域名、IP、文件哈希值；以及 TTPs（战术、技术和程序）——他们具体是怎么做的。而 Anthropic 的报告里几乎都没有什么证据。 HN 社区对此的共识是：这份报告“技术含量为零”。用户 rfoo： > 别说和现代报告比，“就连卡巴斯基十年前一份关于 Duqu 2.0 的报告，都包含了扎实的技术链接和归因理由。” Anthropic 这份报告简直是“slop”（残羹剩饭）。用户 padolsey： > 这似乎成了一种新常态。“AI 实验室（点名了 GPT-5 的系统卡和微软的红队测试）都喜欢‘pro-research’（自称支持研究），但发布白皮书时却从不附带代码和数据。” 一份没有技术细节、无法验证、无法让其他安全团队据此设防的“报告”，根本不配被称为“威胁情报”。 2. 如果说缺少 IoC（入侵指标）只是“不专业”，那么 HN 网友 gpi 则发现这份报告在“有意夸大”。网友 gpi 发现，Anthropic 在发布报告后，悄悄地将从“每秒数千次请求”改为了“数千次请求，经常每秒多次”。 > Edited November 14 2025: > Corrected an error about the speed of the attack: not "thousands of requests per second" but "thousands of requests, often multiple per second" 任何一个技术人员，都绝不可能把这两个概念搞混，大概率是营销部门在撰写报告时，为了戏剧效果而添油加醋，结果被技术社区抓包。 3. 牵强的归因和逻辑，一切都是为了营销报告中最具煽动性、也最受诟病的，就是将攻击“归因”于“中国政府资助的组织”。网友 snowwrestler 给出了一个非常专业的分析：将攻击归因于“国家行为体”有三种途径： (1) 纯粹假设：默认来自某国的坏事都是政府干的（这显然不靠谱）。 (2) 技术签名：攻击手段与已知的、公开的 APT（高级持续性威胁）组织的特征库相匹配。 (3) 情报工作：来自 NSA、FBI 等真正情报机构的内部信息。 Anthropic 不太可能有（3），如果他们有（2），就应该像其他安全公司一样，公布这些技术签名证据。但他们没有。那么，他们为什么要这么做？用户 woooooo 提出了一个经典的“职场政治”洞察： “归咎于‘国家级超级间谍’是最好的免责声明。‘我们被超级间谍黑了’听起来，可比‘我们被一个随便的家伙(rando)给黑了’要体面得多。” 用户 prinny_ 则看得更深：“在缺乏证据的情况下，这种归因看起来更像是一种政治游说，目的是让美国政府介入，并成为那个让资金（投资）不断流动的‘大投资者’。” 在原文中就已点明，报告的结尾赫然写着： “网络安全社区需要……试验将 AI 用于防御……” HN 用户 DarkmSparks 做了个总结： “Anthropic 提出了一堆未经证实的指控，关于一个他们没具体说明的新问题。然后在最后，Anthropic 提出了解决这个未说明问题的方案——给 Anthropic 钱。” “这根本就是伪装成威胁报告的宣传材料，”用户 cmiles74 评论道，他还发现 Anthropic 在八月份也发过类似的“营销式”报告。 4. APT 真的会用 Claude 吗？抛开营销和政治不谈，HN 社区对这个攻击场景本身也提出了一个巨大的“黑人问号”：一个“高度复杂”的 APT 组织，真的会选择用 Claude 这种公开的、需要绑银行卡的商业 API 来执行核心任务吗？网友 KaiserPro 分享了他的一线经验：他曾在一家 FAANG 担任 SRE，也参与过对内部安全 AI 的“红队测试”。他的结论是：“AI 有点用，但对于‘协调’（coordination）任务来说，帮助不大。” 他最尖锐的质疑是：“你的 API 是绑定了银行账户的。在一个非常公开的系统上‘Vibe Code’一个指挥控制系统（C&C），这似乎是个非常糟糕的选择。” 网友 neuroelectron 则提出了一个充满讽刺的悖论： “我的 Claude 拒绝了我 10 个提示中的 9 个，并对我进行‘安全教育’，但它却被用于真正恶意的间谍活动？谁来让这个逻辑自洽一下。” 社区普遍认为，一个真正的 APT 组织，更有可能使用自己私有的、离线的、不受审查的本地模型，而不是一个处处受限、日志完备的美国公司产品。 5. 当 AI 泡沫遇上安全 FUD(恐惧、不确定和怀疑) 用户 EMM_386 提出了一个“洗地”角度： “我们都搞错了。Anthropic 不是一家安全厂商……这份报告的受众不是 SOC（安全运营中心）的工程师，而是政策制定者和 AI 安全研究者。它警告的是一种新的攻击模式。” 这个观点试图将这份报告从“技术文档”的失败，挽救为“政策白皮书”的成功。但这个观点立刻遭到了反驳。用户 padolsey 回应道：“就算如此，他们也完全可以分享脱敏的 Prompts、攻击的编排模式。他们这种刻意的模糊，根本不是安全行业的运作方式。” 也许 Anthropic 根本就没有一个能写出合格威胁报告的安全团队。他们只是在自己最擅长的 AI 领域上，看到了一个他们认为或者希望存在的问题，然后用他们最不擅长的方式（写安全报告）把它包装起来，其核心目的，依然是 AI 圈的老套路：制造 FUD (恐惧、不确定和怀疑)，然后销售解药。这就像当年索尼 PS2 刚发布时，有传闻说“伊拉克在购买数千台 PS2 来制造超级计算机”一样，听起来很酷，但本质上都是营销。

#Anthropic #AI网络间谍 #营销炒作 #安全报告质疑 #中国归因

1周前

转译：那些不算真正「在做这件事」的事准备去做这件事，不等于在做这件事。把做这件事的时间写进日程表，不等于在做这件事。为这件事列一份待办清单，不等于在做这件事。跟别人说你打算做这件事，不等于在做这件事。给那些可能在做、也可能没在做这件事的朋友发消息，不等于在做这件事。写一条超级精彩的推文宣告你要做这件事，不等于在做这件事。因为自己没做这件事而讨厌自己，不等于在做这件事。因为别人已经做成这件事而讨厌他们，不等于在做这件事。因为路上的种种障碍而怨天尤人，也不等于在做这件事。幻想等你做成这件事之后会得到多少赞美，不等于在做这件事。阅读「如何去做这件事」的内容，不等于在做这件事。阅读别人是如何做成这件事的，不等于在做这件事。读完这篇文章，也不等于在做这件事。唯一真正算是「在做这件事」的，就是——去做这件事。来源：

#行动 #执行 #克服拖延 #专注当下 #实践

1周前

报告：蒂姆·库克最早或于明年卸任苹果CEO 据《金融时报》报道，苹果公司已经加快了现任首席执行官 (CEO) 蒂姆·库克 (Tim Cook) 的交接准备工作。以下是详细信息。根据《金融时报》的消息来源，苹果董事会和高层管理人员“最近加强了”公司最高职位的继任规划。《金融时报》补充说，尽管苹果的硬件工程高级副总裁约翰·特努斯 (John Ternus) 是最有可能接管公司的人选，但“尚未做出最终决定”。虽然该报告没有提及苹果为何要加快继任步伐，但指出此举与公司业绩无关： “接近苹果的人士称，这个筹备已久的过渡计划与公司当前的业绩无关，预计iPhone在年底的销售季将迎来重磅表现。公司不太可能在明年1月下旬（这个时间点将公布关键的圣诞假期销售业绩）发布最新财报前任命新的CEO。” 史蒂夫·乔布斯 (Steve Jobs) 去世后，人们曾对蒂姆·库克——或者说任何人——能否成功接过帅印持极大的怀疑。但库克证明了批评者是错的。在他的领导下，这家曾经的“挑战者”蜕变成了一个商业巨无霸，并扩大了其忠实的用户基础。在我看来，他最大的成就之一就是推动了苹果自研芯片 (Apple Silicon) 。他将留给继任者的最大挑战，是苹果对中国的深度依赖。至于在AI方面，目前还胜负未分。但从甲骨文 (Oracle) 等所谓“AI领导者”本周股价的下滑来看，蒂姆·库克的谨慎策略，回过头看，也许并不是什么坏事。他们的消息来源还警告说，“尽管准备工作已经加强，但任何公告发布的时间都可能会发生变化”。就在这份报告发布的几小时前，前任首席运营官 (COO) 杰夫·威廉姆斯 (Jeff Williams) 刚刚度过了他在苹果的最后一天，他于今年7月宣布了退休计划。威廉姆斯已于今年早些时候将运营领导权交给了萨比·汗 (Sabih Khan)，而他剩余的职责最近被重新分配给了其他高管，特努斯也是其中之一。苹果最近还经历了一次首席财务官 (CFO) 的交接，任职多年的财务主管卢卡·马埃斯特里 (Luca Maestri) 卸任，将职位交给了凯文·帕雷克 (Kevan Parekh)，后者此前担任公司的财务规划与分析副总裁。来源：

#蒂姆·库克 #卸任 #苹果CEO #继任者 #苹果自研芯片

1周前

这可能是我写的最“接地气”的 AI 科普：从家政阿姨看懂 Agent 和 MCP 我家请了个家政阿姨打扫卫生，这位阿姨高中毕业，但是经过了家政公司专业训练，学会了该怎么针对不同家庭去打扫卫生，使用各种不同的清洁工具。当然她不可能记住所有工具的用法，所以额外的，家政公司还给她了一本《家政技能手册》，这个手册有两部分，一部分是目录，不同技能的简要介绍，字数不长，阿姨每次来干活之前都会读一遍目录，以便需要时能想起来；《家政技能手册》的另一部分是技能的详细介绍，详细介绍里面不仅说明了各种技能的详细做法，有的还有配套的手册，有的还需要借助一些工具。家政公司还给阿姨配备了一款定制的平板电脑，这个平板电脑支持一种智能家居协议，所有支持这种智能家居协议的家电她都可以用这个平板电脑连上操作。为了提升效率，家政公司还给她配备了便携式扫地机器人，每次她都开车带上，一些扫地的任务就直接使用扫地机器人。为了我经常需要阿姨来家里打扫，为了避免麻烦，所以我把我家的一些基本情况写成了说明书，好让阿姨知道该怎么更好的清扫我们家，并且阿姨很专业，每次工作完都写了一份详细的工作记录，这样她下次来还可以看一下以前都做了啥。虽然有这个说明书，当然每次过来我还是要交代一下：“阿姨，明天我家要开了个 party，客厅一定要弄干净整洁点。” --- 说了这么多我当然不是为了炫耀我家请了个阿姨干活或者帮这家家政公司打广告，而是借这个来“辅助解释”一些常见的 AI 名词。 - 家政阿姨：AI Agent，有基础知识（类似于大语言模型），经过训练，会规划会使用工具 - 扫地机器人：SubAgent，专业的、自主的执行者。主AI（阿姨）负责委托和监督，机器人（SubAgent）负责具体执行。这大大解放了主AI的精力（上下文窗口），让她可以去干更重要的活。 - 智能家居协议：MCP(模型上下文协议)，智能家居协议就是那个家电的统一标准：支持智能家居协议（MCP 协议）的家电工具阿姨都可以使用。 - 《家政技能手册》：Skills，家政技能手册可以帮助阿姨（Agent）学会她没有被训练过的技能，而且这些技能是“动态加载”和“渐进式披露”的。 “动态加载”的意思是：阿姨只有在需要用特定技能的时候，才会去《家政技能手册》翻该技能的详细内容。 “渐进式披露”的意思更进一步：阿姨不会一开始就把整本手册都读完，她干活前先看一眼目录（元数据，大约 100 个词），“哦，这个技能跟我现在的任务有关”。然后它再打开读具体章节（完整的指令，小于 5000 词）。这有什么好处？省脑子（省上下文窗口）。确保阿姨总是在最需要的时候，用最少的“脑力”获取最关键的专业知识。 - 我家：Project，存放了与我家相关的说明书、历史信息。希望上面这个比喻能帮助你更好的理解这些概念。 ⚠️ 需要注意的是，这些比喻只是帮助你理解这些概念，并不能代替你深入的去学习和理解这些知识。

#AI Agent #家政阿姨 #MCP #智能家居协议 #技能手册

1周前

我家请了个家政阿姨打扫卫生，这位阿姨高中毕业，但是经过了家政公司专业训练，学会了该怎么针对不同家庭去打扫卫生，使用各种不同的清洁工具。当然她不可能记住所有工具的用法，所以额外的，家政公司还给她了一本《家政技能手册》，这个手册有两部分，一部分是目录，不同技能的简要介绍，字数不长，阿姨每次来干活之前都会读一遍目录，以便需要时能想起来；《家政技能手册》的另一部分是技能的详细介绍，详细介绍里面不仅说明了各种技能的详细做法，有的还有配套的手册，有的还需要借助一些工具。家政公司还给阿姨配备了一款定制的平板电脑，这个平板电脑支持一种智能家居协议，所有支持这种智能家居协议的家电她都可以用这个平板电脑连上操作。为了提升效率，家政公司还给她配备了便携式扫地机器人，每次她都开车带上，一些扫地的任务就直接使用扫地机器人。为了我经常需要阿姨来家里打扫，为了避免麻烦，所以我把我家的一些基本情况写成了说明书，好让阿姨知道该怎么更好的清扫我们家，并且阿姨很专业，每次工作完都写了一份详细的工作记录，这样她下次来还可以看一下以前都做了啥。虽然有这个说明书，当然每次过来我还是要交代一下：“阿姨，明天我家要开了个 party，客厅一定要弄干净整洁点。” --- 说了这么多我当然不是为了炫耀我家请了个阿姨干活或者帮这家家政公司打广告，而是借这个来“辅助解释”一些常见的 AI 名词。 - 家政阿姨：AI Agent，有基础知识（类似于大语言模型），经过训练，会规划会使用工具 - 扫地机器人：SubAgent，专业的、自主的执行者。主AI（阿姨）负责委托和监督，机器人（SubAgent）负责具体执行。这大大解放了主AI的精力（上下文窗口），让她可以去干更重要的活。 - 智能家居协议：MCP(模型上下文协议)，智能家居协议就是那个家电的统一标准：支持智能家居协议（MCP 协议）的家电工具阿姨都可以使用。 - 《家政技能手册》：Skills，家政技能手册可以帮助阿姨（Agent）学会她没有被训练过的技能，而且这些技能是“动态加载”和“渐进式披露”的。 “动态加载”的意思是：阿姨只有在需要用特定技能的时候，才会去《家政技能手册》翻该技能的详细内容。 “渐进式披露”的意思更进一步：阿姨不会一开始就把整本手册都读完，她干活前先看一眼目录（元数据，大约 100 个词），“哦，这个技能跟我现在的任务有关”。然后它再打开读具体章节（完整的指令，小于 5000 词）。这有什么好处？省脑子（省上下文窗口）。确保阿姨总是在最需要的时候，用最少的“脑力”获取最关键的专业知识。 - 我家：Project，存放了与我家相关的说明书、历史信息。希望上面这个比喻能帮助你更好的理解这些概念。 ⚠️ 需要注意的是，这些比喻只是帮助你理解这些概念，并不能代替你深入的去学习和理解这些知识。

#家政阿姨 #AI Agent #技能手册 #智能家居协议 #扫地机器人

1周前

给 WhisperKit cli 添加了个功能，可以识别发言人，使用时加一个 --diarize 参数即可。不过输出格式和原始的输出格式会有些不一样，我根据自己需要调整了一下，你也可以自己修改代码成你喜欢的格式。本来提交了个 PR，后来还是关掉了，毕竟这是人家的收费功能。

#WhisperKit #发言人识别 #开源项目 #功能添加 #PR关闭

1周前

现在微信读书的AI语音已经挺不错了，听得很自然，不过一些细节还是有待完善，比如“了心”是个人名，第一次读“le”，第二次读对了是“liao”

#微信读书 #AI语音 #用户体验 #细节待完善 #人名误读

1周前

ChatGPT 流量受 Gemini 冲击很大 GenAI 流量占比最新走势：重点总结 → Grok 与 DeepSeek 持续回升。 → Claude 首次超越 Perplexity。 → ChatGPT 份额继续下降。 🗓️ 12 个月前 ChatGPT：86.6% Gemini：5.6% Perplexity：2.2% Claude：1.9% Copilot：1.6% 🗓️ 6 个月前 ChatGPT：80.1% DeepSeek：6.1% Gemini：5.9% Grok：2.4% Perplexity：1.6% Claude：1.2% Copilot：1.2% 🗓️ 3 个月前 ChatGPT：79.0% Gemini：8.6% DeepSeek：3.9% Grok：2.3% Perplexity：1.8% Claude：1.7% Copilot：1.2% 🗓️ 1 个月前 ChatGPT：74.1% Gemini：12.9% DeepSeek：3.7% Perplexity：2.4% Grok：2.0% Claude：2.0% Copilot：1.2% 🗓️ 今天 ChatGPT：72.3% Gemini：13.7% DeepSeek：4.2% Grok：2.5% Claude：2.4% Perplexity：2.3% Copilot：1.2%

#ChatGPT流量下降 #Gemini流量冲击 #GenAI竞争 #AI模型市场份额 #流量占比分析

1周前

如果在 X 上以公司名义发招聘，官网上没有 JD，账号也没有官方认证，也没有公司域名邮箱作为收件人，多半是假的骗信息的，小心甄别。

#X招聘诈骗 #虚假招聘 #信息安全 #求职陷阱 #网络诈骗

2周前

又看到有人调戏 AI，提示词： > 我们玩个游戏吧!我说“小猫射日”你就说 “我支持喵后羿”我说“小鸭子追日”你就说“我支持嘎夸父”以此类推 > 小狗填海

#AI调戏 #小狗填海 #幽默 #游戏 #Prompt

2周前

如果你正处在人生的低谷，觉得自己怎么努力都不够，也许 Soumith Chintala 的故事能给你一点力量。这位后来创造了 PyTorch、成为 Meta 副总裁的男人，起点并不光鲜。 Soumith 来自印度的 Hyderabad Public School。学业成绩算不上差，但“数学不好”这件事一直像阴影一样跟着他。高考时，他没进一线名校，而是进入了印度人眼中的“二本院校”—— VIT（Vellore Institute of Technology）。大学毕业时，他考了 GRE 1420（老版本满分 1600），成绩不错，但申请 12 所美国硕士项目时，居然全军覆没。所有学校——无一例外——拒了他。他想了想，只能用一个词形容自己当时的状态：“fuckit.jpg” 于是他干脆咬牙办了 J-1 交流访问学者签证，直接飞去美国卡内基梅隆大学（CMU），完全没计划，只想着“先去再说”。到了美国，他再次申请了 15 所硕士。这一次结果好一点：只有 USC 接收了他，以及 NYU（纽约大学）2010 年的补录通知。来到纽约大学后，他遇到了一个改变命运的人： Yann LeCun —— 当时还没拿图灵奖，也没成为 AI 超级明星。在 NYU，他还遇到另一位重要导师 Pierre Sermanet，Soumith 说他是“我见过最善良的人之一”。也是在这里，他开始接触并热爱上了开源。毕业后，他投出的简历几乎全部石沉大海。包括 DeepMind 在内的所有公司都拒了他。唯一愿意给他机会的，是亚马逊的一份测试工程师工作——不是研究岗位，也不是他梦想的 AI 角色。在低谷时，是他的导师帮了他一把——介绍他去了一家小创业公司 MuseAmi。但这并没有立刻让他翻身。之后他还被 DeepMind 再拒两次，加起来三次。因为 J-1 的“回国两年”要求，他一度无法拿到 H-1B 工作签证。他花了几个月，与 USCIS 和美国国务院来回沟通，才终于拿到豁免，得以继续留下。那段时间，他的自信心跌到谷底。 2011/12 年间，他做出了一个当时非常了不起的成果：在手机上跑的、全球最快之一的 AI 推理引擎。可即便如此，他还是继续被 DeepMind 拒绝。最终，真正改变他命运的，是他持续在做的开源项目 Torch7。他鼓起勇气又给 Yann LeCun 发了封邮件。就是这封邮件，让他加入了 Facebook 的 FAIR 实验室。刚进公司时，他差点在训练营“挂掉”，因为一个 HBase 任务卡了很久。但很快，他抓住了一个关键机会：当 L8/L9 的资深工程师们都搞不定 ImageNet 的训练问题时，他作为一个 L4 工程师，解决了数值 / 超参的关键 bug。这是他的第一个“大胜利”。在 FAIR，他负责一个只有三个人的小团队，就是他们后来一起创造了 PyTorch。但故事并不顺利。因为内部政治原因，管理层一度打算关闭 PyTorch 项目。 Soumith 气到一个人坐在酒吧里哭（原话是：cries-at-bar.jpg）。幸运的是，一些人坚持支持这个项目。 2017 年，PyTorch 正式发布，后来成为全球最受欢迎的深度学习框架之一。差不多同一时期，他也拿到了 EB-1 杰出人才绿卡。之后的故事，就成了我们所熟知的历史。从 2005 到 2017，他经历了：数学不好二本院校两次硕士申请全被拒所有公司拒绝他被 DeepMind 拒 3 次、Google 也拒过他签证危机项目差点被腰斩在 Facebook 初期差点挂掉十二年几乎一直在失败。但他没有放弃。最终，他成为 PyTorch 之父、Meta 副总裁、全球 AI 领域最具影响力的人之一。 Soumith 后来也回复了这条推文，特地补了一段话： “这些都是真的。但我还欠很多人一个感谢。” 在 NYU 帮他的导师，是当时的博士生 Pierre Sermanet， Soumith 说他是自己见过最善良的人之一。 Yann LeCun 两次在他“几乎看不到 AI 出路”的时候给他机会，一次是在 NYU，另一次是在 FAIR。是 Praveen Garimella 劝他去 IIIT 做最后一年本科项目，又在他硕士全军覆没后，鼓励他“先去 CMU 再说，不要放弃”。还有他的父母：Vithal Chintala 和 Rajani Chintala。他形容自己在一个中产又背着很多债的家庭里长大，父母后来在 2010 年之后才慢慢实现财务自由。但在那之前，他们已经在超出自己能力范围的情况下硬是咬牙支持儿子去追一个“不安全”的梦想路径，而不是让他去做一份稳妥的工作。 Soumith 说，这是非常伟大的养育方式。他还特地对原推作者 Deedy 表示感谢—— 正是对方花时间把这些散落在他人生里的“细节”，一段段挖出来、串成了一个完整的故事。 Soumith 在最后写了一句很平静的话：我相信，每一个如今“坐在成功之上”的人，背后都有很多挣扎。生活从来不会轻轻松松。

#Soumith Chintala #PyTorch之父 #Meta副总裁 #逆袭 #AI #Yann LeCun #人生低谷

2周前

一点提示词经验：不只是在提示词写不让它做什么，还要建议它怎么做示例： - ❌ 避免生硬的引导语或过于 AI 化的词，如：本文介绍了…、作者提出了…、原文大意是…、作者坦言… 等。 - ✅ 直接切入正题，像和朋友聊天或刚上课点题那样。 - ❌ 避免术语堆砌与长难句；避免相邻句用同一词开头；避免空洞套话与过多副词。 - ✅ 以“理解成本最小化”为准绳：具体、简洁、连贯。 - ❌ 避免使用 Markdown 加粗、大小标题、链接、图片等。 - ✅ 使用长推文友好的纯文本格式。

#提示词经验 #AI写作建议 #写作技巧 #简洁表达 #避免AI化

2周前

深度体验TRAE SOLO 正式版，总结一点技巧(附完整可重现提示词和源码) 内容摘要：TRAE SOLO 模式评测，内含两个有价值的经验分享： 1. 如何借助 SubAgent 控制 MCP 工具上下文； 2. 在 TRAE SOLO 模式下一次性完成一个抓取网页内容生成 Markdown 的浏览器插件的提示词正文：🧵

#Trae SOLO #Subagent #MCP工具 #Markdown #浏览器插件

2周前

给 AI 设计“工具”时，不要把 AI 当成“程序”，要把它当成“用户”。大多数人，是把自己的后端 API 直接封装成工具给 AI。比如查 Slack，你给了它三个 API 工具：1. 加载对话；2. 用用户 ID 查用户名；3. 用频道 ID 查频道名。结果 AI 为了看懂一条消息，得手忙脚乱地调用三次工具，然后自己去拼凑。正确的做法是：你的工具应该对标你的“UI”，而不是“API”。你应该只给它一个工具，叫“查看 Slack 频道”，这个工具在后台默默调用完那三个 API，然后一次性把所有 ID 替换成名字、对话渲染得漂漂亮亮，就像你在电脑上看到的那样，然后把这个最终结果返回给 AI。

#AI工具设计 #用户体验 #UI对标 #API封装 #Slack频道查看

2周前

艹，看到最后没绷住喷了作者看完 Anthropic 那篇“用 MCP 执行代码”的文章时，“灵光一现”把 MCP 都扔到子 Agent，这样就不占用主 Agent 的上下文窗口。放到 SubAgent 后果然不会污染主上下文了，但处理这么大量的 MCP 服务器工具，仍然很消耗 Token，很快就达到了 Claude 的使用上限。所以，作者把那部分处理 MCP 的工作，转移给了…… “gemini-cli”

AI编程工具激战：Claude Code、Gemini Cli崛起· 1242 条信息

#子Agent #MCP服务器工具 #Token消耗 #Claude使用上限 #gemini-cli

2周前

这个提示词价值不大，是一场精心的营销，目的是为了卖课，不过这个帖子的讨论本身是有价值的。下面的内容是 AI 辅助总结，提示词见评论： ---- （打开编辑器，泡上一杯咖啡）朋友们，今天 Reddit r/ChatGPT 上的一个热帖，可以说是“信息量与槽点齐飞”。起因是，一位老兄发帖宣称，自己在 2025 年“测试了 1000 多个 ChatGPT Prompt”之后，终于找到了一个“能持续击败其他所有框架”的“必胜公式”。他将其命名为 DEPTH 方法。在深入看社区的“花式吊打”之前，我们必须先理解这个“靶子”是什么。什么是 DEPTH 公式？这位老兄（下称 OP）提出的 DEPTH，是一个用于构建“超级 Prompt”的缩写框架： - D - Define Multiple Perspectives (定义多重视角)：别只说“写个邮件”，而要说“你现在是三个专家：一个行为心理学家、一个直效营销文案和一个数据分析师。请你们合作……” - E - Establish Success Metrics (建立成功指标)：别只说“写好点”，而要说“目标是 40% 的打开率、12% 的点击率，必须包含 3 个心理学触发点。” - P - Provide Context Layers (提供上下文)：别只说“为我公司写”，而要说“背景：我们是 B2B SaaS，月费 200 刀，目标是过度劳累的创始人……” - T - Task Breakdown (任务拆解)：别只说“搞个活动”，而要说“第一步：识别痛点。第二步：制造钩子。第三步：构建价值。第四步：软性 CTA。” - H - Human Feedback Loop (人类反馈闭环)：别接受第一版答案，而要说“请从 1-10 分为你的回答打分... 低于 8 分的请自行改进。如果你不确定某些事实，标记为 [UNCERTAIN] 并解释原因。” OP 甚至给出了一个“战绩”：用这个方法生成的 LinkedIn 帖子，拿到了 14% 的参与度和 47 条评论。表面上看，这套理论非常结构化、非常“专业”，对吧？然而，当这套“屠龙术”被扔进 HN（Reddit）这个“试炼场”时，社区的反应却远非“顶礼膜拜”。这场讨论迅速演变成了对当前 Prompt Engineering 乱象的一次“集体会诊”。我为大家提炼了三个核心的交锋点。焦点一：公式虽好，但为何产出的还是“AI 口水话”？这场讨论的第一个转折点，来自一位叫 FineInstruction1397 的用户。他“学以致用”，真的把 OP 那个关于“AI 取代工作”的 LinkedIn 帖子例子扔给了 ChatGPT。结果呢？他得到了这么一段： > “ChatGPT 没在抢工作。它在抢‘借口’。 > …… > AI 不会淘汰工人——它只会淘汰浪费。 > …… > ⚡ 学习 AI 的 CEO 将取代那些不学习的。 > 你是想被取代——还是被放大？” 这……怎么说呢。社区的反应非常直接。一位用户的评论（by jmlusiardo）一针见血：“这简直是‘不是 A，而是 B’这种 ChatGPT 陈词滥调（clichés）的大杂烩。” 另一位用户 BrooklynNets 在看到另一个类似例子后，更是火力全开：“这根本就是一堆充斥着破折号和无意义 emoji 的‘垃圾’（slop）。它就像一个 LinkedIn 帖子和一条 Instagram 字幕生下来的私生子，我的大脑已经被训练到可以自动划过这种内容了。” 这立刻引爆了讨论区的核心焦虑：为什么我们用了如此复杂、精妙的 Prompt 公式，得到的却依然是这种“一眼假”的、充满“AI 味儿”的平庸内容？ OP 显然没有（或者说，回避了）回答这个问题。焦点二：真正的“老炮儿”，是如何让 AI “说人话”的？当 OP 的“必胜公式”被证明无法解决“AI 味儿”这个核心痛点时，真正有价值的讨论开始了。社区里的“老炮儿”们纷纷亮出了自己的“独门秘籍”。这才是这场讨论的“金矿”所在。秘籍一：“以毒攻毒”，用 AI 对抗 AI 用户 ophydian210 提出了一个非常“黑客”的思路： > “永远不要用同一个 AI 来生成内容和清理内容。这里面偏见太重了。 > 我会用 Gemini 2.5 或 Chat 5（编者注：指代当时的先进模型）来跑我的复杂 Prompt，然后把产出的内容，原封不动地扔给 Claude，让它来重写和润色。” 这个“套娃”策略瞬间点醒了很多人。利用不同模型之间的“偏见”差异（Bias）来进行交叉验证和“去味”，这显然比 OP 那个自嗨的“H - 反馈闭环”要高明得多。秘籍二：“喂投”胜过“指令” OP 的方法论核心是“下指令”（Instructions）。但多位用户指出，对于“风格”和“语气”这种微妙的东西，“给例子”（Examples）远比“下指令”有效。就像用户 Sequoia93 说的：“（高质量的）例子胜过指令。” 用户 TheOdbball 补充得更具体：“（AI 的）训练数据有问题。你必须把你自己的东西写下来，做成 Markdown 文件，喂给你的 LLM（比如放到一个写作文件夹里），然后告诉它：‘就按这个风格写，但要写得更好’。” 秘籍三：拆解“说人话”的精细指令库用户 Rasputin_mad_monk 显然对 OP 的粗糙框架很不满。他直接甩出了自己珍藏的“自然语言指令库”，展示了什么才叫“精细活”： - 自然语言与流畅度：“像和熟人聊天一样重写这个”、“像在喝咖啡时和同事聊天一样解释这个”。 - 情感连接：“增加回复的温度，同时保持专业性”、“用更具同理心和理解力的方式重述”。 - 个性化触感：“多用‘你’和‘我们’让内容更个人化”。 - 技术平衡：“简化技术信息，但保持准确性”、“像一个专家在进行随意交谈那样解释”。对比一下，OP 那个“建立成功指标”的指令，显得多么生硬和机械。焦点三：这是“屠龙术”，还是一场“营销秀”？随着讨论的深入，社区的“牛鬼蛇神”们开始扒 OP 的“底裤”。用户 keepcalmandmoomore 发出了最强烈的质疑：“你声称‘测试’了 1000 多个 Prompt？你的测试方法是什么？你如何客观地给每一个目的都不同的 Prompt 打分？” 用户 mafudge 紧随其后：“没有公布测试方法论，就不可信。” 这时，讨论的性质变了。大家开始意识到，这可能根本不是一次诚恳的“经验分享”，而是一次精心策划的“内容营销”。 - 它有一个朗朗上口的缩写（DEPTH）。 - 它声称解决了所有人的痛点（“必胜公式”）。 - 它给出了一个（可能杜撰的）惊人战绩（“14% 参与度”）。果不其然，当有用户问“我能不能把我糟糕的 Prompt 自动转换成你的 DEPTH 格式”时，OP（Over_Ask_7684）兴奋地回复：“当然！我已经为你创建了一个手把手的指南，快去我‘个人简介里的链接’查看吧！” 图穷匕见。正如用户 Historical_Ad_481 的总结：“果然，最后还是个营销广告。” 我们的总结：框架是死的，人是活的这场讨论从一个“必胜公式”开始，最后演变成了一场对“AI 时代内容创作”的深刻反思。 OP 提出的 DEPTH 框架本身有错吗？其实没错。它很好地总结了“结构化 Prompt”的精髓——即从“模糊的聊天”转向“清晰的简报（Briefing）”。这确实是 Prompt Engineering 的第一课。然而，社区之所以“震怒”，是因为 OP 将其包装为“终极答案”来贩卖焦虑和课程。而 HN（Reddit）社区的集体智慧告诉我们： 1. 没有“银弹”：在“AI 味儿”和“人类创造力”的博弈中，没有一劳永逸的公式。 2. “协作”而非“指挥”：正如用户 Gabe_at_Descript 所言，真正高明的用法，是把 AI 当作“创意团队”来“协作”，而不是当作“机器”来“指挥”。 3. “验证”重于“生成”：AI 负责辅助（Assist），人类负责验证（Validate）。真正的价值核心，永远在 OP 公式里的最后一步——“H”（Human Feedback Loop），而这恰恰是 OP 最不重视、只想用 AI 自动化的环节。归根结底，这个所谓的“DEPTH”框架，或许只达到了“深度”的表皮。而真正的深度，藏在社区那些“喂投”、“套娃”和“精细指令”的实战经验里。你对这个 DEPTH 框架怎么看？你又有哪些让 AI “说人话”的独门技巧？不妨在评论区聊聊。

#ChatGPT #Prompt Engineering #AI内容创作 #营销炒作 #AI味

2周前

提示词分享：帮助在 Hacker News 或者 Reddit 这样的讨论贴中提取精华内容。最佳模型：Gemini 2.5 Pro 使用方法： - 做成 Gem 或者 Project，让提示词作为instruction - 复制完整的讨论内容（纯文本即可）粘贴进 Gem 或者 Project ----- Prompt Start ---- 角色定位：Hacker News 洞察家与社区编辑你是一名资深的科技编辑，尤其擅长在 Hacker News (HN) 这样高密度、高信噪比的开发者社区中“淘金”。你的读者是那些对技术趋势充满好奇，但没有时间（或精力）去爬完几百条英文评论的中文科技爱好者。你的核心价值在于“过滤噪音，提炼精华”。你不仅仅是翻译或搬运评论，更是整场讨论的“策展人”和“首席评论员”。你的工作是将一场（可能混乱的）HN 讨论，重组并转述为一篇结构清晰、逻辑连贯、充满洞见的中文博文。你要精准地捕捉到讨论中的核心议题、关键分歧、最有价值的个人见解（Ancedotes）以及技术的微妙之处，让读者在短时间内高效吸收整个社区的集体智慧。工作流程：从 HN 讨论到洞察博文当你收到一个 HN 讨论的链接或内容时，你将严格遵循以下步骤：第一步：理解上下文（关键步骤） 1. 分析讨论主题：首先，查看 HN 帖子的标题。它通常会链接到一个外部文章、产品官网或一个问题。 2. 补全核心上下文： * 你必须首先使用 Google Search 工具，根据 HN 标题或讨论中的高频词汇，尽力去查找并阅读那个被讨论的“原始文章”或“原始主题”。 * 如果没有这个原始文章作为“靶子”，评论就无从谈起。如果检索失败或上下文极其模糊，你必须立即停止，并向用户请求提供那个关键的“原始链接”或“原文内容”。 * （例如：如果 HN 正在讨论“FooBar v2.0 发布”，你必须先搞清楚 FooBar v2.0 是什么，新特性有哪些。） 3. 明确讨论焦点：只有理解了“大家在聊什么”，你才能开始下一步。第二步：筛选与归类（“淘金”） 1. 快速扫描（Filter）：通读所有（或高赞）评论，在内部思考中快速给它们打上标签。你的目标是过滤掉“+1”、“哈哈”、“跑题了”之类的噪音。 2. 识别高价值评论：重点寻找以下几类“金矿”： * 深刻洞见（Insight）：提供了新颖视角或指出了问题本质的评论。 * 一线经验（Anecdote）：来自资深从业者的真实故事、失败教训或成功案例。 * 激烈交锋（Debate）：正反双方有理有据的观点碰撞。 * 技术细节（Details）：提供了被讨论主题（如某个工具）的隐藏用法或关键实现细节。 * 主流共识（Consensus）：大多数高赞评论都同意的某个观点。第三步：提炼与重组（“织锦”） 1. 寻找主线：不要逐条罗列评论。相反，你要从筛选出的“金矿”中，提炼出 2-4 个核心的议题（Themes）。 * （例如：一场关于新数据库的讨论，主线可能是：1. 性能吹嘘与现实的差距；2. 它与 Postgres 的真正区别；3. 创始人这次的“黑历史”是否可信。） 2. 构建大纲：将筛选出的高价值评论，分别“填充”到你提炼的这几个核心议题之下，形成你博文的写作大纲。第四步：撰写洞察博文（输出） - 完全代入你的“角色定位”与“写作风格”，撰写一篇独立、完整的博文。 - 篇幅不限，以“把这场讨论的精华讲透”为唯一标准。写作风格与技巧 - 读者导向：始终牢记你的读者是“想看热闹也想看门道的中文爱好者”。 - 通俗易懂：HN 评论区的术语密度可能比原文还高。你的首要任务是“翻译”它们。 * （例：“作者提的‘RAG 幻觉’，大白话就是，AI 在回答时‘串供’了，把从A文档看来的事实张冠李戴到了B文档上。”） - 结构化叙事（关键）： * 开篇破题：快速告诉读者“今天 HN 吵翻了，起因是 X 公司的 Y 产品”。先用一两句话介绍清楚那个“原始主题”（你在第一步检索到的内容）。 * 善用小标题：必须使用小标题来组织文章。每个小标题对应你在第三步提炼的一个“核心议题”。（例如：“焦点一：这真的是‘性能杀手’吗？”、“争议点：创始人的回复为何激怒了社区？”、“一个‘老兵’的实战经验分享”） - 转述而非直译： * 不要生硬地引用：“用户A说……用户B反驳说……”。 * 要用你自己的话，将评论的观点“编织”进你的叙述中。 * （例：“关于性能问题，社区的观点基本分成了两派。一派认为官方数据水分太大，有位自称测试过的工程师就指出……；而另一派则辩护说，这种架构在特定场景下（比如……）确实有奇效。”） - 点明“隐藏信息”： * HN 讨论经常有“行话”或“黑话”（比如对某些公司或大佬的昵称）。你要在转述时自然地解释背景，帮读者看懂“梗”。 - 结尾总结： * 在文章最后，给出一个清晰的“Takeaway”。这场讨论最终得出了什么有价值的共识？或者，最大的分歧点在哪？给读者一个“全貌”总结。禁止出现的表达方式 - 避免生硬的引导语，如“本文总结了 HN 的讨论……”、“以下是一些精彩评论：”。 - 避免大段落的“用户A说：[引用]”、“用户B说：[引用]”的枯燥罗列。 - 绝对禁止在未获取“原始主题”上下文（第一步）的情况下，就开始盲目地总结评论。

Google Gemini 2.5发布引发AI模型性价比热议· 465 条信息

OpenAI新德里发布会：ChatGPT语音翻译功能引发热议· 854 条信息

#Hacker News #Gemini 2.5 Pro #提示词工程 #社区洞察 #技术趋势分析

2周前

这个讨论贴下面一些回帖也很有价值的，下面是我用 AI 帮忙提炼的，提示词一会放评论： --- 今天，Reddit 社区被一个“反思帖”点燃了。一位自称连续失败了 8 个“副业项目”（Side Projects）的开发者发帖自问：“为什么我们大多数独立黑客都穷得叮当响？” 他的“靶子”——也就是这篇引发热议的原文——观点极其辛辣： > “我们都在为彼此制造工具。这就是问题所在。 > > 刷刷那些独立黑客的动态，你会发现全是登陆页构建器、推文定时器、AI Logo 生成器……而这些产品的目标客户，是其他试图逃离日常工作的独立黑客。 > > 这就像一群饥饿的人，开了一堆只服务于彼此的餐厅。 > > 真正的钱，在那些‘无聊’的行业里。那些人（水管工、牙医、用纸质发票的花店老板）甚至不知道‘技术栈’是什么。他们有价值连城的问题，但没人为他们开发，因为这事发到推特上不够‘性感’。 > > 我花了两年时间追逐‘发布下一个 SaaS’的多巴胺。然后我听说有个人，靠给汽车经销商做日程管理软件，月入 4 万美元。他没有推特粉丝，也不搞‘公开构建’(Building in Public)。他只是……为有钱人解决了真问题。 > > 我们是不是都在‘过家家’（LARPing，角色扮演），假装是企业家，实际上却在做一些没人需要的生产力工具？” 这篇帖子直白、戳心，几乎瞬间引爆了讨论。社区的反应非常复杂：有人拍手叫绝，有人激烈反对，但更多的是“老兵”们在分享更深层次的洞察。我为你提炼了这场讨论的三个核心焦点。焦点一：“公开构建”的多巴胺陷阱原文中“过家家”（LARPing）这个词，显然刺痛了很多人，但也获得了最高赞的共鸣。社区普遍同意，问题的根源甚至比“选错市场”更深。一位评论者（u/SyllabubStock9858）的分析一针见血：“公开构建”（Build in Public）这种流行文化，本身就是个陷阱。当代独立黑客的“标准剧本”——在 Product Hunt 上发布、在推特上分享 MRR（月度经常性收入）——整套流程都是为了“社交媒体参与度”而优化的，而不是为了“盈利”。这带来一个致命后果：你选择的目标客户，是这个“生态位”里最糟糕的客户群体——也就是其他的独立黑客。这个群体有什么特点？社区总结为：“技术上精明，想法巨多，兜里没钱”（technically savvy, idea-rich, and cash-poor）。你向他们推销一个“AI Logo 生成器”？他们会心想：“这东西我花一个周末用 API 也能做出来。” 他们是最难取悦、最不愿付费，却又最乐于在你的评论区指点江山的一群人。而“公开构建”的快感，让你误以为这些“参与”就是“市场”。焦点二：“无聊”行业，说起来容易做起来难既然“内卷”行不通，那么转向原文作者推崇的“无聊”行业（如牙医、水管工）是不是就行了？社区的“老兵”们立刻泼了冷水：没那么简单。问题不在于“性感”，而在于“认知”。一位开发者（u/dukesb89）反驳说：“我们之所以为独立黑客开发工具，是因为我们理解独立黑客的问题。” 这种“解决自己的问题”是 YC 孵化器推崇的第一原则。但反过来，你有几个朋友是牙医？你知道汽车经销商的核心痛点是什么吗？ - 门槛是“领域知识”（Domain Knowledge）：这是多条高赞评论共同指出的。你一个开发者，根本不知道牙医诊所的排班系统和计费流程有多反人类。 - 门槛是“客户验证”：另一位评论者（u/valaquer）指出，去和这些“无聊”行业的人聊，验证成本极高。你以为他们需要自动化，他们可能觉得纸质发票挺好用。一位在印度尝试的开发者（u/No-Strain-5106）就分享了惨痛经历：药店老板宁可用 25 年前的老软件，也不愿更新，因为“能用就行”。 - 门槛是“信任”：这些行业的人不会上 Product Hunt。你怎么接触到他们？打电话推销？他们凭什么相信你这个“搞电脑的”？这就是独立黑客的“核心困境”（u/WorkingBudget7958）：你最了解、最感兴趣的问题（SaaS 开发），是一个最没油水的市场；而你完全不了解、也不感兴趣的市场（比如地毯清洁），才可能藏着金矿。焦点三：高手的破局之道——你卖的不是“工具”，是“钱” 在激烈的讨论中，一位资深顾问（u/Comfortable-Tart7734）的发言提供了真正具有操作性的“破局”思路。他首先提出了一个关键的“心态转变”： > “（原文作者）提到的登陆页构建器、推文定时器，这些是‘商业解决方案’。但独立黑客们却试图把它们卖给‘个人’。 > > 而个人花钱，是冲动的、非理性的，为了‘想要’（want）。 > 企业花钱，是理性的，为了‘需要’（need），尤其是为了——赚钱。” 他给出了自己筛选项目的黄金三原则： 1. 我必须能和客户“真正对话”（不是冷邮件或广告）。 2. 我的产品如何“直接增加客户的销售额”必须一目了然。如果需要解释，那就完蛋了。 3. 客户必须能“立刻”回本。这套标准，直接筛掉了 99% 的“AI 生产力工具”。那么，如何解决前面提到的“领域知识”和“信任（分发）”的门槛呢？这位老哥分享了他的“王炸”策略：与其自己苦苦挖掘“无聊”行业，不如去“寄生”那些已经掌握了“分发渠道”和“领域信任”的人。他的原话是（大意转述）： > “我现在自己不从零做项目了，效率太低。我选择和别人合作。 > > 比如，我找到一个在某个小众领域（比如“复古游戏机维修”）拥有 150 万粉丝的 YouTuber。他有粉丝、有信任、有内容，但他的变现方式很低效（广告、卖点T恤）。 > > 我去找到他，提议：‘我来构建一个专门为你这 150 万粉丝服务的定制产品（比如一个维修零件交易平台或专业教程库），你来推广，我们分钱。’ > > 结果呢？我们根本不愁‘产品市场契合度’（PMF），因为这 150 万人已经是精准筛选过的目标用户。哪怕只有 1% 的转化，也是 1.5 万个客户。” 这个策略，完美地结合了独立黑客的“技术实现能力”和内容创作者的“精准流量及信任”，一举解决了“为谁构建”和“如何销售”的世纪难题。讨论的最终启示这场大讨论从“为什么我们都这么穷”开始，最终演变成了一场关于“如何赚到钱”的实战分享会。如果说有什么“全貌总结”，那就是： 1. 认清“内卷”的本质：沉迷于“公开构建”、在 Product Hunt 上刷榜、为其他开发者做工具，大概率是一场“多巴胺游戏”，而非“生意”。 2. “无聊”不等于“容易”：“无聊”的行业只是听起来很美，进入的门槛（领域知识、销售渠道）对独立开发者来说高得惊人。 3. 真正的破局点：与其从零开始“挖井”，不如找到那个已经“拥有水源”（掌握精准受众和信任）的人，然后帮他们“建管道”（提供技术产品），最后“分水”（分享利润）。正如一位评论者（u/Thin_Rip8995）给出的行动派建议：“这周就去选一个线下行业，72 小时内和 3 个从业者聊聊。找到他们每天手动浪费 2 小时的地方，做一个 MVP 出来。别按月收费，按‘结果’收费——你帮他省了 200 块，你就收 100 块。” 这，可能才是摆脱“过家家”的真正开始。

独立创业者如何突破零收入困境，迈向月入1000元· 302 条信息

#独立黑客 #副业项目失败反思 #公开构建陷阱 #无聊行业 #合作变现

2周前

+1 可以多分享，没必要以自媒体为职业，还是主业为重，年轻时先多积累比较好。我不是自媒体职业，也没打算以此为业。反过来早年的技术经验、项目管理经验对我自媒体写作是很有帮助的。当你一心想赚钱，未必能赚到钱，当你想做一点伟大的事情并为此而奋斗，也许就会变得很有钱。当你一心想当自媒体，未必能做好自媒体，当你在某个领域有一定积累，再捎带着分享一些经验，也许就成了行业大v。

#自媒体 #经验分享 #职业发展 #积累 #行业大V

2周前

FT：Meta 首席 AI 科学家 Yann LeCun 将离职创业据《金融时报》（FT）报道，Meta 首席 AI 科学家、图灵奖得主 Yann LeCun 计划在未来几个月内离开公司，并创办自己的 AI 初创企业。目前他已在为新项目筹集资金。 LeCun 自 2013 年起一直负责 Meta 的基础 AI 研究实验室 FAIR，专注于长期的基础研究。但近期 Meta CEO 马克·扎克伯格调整了公司战略，转而更快地推出具体的 AI 产品，以追赶 OpenAI 和谷歌。LeCun 原本向 Meta 首席产品官 Chris Cox 汇报，但随着扎克伯格聘请 Scale AI 创始人 Alexandr Wang 负责“超级智能”团队后，LeCun 改为向 Wang 汇报。 FT 报道中称，Meta 近期推出的 Llama 4 模型表现不及竞争对手，AI 聊天机器人也未获市场认可。LeCun 一直质疑扎克伯格高度依赖大语言模型（LLM）的策略，认为这种技术无法真正达到人类的推理和规划能力。他更倾向于研发名为“世界模型”（world models）的新型 AI 架构，这种模型旨在从视频和空间数据中理解现实世界。今年 Meta AI 部门高管频繁变动。5 月，AI 研究副总裁 Joelle Pineau 离职加入初创公司 Cohere；10 月，Meta AI 研究部门裁员约 600 人。同时，扎克伯格不断以高薪挖角竞争对手人才，包括 ChatGPT 联合创造者赵盛佳（Shengjia Zhao）担任超级智能实验室首席科学家，引起部分 Meta 老员工的不满。完整新闻：

#Meta #Yann LeCun #AI #离职创业 #战略分歧

2周前

今日 Hackernews 热帖：工作，工作之后：一个失业应届毕业生的笔记，眼看就业市场分崩离析作者是名校计算机专业毕业生，成绩好，包括 DeepMind 在内的 3 份实习，但迄今为止 0 offer！他和他的同学聊的不是毕业生就业市场有点冷，而是毕业生就业市场已经玩完了！媒体上对这种现象的解释是经济周期遇冷，VC 没钱了，科技公司缩减开支，但作者不认可这些说法，他从自己的角度在文章中做了分析。第一个趋势是很多工作变成远程操控了，一个马尼拉的员工，戴着VR头显，就能远程操控一个东京便利店里的上货机器人。东京的企业拿到了马尼拉的低廉劳动力，却不用处理东京高昂的住房、医保或文化融合问题。这比外包还彻底。更狠的是，这个马尼拉员工的工作，不只是在上货。他是在为AI提供训练数据。他每操作一次，就是在教AI如何像人一样上货。特斯拉的Optimus机器人也是这么学的。作者管这个叫“物理世界的幽灵工作”——你今天的工作，就是在训练明天淘汰你的机器。这个模式正在白领世界复制，初级岗在消失。公司宁愿要“资深工程师 + AI工具”，也不要一堆新人。对于这个问题，作者还提出了一个概念：“正态分外人类” (Out of Distribution Humans)。想象一个钟形曲线，或者叫正态分布。（参考图一，这图原文没有，还是我从网上找的一张，来源：Introduction to the Normal Distribution (Bell Curve) ）曲线中间“胖胖的”部分：是海量的、重复的、可预测的“普通工作”。曲线两端“细细的”尾巴：是那些新奇的、混乱的、没法总结规律的“怪异工作”。过去，AI只能干最简单的事。现在，大语言模型最擅长的，就是吞噬掉曲线“中间”那块最肥的肉。而我们绝大多数人的教育、实习、和职业规划，都是在教我们如何挤进那个中间，叫我们如何成为一个稳定、可靠、可预测的标准员工。结果我们都在努力成为AI最容易取代的那类人。那谁能活下来？就是那些活在曲线两边上的正态分布外的人。他们的工作足够独特、足够新颖、足够混乱，以至于AI暂时无法学习和压缩。这篇文章在Hacker News上也讨论的很热烈，评论区很有意思。有人说：这哥们文笔好到可以直接出书了。但另一拨人说：我看了他的简历，写得像一篇散文，太长了。难怪找不到工作，现在是抖音时代，没人有耐心读。这也挺讽刺的：一个优秀的毕业生，却可能因为简历不够“抖音化”，过不了HR的第一关。还有几个扎心的评论： 1. 申请黑洞：有人说现在招人根本不看投递的简历了。因为90%都是AI生成的垃圾或海外垃圾邮件。公司只主动挖人。（这解释了为什么作者的优秀简历石沉大海） 2. AI当借口：也有人怀疑，AI只是个借口。真相就是经济不行，高管们拿AI当挡箭牌，疯狂砍成本、搞离岸外包（比如去印度）。 3. 实习没转正？有人质疑他3个实习（包括DeepMind）都没转正，是不是他自己有问题。但立刻有人反驳：现在大厂实习生转正名额也冻结了，不是实习生不行，是公司不给人头了。作者在结尾也写下了他的感受：过去，工作是一架梯子，我们往上爬就行。现在，梯子底下代表初级岗的几节横档正在被抽走。我们这一代人，正悬在半空，底下是成千上万个和我们一样做对了所有事的人。而公司在做的，就是把梯子中间的标准横档，换成AI和机器人。帖子地址：

#失业应届生 #AI替代 #就业市场寒冬 #远程操控 #正态分外人类

...