凡人小北

统计数据

67

文章

0

粉丝

0

获赞

466

阅读

1天前

半年前我写过一个故事，结论是经验主义在 AI 时代会变成一种思维惯性，模型更新太快了，很多时候经验是锚住你脚的那块石头。当时只是个项目插曲，一个十年经验的算法工程师被敢乱试的实习生打得措手不及。没想到半年后，这位同事最后还是走到了被淘汰这个词上。当其他人借助AI/AI coding产出成倍提升的时候，他还在原地踏步。人挺好技术能力也在，只是时代往前跑，他没跑。最让我记忆深刻的是在数月前几十人的会上，他特别认真地说： “不能让 AI 帮你 coding，把核心能力让出去，你未来怎么竞争？” 我当时公开批评过，但心里也很清楚，你永远也无法叫醒一个装睡的人。真正让竞争力消失的从来不是 AI，你越是不愿接触新的东西，越会被时代的平均速度悄悄甩得更远。 AI 没有偏向谁也没有要害谁，它就是继续往前。能不能跟上，是每个人自己的选择。别抱着旧的护城河不放，一定要时刻保持拥抱变化的肌肉记忆。时代真的变了。

1周前

本来大家都以为 AI 的剧本已经写死了：模型看 OpenAI，芯片看英伟达。结果 Gemini 3 一出，剧情突然就反转了。 Google 除了大秀模型，还把真正的杀招摊开摆在桌上，TPU 不止在云里跑，现在要进 Meta 的机房。市场瞬间整明白了：Google 想建立的一条完整的谷歌链开始成型了。听懂的也包括Nvidia，谷歌刚给 Anthropic 扔了 100 万片 TPU，黄仁勋立刻回手几十亿投资，把对方再锁回 GPU 阵营。动作跟被谁刺了一刀一样麻利。划重点，这是第一次有人证明除了 GPU，TPU 也能撑起最强模型。而且还便宜省电。以后英伟达的日子就不会再像去年那么舒服了。故事还没完，但很明显： Google 掺合进来后已经开始改写 AI 的供应链叙事，英伟达也得开始算一笔从没算过的账。看好 Google。

Google Gemini 2.5发布引发AI模型性价比热议· 475 条信息

OpenAI新德里发布会：ChatGPT语音翻译功能引发热议· 869 条信息

#Gemini 3 #Google TPU #英伟达GPU竞争 #AI供应链重塑 #谷歌生态

1周前

nano banana pro 还有提升空间。墙上画报里的汉字有点问题。

#Nano Banana Pro #提升空间 #汉字问题 #墙上画报

1周前

真正打动面试官的，从来不是完美到无可挑剔的回答，而是：候选人身上展现出来的稳定、诚实以及可托付的气质。

#面试 #稳定 #诚实 #可托付 #气质

1周前

我前阵子远程面试一个候选人，已经是第三面了。技术能力基本没什么问题，前两轮同事都给了正反馈，我这里更多是确认一些细节和判断稳定性。技术能力基本没什么太大问题了。线上面试，用腾讯会议。这小伙子回答得特别利索，就是那种确实有实力，但好像又完美得有点不自然的感觉。不过整体我还是满意的。然后他非要演示他的 Agent 作品。我都已经准备让他通过了，就说行，你演示一下。结果他一打开共享屏幕，可能紧张选错了应用，直接自爆。满屏密密麻麻的面经。说实话，我并不觉得他没能力。他八成是真的会，就是不够自信，想把这轮稳稳过。如果我是他，我可能也紧张。但现实是很多公司非常在意这种事。能力是可以补的，但诚信掉下去，就补不回来了。可惜了，如果他不这样搞，他其实已经很稳了。

#面试 #候选人 #技术能力 #诚信 #自爆

1周前

听到一个字节面试官远程面试候选人，如何抓对方用 ai 作弊的方法，朴素到离谱。面试官突然说：你闭上眼睛回答这道题。

#字节跳动 #面试 #AI作弊 #远程面试 #离谱

2周前

看推友今天刷了半墙 Gemini 3 的前端测试，说一句不好听的： Gemini 3 不是在帮前端写代码，它是在替前端写代码。注意帮和替的一字之差，前者是放大器，后者是吞掉。当然前端不会消失，但基本可预见只会写前端的人会被机器秒成一地灰。我过去的观点是： AICoding 一定是模型最先爆发的赛道，而前端是最先被爆的赛段。现在我还是这个观点。

#Gemini 3 #前端开发 #AI Coding #自动化 #行业变革

2周前

Andrej Karpathy 这个阅读方法有点意思… 大概就是：先自己把文章/章节从头到尾过一遍，把大轮廓先搭起来；第二遍丢给 LLM 解释 + 总结，看看它怎么梳理；第三步直接开 Q&A，把想深挖的地方一个个怼出来问。很有意思，阅读这件事从一个人对着文本死磕变成一个人和一个 AI 一起拆书。这种方法能很好的解决之前那种看完了但有没什么留下来的浅刷。有人也是这种阅读习惯吗？

#LLM #阅读方法 #AI辅助 #知识获取 #拆书

2周前

Google 在 Gemini 生态里直接宣判了 RAG 的死刑。这个 File Search 一句话就能概括： Google 把 RAG 从工程领域直接删掉了。以前做 RAG 是一整条流水线：切 chunk → embedding → 向量库 → 检索策略 → 引用链路 → 缓存优化 → prompt 拼装。现在 Gemini 的 File Search 非常简单，把PDF/JSON/代码/Markdown 扔进一个 store，然后问问题。剩下全部交给模型。不需要理解 RAG，也不需要设计 RAG，甚至不需要知道 RAG 曾经长什么样。就这么简单，整个 RAG 技术链路的所有复杂度不可逆地被压到平台底层。 AI 应用的门槛又被 Google 掐了一次脖子。我也没想到有一天模型厂商竟然用这种方式吞掉了技术。

谷歌Deep Research：AI操作系统雏形？· 145 条信息

#Google #Gemini #RAG #File Search #AI应用

2周前

还记得去年 Devin 搞了一个 deepwiki 吗？ Google 现在也悄悄上了一个同类，Gemini 加持的CodeWiki：用法超级简单：把 GitHub 的项目仓库地址，直接贴到 CodeWiki 的 URL 后就行。比如 LangChain 的 repo：那么它对应的 CodeWiki 页面就是：私有仓库马也上会支持，据说 Google 在开发 Gemini CLI 扩展，企业内部 repo 也能用。所有做工程的人都知道一句残酷真相：写代码从来不是效率瓶颈，理解代码才是。尤其是大型仓库，文档永远跟不上代码，逻辑全靠口口相传。如果代码-文档-知识这条链路能打通，工程效率这块真的要再往前跳一级了。

谷歌Deep Research：AI操作系统雏形？· 145 条信息

#CodeWiki #Google #Gemini #代码理解 #工程效率

3周前

AI 真正落地最快的，其实是那种只需要工程师、不需要任何其他部门配合的场景。一旦项目需要经过多部门共识，开十个项目群，甚至要同步半个公司的业务，节奏立刻慢十倍。这种牵扯 KPI、人情、责任边界等一系列问题的场景，AI 能直接从工具变成政治。现实就是这样：能让工程师直接落地的事，一周就能上线；要开完三个会才能定方向的事，一年过去了都还在讨论可行性。

#AI落地 #工程师主导 #跨部门协作障碍 #效率低下 #政治化

3周前

好家伙，这两天 X 上全是 Google，这次是直接把 Gemini 塞进 Maps 了，这是我最近看到最有生活实用性的 AI 原生落地了。看了太多的你说我答型的演示型智能，这种能做导航多轮规划的能力让人眼前一亮。比如找一家两英里内好停车的素食玉米饼餐厅这种，一句话就能搞定路线+店铺+车位+到达时间，这才是真正听得懂人话的导航助手。这就是我一直在说的： Google 的强，不只是模型，还有生态和深度。期待 Gemini 再更新几版，一年后可能会炸得比现在想象的更大。

Google Gemini 2.5发布引发AI模型性价比热议· 475 条信息

OpenAI新德里发布会：ChatGPT语音翻译功能引发热议· 869 条信息

#Gemini #Google Maps #AI导航 #实用性 #生态

3周前

你以为 Gemini 3 还没发是因为没准备好？不是的兄弟，2.5 Pro 还够用，甚至在知识，规划和头脑风暴上，都能硬刚所有顶级模型。所以根本不着急，现在全域工具链串成一套闭环这件事儿，可以理解成是再做生态总动员。别忘了 Gemini 3 只是没发而已。等 Gemini 3 发出来的时候，可能是 Google AI 的系统性爆发。所以说，该加仓的，别等新闻稿出来才上车。

Google Gemini 2.5发布引发AI模型性价比热议· 475 条信息

OpenAI新德里发布会：ChatGPT语音翻译功能引发热议· 869 条信息

#Gemini 3 #Google AI #生态系统 #知识规划 #系统性爆发

3周前

Google 最近整合明显在加速，想多了能让头皮发麻那种。产品+AI 我认为做到了生态一体和智能自洽。来看两个关键点： 1. 生态的统一智能层全线产品智能化，特别是给 Gemini 开了权限，就能一口气调用 Gmail、Drive、Chat 的内容，不用上传也不用提醒，它直接就知道我想找啥。这是 Workspace 的智能操作系统。 2. 知耻而后勇式进化 Gemini 一开始大家都在骂，但这一波是真转身了。直接融入 Workspace，成为工作记忆体 + 自动助理。关键点在于它聪明，并且它知道得也太多了。这就是 Google 的可怕之处：首先模型强，然后数据闭环 + 应用集成 + 权限整合全部打通。当别人搞 AI + 工具的时候； Google 说：我不跟你们玩，我搞的是 AI = 工具。幸好这些年我一直没放弃 Google，这也算是某种意义上的坚守回报了。既然 AI 是能力放大器，我也想看看 Gemini + 我在Google 生态里的内容，Gemini能给我放大多少倍。

Google Gemini 2.5发布引发AI模型性价比热议· 475 条信息

OpenAI新德里发布会：ChatGPT语音翻译功能引发热议· 869 条信息

#Google #Gemini #AI生态 #workspace #智能化

1个月前

看到 OpenEvidence 又拿融资，不得提一下这家公司。就在一周前，OpenEvidence 宣布又完成了一轮 2 亿美金的 C 轮融资，由 Google GV 领投，红杉、黑石、凯鹏华盈、Thrive 等一众顶级机构加持，投后估值飙到 60 亿美金。注意，是三个月内连下两轮：7 月刚融完 2.1 亿，10 月又拿 2 亿。而且是产品实打实增长后的结果，跟PPT融资完全不是一回事儿。如果你看过很多次红杉的闭门会，肯定听过这家公司的名字。这家公司没有去卷模型参数、也没搞花哨 demo，就做了一件事，老老实实盯住医生最难的那几个问题，结果反倒跑出了很扎实的落地路径。可能很多人还没太关注这家公司，那我快速讲一下： OpenEvidence 是专门做医生用的医疗版 ChatGPT，定位非常清晰：搜索 + 分析 + 自动写研究报告，所有能力都基于真实医学文献和临床指南构建。分享几组数据： 1. 美国已有 40% 医生在用，每月新增注册医生 7.5 万人 2. 月度咨询量从 7 月的 35.8 万暴涨到现在的 1650 万次 3. 自研模型是历史上第一个在美国医师执照考试中拿满分的 AI 4. 推出新产品 DeepConsult，能生成博士级别的医学研究文献 5. 商业模式是谷歌是赞助答案，直接给药企做精准广告，预计明年 ARR 将突破 1 亿美元说说他的技术，数据价值占了很大的比重，跟 NEJM、JAMA 系列等 11 本顶刊合作，喂了 3500 万份同行评审过的文献，把 AI 的幻觉率降到行业最低，所以医生才敢用也才愿意用。以下是我想说的：如果认真观察，会发现真正有价值的 AI 应用，往往不是最热闹的那批。比如OpenEvidence 的崛起就提醒我们一个简单却经常被忽略的事实：在一个足够需要专业积累的行业里，数据密度+场景深度+专业严肃性，这三者就是护城河。并且那些最早下场，懂需求，并且还不怕脏活累活的人，会悄悄赢下整盘。这种垂类的 AI 产品 PPT 可以很酷炫，但骗不了任何一个需要每天稳定输出结果的用户。特别是医疗行业，这个行业不是能靠 prompt 拼出来的行业，不是说今天堆几个插件，明天跑个多模态就能打穿的。这个行业不需要演示好看，真正能用才会留下来用户，医生是会用脚投票的。能走到这一步的公司，从一开始就选了那条最难但最有价值的路径，熬过了看不到成果的阶段，最终成功了。

#OpenEvidence #医疗AI #医生 #融资 #数据驱动

1个月前

分享下我的方法： 1. 🪜开了个paypal美区账户，绑定了国内信用卡，然后美区apple账号支付方式选择paypal，已经稳定用了几年了。 2. Android 手机上美区Google Pay，也是绑定国内信用卡。这两种方式充值ChatGPT和Claude都很丝滑。

#PayPal美区账户 #国内信用卡 #ChatGPT充值 #Claude充值 #支付方式

1个月前

申请资质要做个网站，技术说排期得一周，评估一堆要配设计，要走流程。结果产品没多说什么，自己打开 AIcoding，工位上吃午饭的功夫，拿着原型直接干出来让运维上线了，半小时不到。这种事儿每次都能震我一下，很感慨。不是要说谁效率高谁效率低，你明显能感觉到，当 AIcoding 这种东西真的落到每个人手里，原来泾渭分明的角色边界，正在迅速变得模糊。以前你是产品，你就负责提需求，写文档画原型，协调人；技术是实现的人，你说他做，中间再磨一磨，再对齐，再拉通那个什么颗粒度。但现在，很多事根本不用协调，自己就能干。也不是说产品都要变成工程师，但你只要稍微会点操作、知道 prompt 怎么写、页面结构心里有数，其实你完全可以直接出手，甚至很多时候速度比对接要快太多。那这种没有很复杂业务逻辑的工作未来技术的位置在哪里？ AIcoding 时代需要的是谁拥有把想法落地的能力。这个变化，很大。

#aicoding #产品经理 #工程师 #效率提升 #角色边界模糊

1个月前

复活了，微信账号终于解封！🥲 这一周被封的原因我到现在都还不知道，没有预警、没有提示、没有申诉通道，啥也没说，突然就被限制发言。但最绝的是封号手段，只能看不能说，别人发来的消息我都能看，就是回不了，回一条提示我功能受限。这个设计真的牛逼，社交孤岛 → 强制沉默 → 所有关系链还在，就是你不能出声。彻底体验什么叫“还在场，但已经消失”。这比直接封号狠多了。真的是越想越恐怖：我们所有的社交、工作、支付、登录系统，已经深度依赖这些超级平台，但你对它们的规则毫无知情权，甚至连“你错在哪”都不知道。不透明、不对等、不告知、无申诉。想象一下你哪天醒来发现支付宝不能付款、微博不能发言、微信不能说话，系统只告诉你：你已被限制使用。为期 7 天，原因保密。你能怎么办？等。你除了等，啥也做不了。这还不是 AI 或数字社会的未来，这是现在。

#微信封号 #社交平台依赖 #用户权利 #不透明规则 #数字社会

1个月前

如果你老板是那种节奏感特别强、细节管控欲很高的事无巨细型，你该怎么适配？尤其你本身是一个团队的负责人，希望自己的保持自驱和探索的团队，怎么在不对撞的前提下，撑住上面又托住下面？我领导风格就挺明显的：节奏感极强、什么都想提前知道一点、细节关注度也很高。说实话，刚开始我情绪很大，但后来也想通了，就是慢慢做事的过程中，调整自己调整节奏，不能硬碰。然后做了一些事情，让我们这几支团队还能保留一点自己动的劲儿。比如我这边会提前把关键节奏先定下来，有哪些地方可能是风险点、预计哪个决策节点会卡，我会主动提出来，提前同步。老板既然在意节奏感，那我先打个底，让他知道我这边没掉链子，就不用事事插手，我这边空间反而更大了。再比如，我不把上面的节奏 1:1 拿来压团队。我会自己先缓一层，再换个说法传下去，比如说“我们这块再快一点，方便我们下周给出一个完整 demo”，而不是“老板说这个这周必须搞定”。这种语气差别，其实挺关键的。一个是一起推进，一个是被人推着走，长久下来，团队的状态很明显完全不一样。还有就是，我会留点缝隙让团队的人抬头看看。不一定非得搞创新项目，有时候就是开个小会、讨论个备选方案、尝试一个新方法。你不留这点空间，团队很快就只会执行了，想象力和判断力都会变钝。其实就是得让这个团队有点自己的动能，不然老板节奏一紧，整个系统容易变成被管理和等指令的那种僵化状态，哪怕人再聪明，也会慢慢变钝。我挺在意这一点的。一个管理者是不是一个好管理者，是要想办法带出一支能自我决策、自我拍板的队伍，那种“手一松，整个团队就塌了”的状态，我自己都不想进。老板是啥风格我控制不了，但我怎么传导、我团队怎么运转，我是能决定的。当然话说回来，也不能光想着“我扛着就行了”。有些时候你还是得管理一下老板，创造一种让他不需要事无巨细的局面。我会刻意把核心决策点和节奏断层提前抛出来，让他知道我在掌控，他就不太会越界干预。如果他真有越级管人的时候，也会找机会聊聊，让他知道我这边已经推进得差不多了，节奏没问题，不用插手太多。另外不需要教他怎么当老板，只需要让他知道，有些事你比他更早看见、更快落地，他自然会往后退一步。上面和下面之间就好像三明治的中间，既要撑住上面，又得托住下面，其实中间靠的不是忍耐力，一个好的管理者要有能力建一套自己的节奏逻辑，把两头都黏住。然后就会慢慢看出差别了。一个自驱、主动探索的团队，和一个只是为了迎合老板而做出探索样子的团队，状态完全不一样。能不能真正跑起来，组织气候里的人自己最清楚。时间久了就发现两种团队做出来的东西，最后是会分叉的： - 一个做出来的事是能继续演化、能经得起时间考验的，过了那个节点它还在持续生长； - 另一个则可能就是为了某次高光临时拼出的demo，亮相那一刻是巅峰，之后就没了后续。组织记忆是有惯性的，时间会帮你判断什么是真能力，什么只是对得上节奏的热闹感。就这样，没太多大道理，就是一路摸索调整，慢慢磨出来的。

#向上管理 #团队自驱力 #管理者角色 #节奏把控 #避免微观管理

1个月前

ChatGPT 的记忆系统更新了，一个不起眼但可能非常关键的底层变化：自动管理记忆，不再 memory full，也不再全靠你手动删改。一觉醒来 AI 在自我意识觉醒的路上的又迈出了一小步。 OpenAI 官方是这么说的： 1. 不会再提示“记忆已满”，系统会自动合并 / 替换不再重要的信息 2. 支持搜索、排序、设定记忆优先级（by 你自己） 3. Plus 和 Pro 用户今天起全球上线（仅限 Web 端）没想到今年 memory 发展这么快，控制权开始往模型转移了。 ChatGPT 自动判断哪些对用户重要，并且只保留它觉得重要的，还能定期合并、更新、删除不再需要的内容，最主要的是这些判断都是来自系统本身的策略模型，而不是用户。脑补一个对话： “我们上次聊的那个方向呢？” “我已经归档了，觉得它没那么有用。” 这还是个工具吗？🤔 听起来是不是有点像人？跟前两天那篇推文说的一样，记忆系统这事儿，光是能存起来远远不够，OpenAI 的记忆架构应该是有一些突破了。当然了，现在它还不算真正自主记忆管理，但这个功能很明显的趋势，未来的 AI，不一定记得你告诉它的，但会自主判断它认为你重要的。有点意思但又细思极恐！

OpenAI新德里发布会：ChatGPT语音翻译功能引发热议· 869 条信息

#ChatGPT记忆系统 #AI自主学习 #OpenAI #记忆管理 #细思极恐

1个月前

突然 FDE（Foward Deployed Engineer 前沿部署工程师）这个词火得有点莫名其妙，很多创业者一夜之间开始膜拜 Palantir 式打法，搞得好像硅谷又发现了什么新大陆。先说我的看法：国外现在兴奋讨论的这套东西，中国人早就在用了。不夸张地说，FDE 这个概念在国内 toB 创业环境里，根本不是什么未来范式，它是过去 10 年我们活下去的方式。硅谷的 FDE 模式今天之所以被捧上神坛，是因为 AI agent 产品天然不能标准化、不能纯靠 SaaS 拉起规模，只能靠“深扎现场 + 产品抽象 + 高难度交付”（这几个词眼熟吗）这种非线性方式打通从 0 到 1 的路径。这种新范式我们不叫 FDE，我们叫它：售前 + 客户经理 + 实施 + 技术支持 + 专人陪跑 + 项目现场 + 临时产品经理是不是听上去不那么高级，也没人总结成Echo + Delta 团队这样的理论模型可中国 to B 创业者、尤其是医疗、制造、政企、教育领域的创业者，从来没有什么 SaaS 福报。我们走进客户现场，用工程师替客户解决一线需求，项目经理拆用例，售前写方案，然后陪标、上系统。这些人一开始就被扔进落地即交付，交付即定制的泥沼里，硬生生走出了一套非标准化探索到产品复用化的路径。所有这些国外今天才开始鼓吹用 demo 去找 PMF，我们已经 demo 到脱发了。欧美 SaaS 怕是忘了东方还有个神奇的国度。为什么现在大家把 FDE 当作一种新的 go-to-market 策略来膜拜。可能是因为他们原来做的是标准化 SaaS，突然卷进 AI agent 的复杂场景，一下子手脚不够用了，才发现：哦原来世界上还有一种方式，叫“没有产品也要先干起来”？

#FDE #toB创业 #中国经验 #AI Agent #非标准化

1个月前

《为什么 95% 的 AI Agent 做不起来？》非常推荐，踩的坑和解决方案跟我们几乎一模一样，虽然讲得很清楚，架构师视角，值得花 10 分钟读完，应用到工程实践中。几个点： 1. 现在大家都还在拼 prompt，只有少数人开始拼上下文结构。特别对的一点是：prompt engineering 已经不是核心了，context engineering 才是下一阶段的主战场。给再聪明的大模型喂进去一堆乱七八糟的输入，它还是只会胡说八道。市面上跑得稳的 Agent，都是在“什么该让模型看、怎么看、以什么形式看”上下了大功夫的，这一点现在应该是共识了。 2. 记忆系统这事，光是能存起来远远不够很多公司的 memory，说得好听点是长期记忆，难听点就是个聊天记录仓库。真正落地的系统要分层记忆（用户级 / 团队级 / 系统级）。文章读完我感觉更多的篇 B 端，C 端要思考的是结合业务来做分层记忆，并且要能让人知道它记住了什么，并且用户能自己改。否则就不是记忆是监控。 3. 不迷信单模型，这年头还不做 routing 的 agent 就别说自己做 infra 了。这篇文章提到多模型路由，说得很对。不可能所有请求都丢给 GPT5，成本和时延直接炸掉，表现也未必好。真正合理的系统，一定是：快速反应的轻模型做分类和前处理、重模型做主任务、补一个模型做验证或追问。一个 agent 后面绑定的一定是一个 LLM 团队。 4. 可追溯/可控/可信，是企业愿意用 Agent 的底线很多人只想着怎么让 agent 能回答，但企业更关心：这句话是从哪里来的？有没有越权？出了错我怎么追责？ AI 要可治理。 5. 最被低估的一点：Agent ≠ Chatbot 这篇文章最后说到的一点我非常赞同但还不够狠：如果还在用聊天当所有用户交互的方式，那agent 最多是个语音助理。真的 agent 应该是：先用语言调度任务，然后在页面上看到结构化结果，还能继续点选、调整、组合下一步。这部分很多公司现在在尝试了，交互上比之前全部自然语言高效了太多。一个特别有意思的点，当主持人问观众“你们中有多少人构建了文本到 SQL 并投入生产？”时，没有一个人举手。

#AI Agent #Context Engineering #多模型路由 #可追溯性 #人机交互

1个月前

最近在看一圈 ToB agent 的落地情况，有个判断越来越清晰：至少还得 1 年，国内 ToB agent 才可能真正起来。第一，国内的模型能力，还不够。 ToB 业务链条长、场景复杂、对结果的容错率极低。现在的大模型，哪怕再微调十遍，稳定性不够，自洽性不够，还不够听话这些问题依然严重。 prompt 写得挺对，它干的事还是不怎么靠谱。像个刚转岗的实习生，流程懂了点，但是做起来全是 bug。第二，做技术和懂业务的，不是一拨人。 ToB agent 最大的挑战是知识怎么迁移。比如想让 agent 搞懂保险理赔、医疗问诊、法律审查……这些不是写 prompt 能解决的，它们背后是几十年经验、人情流程和模糊判断。越值钱的知识，掌握它的人越年长，越难被结构化表达，更别说这批人愿不愿意倾囊相授。技术今天搞出来一个 agent，业务方只会说三句话：你这不准啊、我们流程不是这样的、你这漏了关键条件，但这个流程是之前开发跟业务一起梳理出来的。这背后藏了抵触，技术和业务之间，隔着的不是 AI，是一整座山。那为什么 AI coding 能先跑出来？因为这事里最懂业务的就是技术自己。谁最懂代码结构？技术！谁能写 agent 调 agent？技术！谁能 debug agent？还是技术！技术是唯一一拨能自己用，自己调 bug的群体。业务等于本体，没有认知 gap，也不需要跨专业翻译，一整个闭环自然就跑通了。本质区别在这：AI coding 是单边迁移服务自己， ToB agent 是双边博弈，需要认知共建。一个能快，一个必须慢。对于 AI coding，只要模型理解开发者就够了。ToB agent，不仅模型要懂业务，开发者还得懂业务，然后两边还得对得上话。这，太难了。真正的转折点要出现：必须满足模型能稳定编码行业知识，Agent 能封装复杂动作并处理结果反馈（前提是老顽固们愿意掏心窝），企业能放心把核心流程交出去。到那一天，ToB 才真正算是 ready 了。那时候再回头看 coding agent 的进化速度，也许已经不是一个量级的对比了。技术在革自己命这件事上，从来没有输过任何群体。

#ToB agent #大模型能力 #技术与业务认知差异 #AI Coding #行业知识迁移

1个月前

OpenAI 又把AMD 拉了进来，再加上Oracle、博通这些公司，基本已经形成了一个小圈子。大家一起玩，股价/估值互相复利向上，市值层层往上叠。一座巨大的围城已然形成。外面的公司看热闹，里面的人越抱越紧，创新的空间能被他们的效率吃得干干净净。这是史上效率最高的资本共生体了吧。

#OpenAI #AMD #资本共生 #科技围城 #高估值

2个月前

这个九月 AI 工具真的卷出新维度了。Flowith 把自己的画布升级成 Context Playground（AI 创想画板）。用 AI 最烦的就是它总是自己嗨，幻觉一堆，明明只是想改一点点内容，就跑偏了八百里，最后却不得不一遍一遍地试探 prompt…… 现在，Flowith 直接让我一刀剪掉跑偏的部分，AI 幻觉真的被解决掉了。它把整个创作流程换了种思路，用户第一次真正能在一张画布里自由的创作。整张画布顺畅的就像是一个“灵感搭建场”，AI 不再主导，而是变成真正的工具层助手，我更愿意称现在的这个形态为“无边记”。

AI视频井喷：Midjourney领跑，多模态混战· 337 条信息

#AI工具 #flowith #Context Playground #AI创想画板 #无边记