时政
财经
科技
虚拟货币
其他
登录
凡人小北
关注
统计数据
67
文章
0
粉丝
0
获赞
466
阅读
热门文章
1
TechFlow 深潮 发布的文章:近期教育领域的变化引发了广泛讨论,我认为教育改革应该更加注重学生的个性化发展和创新能...
145
32
凡人小北
1天前
半年前我写过一个故事,结论是经验主义在 AI 时代会变成一种思维惯性,模型更新太快了,很多时候经验是锚住你脚的那块石头。 当时只是个项目插曲,一个十年经验的算法工程师被敢乱试的实习生打得措手不及。 没想到半年后,这位同事最后还是走到了被淘汰这个词上。 当其他人借助AI/AI coding产出成倍提升的时候,他还在原地踏步。人挺好技术能力也在,只是时代往前跑,他没跑。 最让我记忆深刻的是在数月前几十人的会上,他特别认真地说: “不能让 AI 帮你 coding,把核心能力让出去,你未来怎么竞争?” 我当时公开批评过,但心里也很清楚,你永远也无法叫醒一个装睡的人。 真正让竞争力消失的从来不是 AI,你越是不愿接触新的东西,越会被时代的平均速度悄悄甩得更远。 AI 没有偏向谁也没有要害谁,它就是继续往前。能不能跟上,是每个人自己的选择。 别抱着旧的护城河不放,一定要时刻保持拥抱变化的肌肉记忆。 时代真的变了。
分享
评论 0
0
凡人小北
1周前
本来大家都以为 AI 的剧本已经写死了: 模型看 OpenAI,芯片看英伟达。 结果 Gemini 3 一出,剧情突然就反转了。 Google 除了大秀模型,还把真正的杀招摊开摆在桌上,TPU 不止在云里跑,现在要进 Meta 的机房。 市场瞬间整明白了:Google 想建立的一条完整的谷歌链开始成型了。 听懂的也包括Nvidia, 谷歌刚给 Anthropic 扔了 100 万片 TPU, 黄仁勋立刻回手几十亿投资,把对方再锁回 GPU 阵营。 动作跟被谁刺了一刀一样麻利。 划重点, 这是第一次有人证明除了 GPU,TPU 也能撑起最强模型。 而且还便宜省电。 以后英伟达的日子就不会再像去年那么舒服了。 故事还没完,但很明显: Google 掺合进来后 已经开始改写 AI 的供应链叙事, 英伟达也得开始算一笔从没算过的账。 看好 Google。
Google Gemini 2.5发布引发AI模型性价比热议· 475 条信息
OpenAI新德里发布会:ChatGPT语音翻译功能引发热议· 869 条信息
#Gemini 3
#Google TPU
#英伟达GPU竞争
#AI供应链重塑
#谷歌生态
分享
评论 0
0
凡人小北
1周前
nano banana pro 还有提升空间。 墙上画报里的汉字有点问题。
#Nano Banana Pro
#提升空间
#汉字问题
#墙上画报
分享
评论 0
0
凡人小北
1周前
真正打动面试官的, 从来不是完美到无可挑剔的回答, 而是: 候选人身上展现出来的稳定、诚实以及可托付的气质。
#面试
#稳定
#诚实
#可托付
#气质
分享
评论 0
0
凡人小北
1周前
我前阵子远程面试一个候选人,已经是第三面了。 技术能力基本没什么问题,前两轮同事都给了正反馈,我这里更多是确认一些细节和判断稳定性。 技术能力基本没什么太大问题了。 线上面试,用腾讯会议。 这小伙子回答得特别利索,就是那种确实有实力,但好像又完美得有点不自然的感觉。 不过整体我还是满意的。 然后他非要演示他的 Agent 作品。 我都已经准备让他通过了,就说行,你演示一下。 结果他一打开共享屏幕,可能紧张选错了应用,直接自爆。 满屏密密麻麻的面经。 说实话,我并不觉得他没能力。 他八成是真的会,就是不够自信,想把这轮稳稳过。 如果我是他,我可能也紧张。 但现实是很多公司非常在意这种事。 能力是可以补的,但诚信掉下去,就补不回来了。 可惜了,如果他不这样搞,他其实已经很稳了。
#面试
#候选人
#技术能力
#诚信
#自爆
分享
评论 0
0
凡人小北
1周前
听到一个字节面试官远程面试候选人, 如何抓对方用 ai 作弊的方法,朴素到离谱。 面试官突然说:你闭上眼睛回答这道题。
#字节跳动
#面试
#AI作弊
#远程面试
#离谱
分享
评论 0
0
凡人小北
2周前
看推友今天刷了半墙 Gemini 3 的前端测试,说一句不好听的: Gemini 3 不是在帮前端写代码,它是在替前端写代码。 注意帮和替的一字之差,前者是放大器,后者是吞掉。 当然前端不会消失,但基本可预见只会写前端的人会被机器秒成一地灰。 我过去的观点是: AICoding 一定是模型最先爆发的赛道,而前端是最先被爆的赛段。 现在我还是这个观点。
#Gemini 3
#前端开发
#AI Coding
#自动化
#行业变革
分享
评论 0
0
凡人小北
2周前
Andrej Karpathy 这个阅读方法有点意思… 大概就是: 先自己把文章/章节从头到尾过一遍,把大轮廓先搭起来; 第二遍丢给 LLM 解释 + 总结,看看它怎么梳理; 第三步直接开 Q&A,把想深挖的地方一个个怼出来问。 很有意思,阅读这件事从一个人对着文本死磕变成一个人和一个 AI 一起拆书。 这种方法能很好的解决之前那种看完了但有没什么留下来的浅刷。 有人也是这种阅读习惯吗?
#LLM
#阅读方法
#AI辅助
#知识获取
#拆书
分享
评论 0
0
凡人小北
2周前
Google 在 Gemini 生态里直接宣判了 RAG 的死刑。 这个 File Search 一句话就能概括: Google 把 RAG 从工程领域直接删掉了。 以前做 RAG 是一整条流水线: 切 chunk → embedding → 向量库 → 检索策略 → 引用链路 → 缓存优化 → prompt 拼装。 现在 Gemini 的 File Search 非常简单,把PDF/JSON/代码/Markdown 扔进一个 store,然后问问题。 剩下全部交给模型。不需要理解 RAG,也不需要设计 RAG,甚至不需要知道 RAG 曾经长什么样。 就这么简单,整个 RAG 技术链路的所有复杂度不可逆地被压到平台底层。 AI 应用的门槛又被 Google 掐了一次脖子。我也没想到有一天模型厂商竟然用这种方式吞掉了技术。
谷歌Deep Research:AI操作系统雏形?· 145 条信息
#Google
#Gemini
#RAG
#File Search
#AI应用
分享
评论 0
0
凡人小北
2周前
还记得去年 Devin 搞了一个 deepwiki 吗? Google 现在也悄悄上了一个同类,Gemini 加持的CodeWiki: 用法超级简单: 把 GitHub 的项目仓库地址,直接贴到 CodeWiki 的 URL 后就行。 比如 LangChain 的 repo: 那么它对应的 CodeWiki 页面就是: 私有仓库马也上会支持,据说 Google 在开发 Gemini CLI 扩展,企业内部 repo 也能用。 所有做工程的人都知道一句残酷真相: 写代码从来不是效率瓶颈,理解代码才是。 尤其是大型仓库,文档永远跟不上代码, 逻辑全靠口口相传。 如果代码-文档-知识这条链路能打通,工程效率这块真的要再往前跳一级了。
谷歌Deep Research:AI操作系统雏形?· 145 条信息
#CodeWiki
#Google
#Gemini
#代码理解
#工程效率
分享
评论 0
0
凡人小北
3周前
AI 真正落地最快的,其实是那种只需要工程师、不需要任何其他部门配合的场景。 一旦项目需要经过多部门共识,开十个项目群,甚至要同步半个公司的业务,节奏立刻慢十倍。 这种牵扯 KPI、人情、责任边界等一系列问题的场景,AI 能直接从工具变成政治。 现实就是这样: 能让工程师直接落地的事,一周就能上线; 要开完三个会才能定方向的事,一年过去了都还在讨论可行性。
#AI落地
#工程师主导
#跨部门协作障碍
#效率低下
#政治化
分享
评论 0
0
凡人小北
3周前
好家伙,这两天 X 上全是 Google, 这次是直接把 Gemini 塞进 Maps 了,这是我最近看到最有生活实用性的 AI 原生落地了。 看了太多的你说我答型的演示型智能,这种能做导航多轮规划的能力让人眼前一亮。 比如找一家两英里内好停车的素食玉米饼餐厅这种,一句话就能搞定路线+店铺+车位+到达时间,这才是真正听得懂人话的导航助手。 这就是我一直在说的: Google 的强,不只是模型,还有生态和深度。 期待 Gemini 再更新几版,一年后可能会炸得比现在想象的更大。
Google Gemini 2.5发布引发AI模型性价比热议· 475 条信息
OpenAI新德里发布会:ChatGPT语音翻译功能引发热议· 869 条信息
#Gemini
#Google Maps
#AI导航
#实用性
#生态
分享
评论 0
0
凡人小北
3周前
你以为 Gemini 3 还没发是因为没准备好? 不是的兄弟,2.5 Pro 还够用,甚至在知识,规划和头脑风暴上,都能硬刚所有顶级模型。 所以根本不着急,现在全域工具链串成一套闭环这件事儿,可以理解成是再做生态总动员。 别忘了 Gemini 3 只是没发而已。等 Gemini 3 发出来的时候,可能是 Google AI 的系统性爆发。 所以说,该加仓的,别等新闻稿出来才上车。
Google Gemini 2.5发布引发AI模型性价比热议· 475 条信息
OpenAI新德里发布会:ChatGPT语音翻译功能引发热议· 869 条信息
#Gemini 3
#Google AI
#生态系统
#知识规划
#系统性爆发
分享
评论 0
0
凡人小北
3周前
Google 最近整合明显在加速,想多了能让头皮发麻那种。 产品+AI 我认为做到了生态一体和智能自洽。 来看两个关键点: 1. 生态的统一智能层 全线产品智能化,特别是给 Gemini 开了权限,就能一口气调用 Gmail、Drive、Chat 的内容,不用上传也不用提醒,它直接就知道我想找啥。 这是 Workspace 的智能操作系统。 2. 知耻而后勇式进化 Gemini 一开始大家都在骂,但这一波是真转身了。直接融入 Workspace,成为工作记忆体 + 自动助理。 关键点在于它聪明,并且它知道得也太多了。 这就是 Google 的可怕之处: 首先模型强,然后数据闭环 + 应用集成 + 权限整合全部打通。 当别人搞 AI + 工具的时候; Google 说:我不跟你们玩,我搞的是 AI = 工具。 幸好这些年我一直没放弃 Google,这也算是某种意义上的坚守回报了。 既然 AI 是能力放大器,我也想看看 Gemini + 我在Google 生态里的内容,Gemini能给我放大多少倍。
Google Gemini 2.5发布引发AI模型性价比热议· 475 条信息
OpenAI新德里发布会:ChatGPT语音翻译功能引发热议· 869 条信息
#Google
#Gemini
#AI生态
#workspace
#智能化
分享
评论 0
0
凡人小北
1个月前
看到 OpenEvidence 又拿融资,不得提一下这家公司。 就在一周前,OpenEvidence 宣布又完成了一轮 2 亿美金的 C 轮融资,由 Google GV 领投,红杉、黑石、凯鹏华盈、Thrive 等一众顶级机构加持,投后估值飙到 60 亿美金。 注意,是三个月内连下两轮:7 月刚融完 2.1 亿,10 月又拿 2 亿。而且是产品实打实增长后的结果,跟PPT融资完全不是一回事儿。 如果你看过很多次红杉的闭门会,肯定听过这家公司的名字。这家公司没有去卷模型参数、也没搞花哨 demo,就做了一件事,老老实实盯住医生最难的那几个问题,结果反倒跑出了很扎实的落地路径。 可能很多人还没太关注这家公司,那我快速讲一下: OpenEvidence 是专门做医生用的医疗版 ChatGPT,定位非常清晰:搜索 + 分析 + 自动写研究报告,所有能力都基于真实医学文献和临床指南构建。 分享几组数据: 1. 美国已有 40% 医生在用,每月新增注册医生 7.5 万人 2. 月度咨询量从 7 月的 35.8 万暴涨到现在的 1650 万次 3. 自研模型是历史上第一个在美国医师执照考试中拿满分的 AI 4. 推出新产品 DeepConsult,能生成博士级别的医学研究文献 5. 商业模式是谷歌是赞助答案,直接给药企做精准广告,预计明年 ARR 将突破 1 亿美元 说说他的技术,数据价值占了很大的比重,跟 NEJM、JAMA 系列等 11 本顶刊合作,喂了 3500 万份同行评审过的文献,把 AI 的幻觉率降到行业最低,所以医生才敢用也才愿意用。 以下是我想说的: 如果认真观察,会发现真正有价值的 AI 应用,往往不是最热闹的那批。 比如OpenEvidence 的崛起就提醒我们一个简单却经常被忽略的事实: 在一个足够需要专业积累的行业里,数据密度+场景深度+专业严肃性,这三者就是护城河。 并且那些最早下场,懂需求,并且还不怕脏活累活的人,会悄悄赢下整盘。 这种垂类的 AI 产品 PPT 可以很酷炫,但骗不了任何一个需要每天稳定输出结果的用户。 特别是医疗行业,这个行业不是能靠 prompt 拼出来的行业,不是说今天堆几个插件,明天跑个多模态就能打穿的。 这个行业不需要演示好看,真正能用才会留下来用户,医生是会用脚投票的。 能走到这一步的公司,从一开始就选了那条最难但最有价值的路径,熬过了看不到成果的阶段,最终成功了。
#OpenEvidence
#医疗AI
#医生
#融资
#数据驱动
分享
评论 0
0
凡人小北
1个月前
分享下我的方法: 1. 🪜开了个paypal美区账户,绑定了国内信用卡,然后美区apple账号支付方式选择paypal,已经稳定用了几年了。 2. Android 手机上美区Google Pay,也是绑定国内信用卡。 这两种方式充值ChatGPT和Claude都很丝滑。
#PayPal美区账户
#国内信用卡
#ChatGPT充值
#Claude充值
#支付方式
分享
评论 0
0
凡人小北
1个月前
申请资质要做个网站,技术说排期得一周,评估一堆要配设计,要走流程。 结果产品没多说什么,自己打开 AIcoding,工位上吃午饭的功夫,拿着原型直接干出来让运维上线了,半小时不到。 这种事儿每次都能震我一下,很感慨。 不是要说谁效率高谁效率低,你明显能感觉到,当 AIcoding 这种东西真的落到每个人手里,原来泾渭分明的角色边界,正在迅速变得模糊。 以前你是产品,你就负责提需求,写文档画原型,协调人; 技术是实现的人,你说他做,中间再磨一磨,再对齐,再拉通那个什么颗粒度。 但现在,很多事根本不用协调,自己就能干。 也不是说产品都要变成工程师,但你只要稍微会点操作、知道 prompt 怎么写、页面结构心里有数,其实你完全可以直接出手,甚至很多时候速度比对接要快太多。 那这种没有很复杂业务逻辑的工作未来技术的位置在哪里? AIcoding 时代需要的是谁拥有把想法落地的能力。 这个变化,很大。
#aicoding
#产品经理
#工程师
#效率提升
#角色边界模糊
分享
评论 0
0
凡人小北
1个月前
复活了,微信账号终于解封!🥲 这一周被封的原因我到现在都还不知道,没有预警、没有提示、没有申诉通道,啥也没说,突然就被限制发言。 但最绝的是封号手段,只能看不能说,别人发来的消息我都能看,就是回不了,回一条提示我功能受限。 这个设计真的牛逼, 社交孤岛 → 强制沉默 → 所有关系链还在,就是你不能出声。 彻底体验什么叫“还在场,但已经消失”。 这比直接封号狠多了。 真的是越想越恐怖:我们所有的社交、工作、支付、登录系统,已经深度依赖这些超级平台,但你对它们的规则毫无知情权,甚至连“你错在哪”都不知道。 不透明、不对等、不告知、无申诉。 想象一下你哪天醒来发现支付宝不能付款、微博不能发言、微信不能说话,系统只告诉你:你已被限制使用。为期 7 天,原因保密。 你能怎么办?等。你除了等,啥也做不了。 这还不是 AI 或数字社会的未来,这是现在。
#微信封号
#社交平台依赖
#用户权利
#不透明规则
#数字社会
分享
评论 0
0
凡人小北
1个月前
如果你老板是那种节奏感特别强、细节管控欲很高的事无巨细型,你该怎么适配? 尤其你本身是一个团队的负责人,希望自己的保持自驱和探索的团队,怎么在不对撞的前提下,撑住上面又托住下面? 我领导风格就挺明显的:节奏感极强、什么都想提前知道一点、细节关注度也很高。 说实话,刚开始我情绪很大,但后来也想通了,就是慢慢做事的过程中,调整自己调整节奏,不能硬碰。然后做了一些事情,让我们这几支团队还能保留一点自己动的劲儿。 比如我这边会提前把关键节奏先定下来,有哪些地方可能是风险点、预计哪个决策节点会卡,我会主动提出来,提前同步。 老板既然在意节奏感,那我先打个底,让他知道我这边没掉链子,就不用事事插手,我这边空间反而更大了。 再比如,我不把上面的节奏 1:1 拿来压团队。 我会自己先缓一层,再换个说法传下去,比如说“我们这块再快一点,方便我们下周给出一个完整 demo”,而不是“老板说这个这周必须搞定”。 这种语气差别,其实挺关键的。一个是一起推进,一个是被人推着走,长久下来,团队的状态很明显完全不一样。 还有就是,我会留点缝隙让团队的人抬头看看。 不一定非得搞创新项目,有时候就是开个小会、讨论个备选方案、尝试一个新方法。你不留这点空间,团队很快就只会执行了,想象力和判断力都会变钝。 其实就是得让这个团队有点自己的动能,不然老板节奏一紧,整个系统容易变成被管理和等指令的那种僵化状态,哪怕人再聪明,也会慢慢变钝。 我挺在意这一点的。一个管理者是不是一个好管理者,是要想办法带出一支能自我决策、自我拍板的队伍,那种“手一松,整个团队就塌了”的状态,我自己都不想进。 老板是啥风格我控制不了,但我怎么传导、我团队怎么运转,我是能决定的。 当然话说回来,也不能光想着“我扛着就行了”。有些时候你还是得管理一下老板,创造一种让他不需要事无巨细的局面。 我会刻意把核心决策点和节奏断层提前抛出来,让他知道我在掌控,他就不太会越界干预。 如果他真有越级管人的时候,也会找机会聊聊,让他知道我这边已经推进得差不多了,节奏没问题,不用插手太多。 另外不需要教他怎么当老板,只需要让他知道,有些事你比他更早看见、更快落地,他自然会往后退一步。 上面和下面之间就好像三明治的中间,既要撑住上面,又得托住下面,其实中间靠的不是忍耐力,一个好的管理者要有能力建一套自己的节奏逻辑,把两头都黏住。 然后就会慢慢看出差别了。 一个自驱、主动探索的团队,和一个只是为了迎合老板而做出探索样子的团队,状态完全不一样。 能不能真正跑起来,组织气候里的人自己最清楚。 时间久了就发现两种团队做出来的东西,最后是会分叉的: - 一个做出来的事是能继续演化、能经得起时间考验的,过了那个节点它还在持续生长; - 另一个则可能就是为了某次高光临时拼出的demo,亮相那一刻是巅峰,之后就没了后续。 组织记忆是有惯性的,时间会帮你判断什么是真能力,什么只是对得上节奏的热闹感。 就这样,没太多大道理,就是一路摸索调整,慢慢磨出来的。
#向上管理
#团队自驱力
#管理者角色
#节奏把控
#避免微观管理
分享
评论 0
0
凡人小北
1个月前
ChatGPT 的记忆系统更新了,一个不起眼但可能非常关键的底层变化: 自动管理记忆,不再 memory full,也不再全靠你手动删改。 一觉醒来 AI 在自我意识觉醒的路上的又迈出了一小步。 OpenAI 官方是这么说的: 1. 不会再提示“记忆已满”,系统会自动合并 / 替换不再重要的信息 2. 支持搜索、排序、设定记忆优先级(by 你自己) 3. Plus 和 Pro 用户今天起全球上线(仅限 Web 端) 没想到今年 memory 发展这么快,控制权开始往模型转移了。 ChatGPT 自动判断哪些对用户重要,并且只保留它觉得重要的,还能定期合并、更新、删除不再需要的内容,最主要的是这些判断都是来自系统本身的策略模型,而不是用户。 脑补一个对话: “我们上次聊的那个方向呢?” “我已经归档了,觉得它没那么有用。” 这还是个工具吗?🤔 听起来是不是有点像人? 跟前两天那篇推文说的一样,记忆系统这事儿,光是能存起来远远不够,OpenAI 的记忆架构应该是有一些突破了。 当然了,现在它还不算真正自主记忆管理,但这个功能很明显的趋势,未来的 AI,不一定记得你告诉它的,但会自主判断它认为你重要的。 有点意思但又细思极恐!
OpenAI新德里发布会:ChatGPT语音翻译功能引发热议· 869 条信息
#ChatGPT记忆系统
#AI自主学习
#OpenAI
#记忆管理
#细思极恐
分享
评论 0
0
凡人小北
1个月前
突然 FDE(Foward Deployed Engineer 前沿部署工程师)这个词火得有点莫名其妙,很多创业者一夜之间开始膜拜 Palantir 式打法,搞得好像硅谷又发现了什么新大陆。 先说我的看法:国外现在兴奋讨论的这套东西,中国人早就在用了。不夸张地说,FDE 这个概念在国内 toB 创业环境里,根本不是什么未来范式,它是过去 10 年我们活下去的方式。 硅谷的 FDE 模式今天之所以被捧上神坛,是因为 AI agent 产品天然不能标准化、不能纯靠 SaaS 拉起规模,只能靠“深扎现场 + 产品抽象 + 高难度交付”(这几个词眼熟吗)这种非线性方式打通从 0 到 1 的路径。 这种新范式我们不叫 FDE,我们叫它: 售前 + 客户经理 + 实施 + 技术支持 + 专人陪跑 + 项目现场 + 临时产品经理 是不是听上去不那么高级,也没人总结成Echo + Delta 团队这样的理论模型可中国 to B 创业者、尤其是医疗、制造、政企、教育领域的创业者,从来没有什么 SaaS 福报。 我们走进客户现场,用工程师替客户解决一线需求,项目经理拆用例,售前写方案,然后陪标、上系统。这些人一开始就被扔进落地即交付,交付即定制的泥沼里,硬生生走出了一套非标准化探索到产品复用化的路径。 所有这些国外今天才开始鼓吹用 demo 去找 PMF,我们已经 demo 到脱发了。欧美 SaaS 怕是忘了东方还有个神奇的国度。 为什么现在大家把 FDE 当作一种新的 go-to-market 策略来膜拜。可能是因为他们原来做的是标准化 SaaS,突然卷进 AI agent 的复杂场景,一下子手脚不够用了,才发现:哦原来世界上还有一种方式,叫“没有产品也要先干起来”?
#FDE
#toB创业
#中国经验
#AI Agent
#非标准化
分享
评论 0
0
凡人小北
1个月前
《为什么 95% 的 AI Agent 做不起来?》 非常推荐,踩的坑和解决方案跟我们几乎一模一样,虽然讲得很清楚,架构师视角,值得花 10 分钟读完,应用到工程实践中。 几个点: 1. 现在大家都还在拼 prompt,只有少数人开始拼上下文结构。 特别对的一点是:prompt engineering 已经不是核心了,context engineering 才是下一阶段的主战场。给再聪明的大模型喂进去一堆乱七八糟的输入,它还是只会胡说八道。 市面上跑得稳的 Agent,都是在“什么该让模型看、怎么看、以什么形式看”上下了大功夫的,这一点现在应该是共识了。 2. 记忆系统这事,光是能存起来远远不够 很多公司的 memory,说得好听点是长期记忆,难听点就是个聊天记录仓库。 真正落地的系统要分层记忆(用户级 / 团队级 / 系统级)。文章读完我感觉更多的篇 B 端,C 端要思考的是结合业务来做分层记忆,并且要能让人知道 它记住了什么,并且用户能自己改。否则就不是记忆是监控。 3. 不迷信单模型,这年头还不做 routing 的 agent 就别说自己做 infra 了。 这篇文章提到多模型路由,说得很对。不可能所有请求都丢给 GPT5,成本和时延直接炸掉,表现也未必好。 真正合理的系统,一定是: 快速反应的轻模型做分类和前处理、重模型做主任务、补一个模型做验证或追问。 一个 agent 后面绑定的一定是一个 LLM 团队。 4. 可追溯/可控/可信,是企业愿意用 Agent 的底线 很多人只想着怎么让 agent 能回答,但企业更关心:这句话是从哪里来的?有没有越权?出了错我怎么追责? AI 要可治理。 5. 最被低估的一点:Agent ≠ Chatbot 这篇文章最后说到的一点我非常赞同但还不够狠:如果还在用聊天当所有用户交互的方式,那agent 最多是个语音助理。 真的 agent 应该是:先用语言调度任务,然后在页面上看到结构化结果,还能继续点选、调整、组合下一步。这部分很多公司现在在尝试了,交互上比之前全部自然语言高效了太多。 一个特别有意思的点,当主持人问观众“你们中有多少人构建了文本到 SQL 并投入生产?”时,没有一个人举手。
#AI Agent
#Context Engineering
#多模型路由
#可追溯性
#人机交互
分享
评论 0
0
凡人小北
1个月前
最近在看一圈 ToB agent 的落地情况,有个判断越来越清晰: 至少还得 1 年,国内 ToB agent 才可能真正起来。 第一,国内的模型能力,还不够。 ToB 业务链条长、场景复杂、对结果的容错率极低。 现在的大模型,哪怕再微调十遍,稳定性不够,自洽性不够,还不够听话这些问题依然严重。 prompt 写得挺对,它干的事还是不怎么靠谱。像个刚转岗的实习生,流程懂了点,但是做起来全是 bug。 第二,做技术和懂业务的,不是一拨人。 ToB agent 最大的挑战是知识怎么迁移。比如想让 agent 搞懂保险理赔、医疗问诊、法律审查……这些不是写 prompt 能解决的,它们背后是几十年经验、人情流程和模糊判断。 越值钱的知识,掌握它的人越年长,越难被结构化表达,更别说这批人愿不愿意倾囊相授。 技术今天搞出来一个 agent,业务方只会说三句话:你这不准啊、我们流程不是这样的、你这漏了关键条件,但这个流程是之前开发跟业务一起梳理出来的。 这背后藏了抵触,技术和业务之间,隔着的不是 AI,是一整座山。 那为什么 AI coding 能先跑出来?因为这事里最懂业务的就是技术自己。 谁最懂代码结构?技术! 谁能写 agent 调 agent?技术! 谁能 debug agent?还是技术! 技术是唯一一拨能自己用,自己调 bug的群体。业务等于本体,没有认知 gap,也不需要跨专业翻译,一整个闭环自然就跑通了。 本质区别在这:AI coding 是单边迁移服务自己, ToB agent 是双边博弈,需要认知共建。一个能快,一个必须慢。 对于 AI coding,只要模型理解开发者就够了。ToB agent,不仅模型要懂业务,开发者还得懂业务,然后两边还得对得上话。 这,太难了。 真正的转折点要出现:必须满足模型能稳定 编码行业知识,Agent 能封装复杂动作并处理结果反馈(前提是老顽固们愿意掏心窝),企业能放心把核心流程交出去。 到那一天,ToB 才真正算是 ready 了。 那时候再回头看 coding agent 的进化速度,也许已经不是一个量级的对比了。 技术在革自己命这件事上,从来没有输过任何群体。
#ToB agent
#大模型能力
#技术与业务认知差异
#AI Coding
#行业知识迁移
分享
评论 0
0
凡人小北
1个月前
OpenAI 又把AMD 拉了进来,再加上Oracle、博通这些公司,基本已经形成了一个小圈子。 大家一起玩,股价/估值互相复利向上,市值层层往上叠。 一座巨大的围城已然形成。外面的公司看热闹,里面的人越抱越紧,创新的空间能被他们的效率吃得干干净净。 这是史上效率最高的资本共生体了吧。
#OpenAI
#AMD
#资本共生
#科技围城
#高估值
分享
评论 0
0
凡人小北
2个月前
这个九月 AI 工具真的卷出新维度了。Flowith 把自己的画布升级成 Context Playground(AI 创想画板)。 用 AI 最烦的就是它总是自己嗨,幻觉一堆,明明只是想改一点点内容,就跑偏了八百里,最后却不得不一遍一遍地试探 prompt…… 现在,Flowith 直接让我一刀剪掉跑偏的部分,AI 幻觉真的被解决掉了。 它把整个创作流程换了种思路,用户第一次真正能在一张画布里自由的创作。 整张画布顺畅的就像是一个“灵感搭建场”,AI 不再主导,而是变成真正的工具层助手,我更愿意称现在的这个形态为“无边记”。
AI视频井喷:Midjourney领跑,多模态混战· 337 条信息
#AI工具
#flowith
#Context Playground
#AI创想画板
#无边记
分享
评论 0
0
1
2
3
下一页
个人主页
通知
我的投稿
我的关注
我的拉黑
我的评论
我的点赞