木遥
1个月前
一些关于即生成即用(create-as-you-go)的时代的想法。 English version: Gemini 3 发布的第一天,社交媒体上所有的反馈都集中在同一个方向:这东西会颠覆用户交互界面。这并不是说 Gemini 3 本身发明了一种更好的交互界面,而是说,它让生成完全依赖于具体问题和具体用户需求的即生成即用的交互成为可能。 在传统的用户体验里,工具负责生成一系列标准化组件,人脑负责把这些组件融合在脑海里生成更深入的理解。比如你要理解 DNA 的构造或者 Tesla 的设计或者房产税的施行细节,工具能给你的是各种文本表格图片文档,任何比它们更高阶的交互都因为依赖用户个性化的需求而无法标准化,因此从这些非常原始的数据中组装信息就成了一种不平凡的智力活动。整整一个中介行业(前端设计/编辑/视频制作/etc.)的工作本质上就是把这些细粒度的标准化低阶信息包装成终端用户能接受的状态。 这个中介行业有两个从本质上就没法绕过去的缺点:1. 贵。2. 它永远无法真正切合每个实际用户的需求。这种工作的交付是静态的,用户只能被动接受。出色的中介能尽可能精确地猜测到用户想要什么,但也仅限于此。 Gemini 3 发布之后,任何终端用户都可以直接对它说:给我一个关于 DNA 构造的动画教程,然后 Gemini 就能生成一个酷炫的交互式 3D 界面,允许你自己探索 DNA 的一切。这不是一个静态的交付,你随时可以根据个人体验而不断要求它更改:讲得更细致一些,展开解释某个背景知识,给渲染出的图像换个角度,对某个难点提出疑问……最终得到的是一个完全私人定制的东西,而且基本上只有一次性的使用寿命。——当然,Gemini 允许你把生成出来的结果分享给他人,但从实际效率角度来说,别人直接从零开始制作一份自己的版本往往更省事也更有针对性。 这带来了一些关于信息流通的根本上的新工程哲学。 人类所有工程领域一直都共享着一些不言自明的原则:标准、坚固、可复用。在这一点上,软件工程师和桥梁工程师没有什么不同。如果你是个桥梁工程师,标准意味着你可以大规模生产工程预制件,坚固意味着你希望你造的桥能用很久,可复用意味着你希望你造这座桥工具和经验能够尽可能直接被拿去用来造另一座桥。这些原则如此显而易见,以至于人们不会意识到它们的存在,也不会深思它们的代价。 如果你实际上既不需要标准化,也不需要坚固,也不需要可复用,你能省下多少资源和能量用来解锁别的 feature?你能做到多少本来因为需要满足标准、坚固、可复用而无法想象的事? 这有点像是从物资匮乏时代到物资丰裕时代的观念代沟。我们都遇到过长辈对旧物的执念——他们会坚持说:好好的东西扔了干嘛?万一哪天你还用得着呢。事实上你知道,首先很难遇到这个万一,其次就算真的要用,弄明白一个旧东西怎么用的功夫你已经从淘宝上下单了一个新的并且送到了门口。你不得不痛苦地给长辈解释说,为了存放那些破烂「以备万一」所占用掉的家居面积乘以单位面积房价,足够你每天买一个新的了。 从这个视角往回看,你会发现我们曾经为了这些古代的神圣原则付出过多少代价。传统的办公软件(比如 powerpoint)异常臃肿笨重,因为各种你可能永远也用不着但也许对某个人某天有用的功能都必须一出厂就准备好,而今天的你完全可以为了你现在要做的 presentation 直接生成一个成品,包含任何当下的你需要的 feature,不用关心它能否被另一个 presentation 用上。传统的代码库里包含着精雕细琢的注释文档和复杂的引用依赖,因为模块会被层层复用,你需要大费周章地解释意图和注意事项,既不能过于简略别人无法理解,也不能过于冗长让人没耐心阅读。你需要隐藏复杂性,提供简洁接口,一旦软件出错,你需要非常精确的错误信息才能帮助人定位问题。——所有这些对 AI 都属于过度设计,杞人忧天。有连篇累牍解释怎么复用高阶接口的功夫,AI 已经读完了几千行底层代码和几百行报错信息,然后另起炉灶写了一个全新的模块出来。你甚至不太关心生成的东西有没有 bug,只要你用的过程中不要遇到 bug 就行,或者就算有,你再生成一个新的就是了。 这当然不是说软件工程不存在了,只是成本和注意力都需要颠覆式地重新分配。底层的元件和设施也许需要更坚固更有效率——大模型基础设施供应商仍然需要千方百计从石头里榨出油来最大化每片GPU的使用,AI 本身也仍然需要调用有效的渲染引擎来支持各种定制化的高级界面——但你在链条上越靠近终端用户,就越需要提醒自己用户仅仅生活在当下,你和他们每一次长尾的、浮光掠影的、昙花一现的交互本身才是你真正要交付的产品。如果你是斯科塞斯,你关心的是你的电影是否永垂不朽。如果你想制作的是霸道总裁爱上清洁工的短剧,按照斯科塞斯的方式来执行就成了自寻死路。 设想一下,如果你能够每天根据你当下的心情和需求以几乎零成本生成一套新的家具并随时无痛扔掉所有旧家具,你会怎么理解家具这个概念本身?用黄花梨木来生产日抛型家具是没有意义的。
当AI能"扮演"任何人:一场正在加速的身份保卫战 最近有份覆盖195个国家、超过10亿次身份验证数据的报告显示,AI深度伪造已占生物识别欺诈企图的20%。 这个数字像一记警钟,提醒我们:数字世界的身份保卫战,正面临前所未有的挑战。 一、欺诈手段的"升级进化" Entrust的《2026年身份欺诈报告》揭开了惊人的变化:三年前,深度伪造文件欺诈可能还只在几十万级别,现在已激增至800万次;而数字伪造(如虚假图像、视频注入)更是占了文件欺诈案件的35%,年增长率达40%。 更值得警惕的是,技术门槛的降低让欺诈者变得更"高效"——过去需要专业技能的伪造,现在一个开源模型和几句提示词就能完成。 从应用领域看,加密货币行业首当其冲,60%的生物识别欺诈企图都与深度伪造有关;数字银行紧随其后,22%的验证环节面临伪造风险;支付和商户行业也有13%的攻击源于此。欺诈者常用的手段有三种:合成身份(AI生成虚假面孔)、换脸技术(视频中面部替换)、动态自拍(AI给静态照片添加动作),其中动态自拍的案例在2025年激增58%。 二、防御者的"能力时差" 技术在狂奔,人的准备却明显滞后。注册舞弊审查师协会和SAS的调查显示,不到10%的反欺诈专业人员认为自己已充分准备应对这些威胁。77%的受访者表示,过去两年中深度伪造社会工程攻击明显增多,83%的人预测趋势会持续加剧。 Entrust的高级欺诈专家Simon Horswell说得很透彻:"检测技术在进步,但欺诈团伙变得更快、更有组织性,商业驱动性也更强。身份已成为第一道防线,在整个客户生命周期通过可信验证保护它,才能跟上威胁的演变。" 三、最隐蔽的"绕过式攻击" 虚拟摄像头注入攻击尤为棘手。这种手段绕过物理摄像头,直接在软件层面向验证系统输入合成数据,配合设备仿真技术,能让验证软件误判为合法用户。尽管物理伪造(如伪造身份证件)仍占文件欺诈的47%,但生成式AI的普及正在让数字伪造以指数级速度增长——2024-2025年间,AI驱动的加密货币骗局激增了456%。 更令人担忧的是人类的"视觉疲劳":研究显示,即使是高质量的深度伪造内容,人们也只能正确识别约四分之一。当AI能轻易"扮演"任何人,我们该如何守住身份的真实性? 这场身份保卫战,本质上是技术与人性的较量。当欺诈者用AI突破边界,我们需要的不仅是更先进的检测工具,更要建立"可信身份"的底层逻辑——在数字世界里,让每一次验证都能穿透虚假表象,回归真实。这或许是未来十年,每个企业和个人都需要思考的命题。
在人工智能技术持续突破的当下,xAI公司于近期推出了Grok 4.1模型,这一进展不仅体现了技术的迭代速度,更让我们看到AI在实用化道路上的扎实探索。 作为马斯克旗下的AI初创企业,xAI此次发布的Grok 4.1在核心性能上实现了显著提升。 通过优化训练系统和算法逻辑,该模型将AI常见的“幻觉现象”——也就是生成虚假或无意义信息的情况——减少了约三分之二。 具体数据显示,其幻觉率从Grok 4 Fast的12.09%降至4.22%,在事实准确性测试中也取得了更优成绩。 这种进步让AI在回答问题时更加可靠,减少了因信息错误带来的困扰,这对于实际应用场景而言至关重要。 值得关注的是,Grok 4.1在多维度能力上都展现出竞争力。在LMArena的Text Arena排行榜中,其思考模式以1483的Elo得分位居第一,快速模式也以1465分位列第二,领先其他非xAI模型31分。更难得的是,在情商测试和创意写作评估中,该模型同样表现出色,情商测试得分1586创纪录,创意写作得分1722分,较之前提升了600分。这些成绩表明,xAI不仅关注AI的“智力”,也在努力提升其“情商”与“创造力”,让AI更贴近人类的情感需求和表达习惯。 此次发布延续了xAI“技术普惠”的理念,Grok 4.1向全球用户免费开放,高级会员可享受更高使用限额。这种开放姿态有助于技术的快速普及和反馈收集,让更多人能体验到AI进步带来的便利。背后支撑这一技术突破的,是位于田纳西州孟菲斯的Colossus超级计算机构建的强大算力系统,其超过200,000个GPU的规模,为模型训练提供了坚实的硬件基础。 当前AI领域竞争正日趋激烈,谷歌、OpenAI等巨头纷纷推出新模型。在这样的背景下,xAI的持续创新值得肯定。技术的进步从来不是单一企业的竞赛,而是整个行业推动社会进步的动力。Grok 4.1的发布,不仅是xAI自身的里程碑,也为整个AI行业提供了有益的参考——真正有价值的技术,既要追求性能突破,也要注重实际应用和用户体验。 对于普通用户而言,这些技术进展意味着未来我们可能会遇到更聪明、更可靠的AI助手;对于行业而言,这提醒我们在技术发展中既要保持创新锐气,也要坚守责任与伦理,让AI始终服务于人类福祉。随着技术的不断迭代,我们有理由期待AI在更多领域发挥更大作用,为生活和工作带来更多惊喜。
serva huang
1个月前