sitin
10小时前
Google 出了个 Genkit Extension,给 Gemini CLI 装了“Genkit 大脑”。 装上以后,命令行不止会跑命令,它能读懂你的 Genkit 项目结构、最佳实践、MCP 工具,在终端里帮你写、跑、调、优一整套。 它到底改变了啥?三句话说完: 1.懂行:内置 Genkit 知识 + MCP 工具,明白“flow、trace、SDK 使用规范”。 2.省事:在终端里直接生成代码、跑 flow、看 trace、定位问题,少翻文档。 3.可扩:和 Gemini CLI 的扩展体系打通,能连 Figma、Postman、Stripe、Firebase 这些常用工具,形成你自己的“AI 命令行工作台”。 装完能干啥? 列出并执行 flow:list_flows 看清项目里有哪些 flow,run_flow 直接在终端跑; 查问题看链路:get_trace 把 OpenTelemetry 的执行链路过一遍,哪里慢、哪步错,一眼看到底。 这不是“拍脑袋生成代码”,而是按 Genkit 规范来,尽量给出可直接落地的模板和修复建议。 和我们日常开发怎么配合? 你用 Genkit 写多模型/多模态/Tool 调用那套,Developer UI 做可视化; CLI 侧装上这个扩展,补齐“终端里的智能助理”:问它“帮我写个 flow……”,它给出贴标准的代码;跑不顺,trace 一键看;需要文档,命令行直接调出对应段落。 给团队的三步上手法: 1.把 CLI 跑起来:装 Gemini CLI → 安装 Genkit Extension → 在一个现有 Genkit 项目里试 list_flows / run_flow / get_trace。 2.定一条“从写到上”闭环:让新人把“新增一个 flow → 本地跑通 → 用 trace 校验 → 开 PR”的动作,全在终端里完成一次,减少来回切页面。 3.接入常用工具扩展:把设计(Figma)、接口(Postman/Stripe)、部署(Firebase/GCP)相关扩展串进来,形成你团队自己的“命令行工作流”。 一句话总结: 以前我们要翻文档 + 手配 SDK + 人肉看日志;现在把这些活塞给 CLI 的“Genkit 大脑”,速度更快、调试更顺、质量更稳,你把时间留给业务和创意就好
Byron Wan
12小时前
On a June night in 2024, Nvidia CEO Jensen Huang held court with several of his company’s major Asian customers at a bar in Taipei. Next to him was Huang Xiaole (黄小乐) aka Alice Huang, an executive of Megaspeed, a shady Singapore-based data center company. Nvidia’s compliance team has looked into Megaspeed and determined it’s “wholly owned and operated by a company based and headquartered outside China, with no China shareholder.” Megaspeed was created in 2023 when 🇨🇳 7Road, a gaming company with ties to 🇨🇳 state-backed investors, split off its overseas operation in Singapore and renamed it Megaspeed, which in early 2024 set up Speedmatrix, a subsidiary in Malaysia that quickly snapped up ~$2B worth of Nvidia’s most advanced chips. Most of those chips came from Aivres, the US subsidiary of 🇨🇳 Inspur, a major tech company added to the 🇺🇸 Entity List in 2023 for supporting 🇨🇳 military 👉🏻 Nvidia is barred from selling its technology to Inspur without a special license. But since Aivres is based in California and records sales as a US company, it can buy Nvidia chips freely. Megaspeed has funneled those chips to data centers in Malaysia and Indonesia that appear to remotely serve customers in China. That is not necessarily illegal, but it can be found unlawful if it is done on behalf of a 🇨🇳 company. US officials have also been scrutinizing whether Megaspeed diverted some of those chips on to China, in violation of US law. Megaspeed is also facing scrutiny from Singaporean police. Megaspeed listed Alice Huang as its managing director for its first 8 months, and its current director James Tan is from Singapore but is based in Shanghai. It’s not clear when Jensen Huang and Alice Huang, who are not related, first met. She was mingling with a crowd of tech executives just after midnight at the Taipei bar in early June 2024 when she offered to ask Jensen Huang to join them. “I bet you guys I can get Jensen here,” she said, and shortly afterwards Jensen Huang arrived in his trademark black leather jacket and drank a whiskey shot with the group. Jensen Huang and Alice Huang were photographed together again in May, exiting a restaurant in Taipei with an Nvidia aide after a business dinner with other AI suppliers. Alice Huang spent much of her career in China, including working as a TV reporter for 🇨🇳 state media and as a private banker. Huang left Megaspeed in recent months. It’s unclear when and why she left and what she’s doing now. Both she and 🇨🇳 7Road, the Chinese company that Megaspeed split off from, have close ties to a web of wealthy investors and tech companies with data center projects in China. The owners of 7Road include 🇨🇳 central government and several local governments. Before joining Megaspeed, Ms. Huang was executive director for a Shanghai-based fund that had invested in 7Road and had ties to state-backed firms. Reporters looking into Megaspeed’s opaque operation have tracked business listings that led to a Malaysian data center and shopping mall, a near-empty office in Singapore and a dilapidated storefront outside Kuala Lumpur. It’s not clear where Megaspeed’s billions of dollars came from. But a few weeks after the gathering in Taipei last year, Megaspeed began receiving a steady supply of multimillion dollar shipments of some of Nvidia’s most advanced chips. Over the next 3 months, Megaspeed bought a billion $ of Nvidia technology. Within the next 9 months, it secured roughly a billion $ more. The bulk of those advanced Nvidia chips were purchased from 🇨🇳 Inspur’s US subsidiary Aivres. The shipments went to Megaspeed’s Malaysian subsidiary Speedmatrix. The registered address for Speedmatrix on the shipping records led to a dilapidated storefront outside Kuala Lumpur, where the sign out front advertised a construction company. No one was inside when a reporter visited the address in late Sep. Employees at the law firm next door said they rarely saw people in the office. 1/2
我不觉得这个回应能消除 AI 泡沫论。这篇文章费力的找了一堆证据,但正是这种费力,反而说明了 AI 就是有泡沫。 别说两小时自主任务,绝大多数用户现在连 5 分钟都用不上。不是说学不会这个技能,而是多个连续自动化步骤当中的错误累计太严重,两步不矫正,后面就完全是胡扯。你在胡扯的路线上指数增长有个毛用啊?除了开发者,目前绝大多数用户使用 AI 的方式跟 2022 年 10 月 ChatGPT 3.5 刚出来的时候没有分别,都是单步调试。除非你对于产生内容的结果不在乎——比如做一个 Sora2 的影片 po 到 X 上搏个乐,播放量多少无所谓,或者交一份没人会认真看的报告——否则,只要你的产品需要在一个竞争性的环境里被检验和评价,最好的方式就还是单步调试。最近很多 AI 大牛都在媒体专访里大谈他们在实验室里观察的牛逼进展,但这种行为恰恰是泡沫阶段的特点:试问哪个行业在实验室里没有牛逼克拉斯的进展?什么时候那些财经和大众媒体又都变得这么关心起实验室里的进展来了呢? 当然只有是在泡沫期。 AI 当然有泡沫,泡沫肯定会崩溃,崩溃后肯定会再兴起,泡沫一波一波地推动 AI 的发展,这就是资本主义“集中力量办大事”的方式,最终一定会有力地推动真实生产力 10x 甚至 100x。这些我都坚信不疑。 但很多人就坚决不承认泡沫的存在,连阶段性的泡沫都不允许有,这就是个问题了。不但是个问题,而且连怎么解决这个问题的方法都搞错了。泡沫本质上是个人性的事情,AI 只是一个 topic,确切的说,数百年来无数个 topics 中最新的这一个。不管一个技术进展得多块,当太多的人同时看好的时候,就会出现泡沫。那种认为大众想象追不上指数增长的,也是太低估人类的想象力和狂热了。人类发疯的时候,你区区一个指数增长算个啥? 所以说到这个话题,我很想怼一下 AI 专家们:我们可能不懂 AI,可是我们懂人性啊。 AI 头部企业几乎是约好了不上市,把估值圈在一个容易控制的范围内,这比上市以后再冒险搞市值管理要容易多了,也安全多了。现在巨头们大刷连环计,一块钱转三圈,往市场放八个消息,非常明显,就是为了防止泡沫从某一个薄弱环节崩溃。因为这种史无前例的操作方式,我认为现在 AI 的泡沫还很坚硬,甚至还没有到达泡沫破灭前的最后一个阶段,也就是极速上升期。从操作层面上来说,AI 的筹码还集中在 VC 手里,尚未散发给那些没有反抗能力的韭菜们,因此,泡沫还在发展期,一段时间内还破不了。但谁要认为没有泡沫,那就太幼稚了。 所以 AI 有没有泡沫?肯定有。会不会破?还破不了。什么时候 AI 的泡沫会破呢?三个信号: 第一,市场上谁再说 AI 有泡沫,谁就会被群嘲为傻逼。 第二,筹码被得罪不起的人高价卖给那些得罪得起的人手里; 第三,价格短时间内出现极速飙升。 对于 crypto 行业来说,其实问题只有一个:什么时候参与这场泡沫盛宴,以及参与以后,被 AI 行业甩锅的时候,怎么把锅甩回去。 这一幕一定会发生。未来的某个时刻,那帮已经割得盆满钵满的 AI 大玩家会一边数着银行账户偷着乐,一边义正言辞地在 X 上说: “操,本来姆们 AI 好好的,就是因为你们 crypto 瞎特么过来搅合才崩盘,都特么怪你们这帮 low 逼。” 我们这帮人除了发一个“$去你妈的”中文 Meme 以外,还能说什么?
Y11
14小时前
如果你还没注意到这个变化,那现在应该关注一下:计算的重心正在从预训练转向推理。 我们发现,通过在测试时扩大计算资源的投入,效率提升非常显著,而且这种提升的空间似乎还很大。 在人工智能领域,预训练阶段就像给模型打好基础,用海量数据让模型学会知识和规律。 但真正让模型服务于实际问题的,是推理阶段——就像让学会了知识的人去解决具体问题。 过去,大家可能更关注如何让预训练模型变得更大更强,比如用更多数据、更深层的结构。 但现在,随着大模型的发展,推理阶段的计算成本和效率问题越来越突出。 最近几年,我们看到一个明显的趋势:企业和开发者开始把更多精力放在优化推理上。 比如,通过调整模型结构让它在推理时更“聪明”,或者用更高效的硬件加速计算,甚至在推理过程中动态分配资源。这些做法就像给汽车升级了更高效的发动机,虽然车子本身已经不错,但通过优化“跑”的过程,能让速度更快、油耗更低。 为什么推理的重要性越来越高? 因为预训练模型的规模已经很大了,再单纯扩大预训练的规模,边际效益会递减,甚至可能增加成本。 而推理是模型和用户直接接触的环节,直接影响用户体验和实际应用的成本。 比如,一个聊天机器人如果推理速度慢、响应不及时,用户就不会喜欢用;一个自动驾驶系统如果推理时间长了零点几秒,可能就会影响安全。 所以,现在大家都在想办法让推理更“快”、更“省”,同时还要保证效果不下降。 这种转变不是说预训练不重要了,而是说整个技术体系在走向更精细化的分工。 就像建房子,打地基(预训练)很重要,但盖好地基后,怎么把房子建得又稳又漂亮(推理优化),同样关键。 而且,随着技术的进步,推理阶段的优化空间还在不断扩大。比如,新的硬件技术、更智能的算法,甚至模型本身的“瘦身”技术,都可能让推理效率再上一个台阶。 对于企业来说,关注推理阶段的优化,其实是在为未来的竞争做准备。 谁能让大模型用更低的成本、更快的速度服务用户,谁就能在AI时代占据更有利的位置。而对于我们每个人来说,这也意味着未来会有更多更智能、更便捷的AI产品和服务,真正走进我们的生活。 总的来说,从预训练到推理的重心转移,是AI技术发展到一定阶段的必然结果。 这不仅是技术路径的调整,更是对效率和实用性的追求。而这个过程中,我们看到的不只是技术的进步,更是整个行业对“如何让AI更好地服务人类”这个问题的深入思考。