Huihoo灰狐
8个月前
Nvidia, GPU (Graphics Processing Unit) Google, TPU (Tensor Processing Unit) Groq, LPU (Language Processing Unit) Groq:Nvidia 的最新 AI 竞争对手 Groq 创新的核心是其 LPU,旨在以前所未有的速度加速 AI 模型,包括 ChatGPT 等语言模型 与使用高带宽内存 (high-bandwidth memory, HBM) 的 GPU 不同,Groq 的 LPU 利用 SRAM 进行数据处理,从而显著降低能耗并提高效率 GroqChip 的独特架构与其时间指令集相结合,可实现非常适合自然语言和其他顺序数据的顺序处理 Groq Language Processing Unit (LPU) 与最初为图形处理而设计的 GPU 完全不同,LPU 是为 AI 推理和语言而设计的 Groq 是 LPU 的创造者,它从头开始构建,以满足 AI 的独特特性和需求 LPU 以更快的速度运行大型语言模型 (LLM),在架构层面上,与 GPU 相比,其能源效率提高了 10 倍 Groq 使用 Haskell 的其中一个目的是为新芯片 LPU 提供嵌入式领域特定汇编语言(assembly EDSL,汇编 EDSL) 这也是 Haskell 又一成功案例 Groq 创始人兼 CEO:Jonathan Ross 在创立 Groq 之前,Jonathan 启动了 Google 的张量处理单元 (TPU) 项目,这是一个 20% 的项目,他设计并实现了第一代 TPU 芯片的核心元素 Jonathan 接下来加入了 Google X 的快速评估团队,这是著名的“Moonshots factory”的初始阶段,他为 Google 的母公司 Alphabet 设计并孵化了新的 Bets (Units) Jonathan 师从纽约大学柯朗研究所的 Yann LeCun
今天本来设置播客节目关于shopping心理 早上看到一个关于AI mode的长帖挺好,做成了播客 插队推送😄 时间轴: 00:00:11 节目开始:洞见无界 00:00:17 Google I/O 2025 专家资料分享:最新AI模式及其运作 00:00:35 AI模式对SEO的潜在巨大变革 00:00:51 SEO社群对AI变革的看法与资料作者的担忧 00:01:15 本集任务:拆解Google AI模式、与传统搜寻差异、及「后SEO时代」的准备 00:01:37 传统资讯检索 (IR) vs. 生成式IR:内容呈现的根本差异 00:02:31 为何认为AI模式「只是SEO」是短视且危险的? 00:03:02 SEO业界尚未普遍实践的AI优化技术 (如段落嵌入、语意相似度计算) 00:03:50 SEO的演变:从关键字到「反应性支架」及其裂痕 00:04:56 AI模式的五大关键断裂点:推理模型、查询扇出、段落级检索、深度个人化、零点击增加 00:06:38 Google目标转变:从导入流量到直接满足使用者需求 00:07:16 AI如何「替你Googling」降低使用者「德尔菲成本」 00:08:18 基础SEO仍是入场券,但AI模式加入更多不可控因素 (推理、记忆、个人背景) 00:09:33 多模态(Multimodal)搜寻的影响:竞争对手不再局限于文本 00:10:40 SEO过时?「代理人体验 (Agent Experience, AX)」时代来临 00:11:41 深入剖析AI模式运作核心流程 (参考Google专利) 00:12:09 核心概念一:状态聊天搜寻 (Search with Stateful Chat) - 持续性使用者脉络 00:13:13 核心概念二:查询扇出 (Query Fan-out) - 合成查询与自订语料库 00:14:26 核心概念三:多阶段LLM处理与合成 - 特制化模型各司其职 00:15:57 核心概念四:密集检索与段落级语意 - 向量嵌入与语意相似度 00:16:57 核心概念五:成对排序提示 (Pairwise Ranking Prompting) - LLM辅助排序 00:17:54 核心概念六:环境记忆与自适性介面 - 长期记忆与动态UI 00:18:39 核心概念七:使用者嵌入个人化 - 模组化深度个人化的核心 00:20:08 详解「查询扇出」:如何透过提示词生成多样化合成查询 00:21:06 合成查询的类型与过滤机制 (包含思维链提示) 00:22:54 AI的「推理能力」:中间推理步骤与推理链 (Reasoning Chain) 00:25:05 应对之道:「关联性工程 (Relevance Engineering, r17g)」概念 00:26:06 r17g策略:影响使用者嵌入、段落级语意优化、预测合成查询、三重清晰度 00:27:05 内容建构的四大策略支柱详解 00:27:21 支柱一:符合推理目标 (独立完整语意、明确论点) 00:28:05 支柱二:兼容查询扇出 (明确命名实体、反映使用者意图) 00:29:01 支柱三:值得引用 (事实性、可验证、量化数据、注明来源) 00:29:40 支柱四:易于组合 (列表、项目符号、答案优先、FAQ、语意化HTML) 00:30:54 Qforia工具介绍:模拟查询扇出与潜在合成查询 00:32:00 现有SEO工具的不足与未来软体的「十大新需求」 00:32:46 需求1-2:GSC AI介面指标、基于人设的排名追踪 00:33:30 需求3-5:网路向量嵌入数据、矩阵式语意编辑器、查询旅程分析 00:34:39 需求6-8:个人化检索模拟、精准查询分类、查询扩展模拟 00:35:35 需求9-11:整合点击流数据、推理链模拟、基于关联性的连结图谱 00:37:07 对企业整体搜寻策略的意义:结构性转变 00:37:32 策略转变一:重新分类搜寻频道,KPI转向AI介面声量与影响力 00:38:18 策略转变二:关联性建设视为组织能力,打造跨部门r17g团队 00:38:46 策略转变三:「后点击时代」将情报运营化,投资新基础设施 00:39:54 结论:催生全新企业功能「关联性策略」 00:40:00 AI模式深度重塑搜寻样貌,对数位行销的根本性挑战 00:40:30 产业人员的转型:从战术性优化到战略性协调,「关联性工程师」的崛起 00:41:00 给听众的思考题:你和你的组织准备好迎接变革了吗? 00:41:27 结语与感谢收听
彭博社深度文章《DeepSeek创始人梁文锋:颠覆AI世界的技术狂人》对DeepSeek创始人进行了深度报道,看看严肃媒体怎么报道DeepSeek的,而不是简单的看看Google Trend来判断AI的发展😃 神秘的"老板" 梁文锋身材瘦削,性格内敛,在会议中常显害羞甚至紧张。但员工们很快明白,不能将他的沉默误认为胆怯。一旦理解讨论细节,这位DeepSeek创始人就会提出精准且难以回答的技术问题。 员工称他"老板",不同寻常的是他赋予年轻研究员甚至实习生承担大型项目的权力,亲自了解进展并鼓励创新。"他是个真正的技术宅,"一位前员工说,"有时我觉得他比研究员更懂研究。" 震撼全球的突破 2025年1月,梁文锋的团队发布了R1模型,在多项AI测试中击败西方竞争对手,而DeepSeek声称构建成本仅为GPT-4的约5%。这一结果引发美国市场万亿美元抛售,并质疑美国出口管制策略的有效性。 亚马逊和微软竞相将DeepSeek模型加入云服务。负责亚马逊语言模型市场的Atul Deo表示:"基本上就在一个周末,我们迅速采取了行动。" 中国AI生态的崛起 DeepSeek揭开了中国AI发展的面纱。在杭州等高科技中心,众多"AI小龙"已涌现:MiniMax、Moonshot AI等本土初创公司的聊天机器人迅速走红;阿里巴巴的Qwen系列模型在全球排行榜名列前茅;百度CEO李彦宏夸口能开发出更低成本的同等模型。 不久前,中共还在"修剪"科技行业,如今面对外国干涉,正扶持国内科技产业。习近平调集资源投入AI和半导体领域,呼吁建立"自主可控"的生态系统。 创新源于约束 地缘政治限制反而推动了中国的进步。Counterpoint分析师Wei Sun表示,中美AI差距现在以月而非年计算。"英伟达芯片的强制稀缺催生了新的AI创新,产生了达尔文式压力:只有能用更少资源做更多事情的人才能生存。" 从量化交易到AI革命 梁文锋在浙江大学学习技术,毕业后构建量化交易系统赚取财富,2015年与朋友创立幻方量化。早期招聘寻找《生活大爆炸》中谢尔顿式的"古怪才华",营造神秘感的同时保持透明度。 2019年,梁文锋开始为AI部门招募人才。到疫情初期,团队已构建高性能计算集群,采购了1000块英伟达2080Ti芯片和100块Volta GPU。这位前工程师称梁文锋是集群的"单一最大用户",痴迷深度学习如"昂贵的爱好"。 稀疏性技术的突破 2023年春天,梁文锋将DeepSeek分拆为独立实验室。他大力押注稀疏性技术——将大型语言模型分解为专业领域来更高效运行。虽然复杂,但能极大节省计算成本。 团队设计了具有更多"专家"的模型,只激活与特定提示相关的部分,而非整个模型。这引发内部激烈辩论,但最终取得突破。 开源哲学的力量 梁文锋将开源视为理念核心。他认为隐藏技术并收费的美国模式优先考虑短期优势,而非持久成功。让模型完全开放并基本免费,能加速普及并让其他人基于其技术构建。正如DeepSeek引用Linux发明者的话:"空谈误国,代码拿来。" 中国硅谷的崛起 在杭州这个1250万人口的城市,DeepSeek属于"六小龙"顶尖科技群体。西湖区有《黑神话:悟空》的游戏科学公司,有机器人巨头,还有中国版Neuralink的BrainCo。"基本上他们不缺钱,"一位基金经理说,"人们都在向他们砸钱。" 阿里巴巴承诺三年投资530亿美元建设AI数据中心,其Qwen3模型可与DeepSeek相媲美。马云在公司园区重新出现,表示希望AI服务而非凌驾于人类。 人才回流与民族自豪 顶尖中国工程师开始从硅谷回国。亚洲集团董事总经理乔治·陈表示:"硅谷对中国人才不再有吸引力,真正的行动重心可能正向东方转移。" 创始人李开复更进一步:"这些年轻的AI工程师基本是本土培养的。DeepSeek的成功正激励更多年轻人才参与中国的AI复兴。" 神秘低调的领导者 梁文锋把时间分配在杭州和北京办公室间,很少同意与外界会面,有时甚至以全息投影形式出现。他拒绝了巴黎AI峰会邀请,该活动吸引了OpenAI的Altman、谷歌CEO等重量级人物。 游客和网红涌向DeepSeek总部寻找梁文锋踪迹,当地火锅店女主人不得不告诉他们"他从不光顾"。 争议与质疑 美国批评者指责DeepSeek受中共控制,窃取训练数据,参与间谍活动。众议院委员会称其为"美国科技流入中共监控国家的直接管道"。 但DeepSeek将自己呈现为普通初创公司,称是"纯粹车库精神"的产物。Alpha Intelligence Capital合伙人Arnaud Barthelemy说:"AI界没有预料到DeepSeek,但他们本应预料到的。" 成本之谜 关于DeepSeek的真实成本存在争议。美国SemiAnalysis估计其可能拥有价值14亿美元的5万块英伟达GPU集群,包括被禁的H100芯片。但三名前员工强烈否认,称GPU不到2万块,主要是较旧芯片。 "如果我拥有数万块H系列GPU,我可能也会变得浪费,"一位前员工说。但中国技术专家愿意应对资源限制的挑战:"想看看我们能取得什么成就吗?" 正如英伟达CEO黄仁勋2023年所言:"一无所有的人会以令人惊讶的方式做出反应。"DeepSeek的崛起,正是这种反应的最佳诠释。