2025-06-01 16:34:49
彭博社深度文章《DeepSeek创始人梁文锋:颠覆AI世界的技术狂人》对DeepSeek创始人进行了深度报道,看看严肃媒体怎么报道DeepSeek的,而不是简单的看看Google Trend来判断AI的发展😃 神秘的"老板" 梁文锋身材瘦削,性格内敛,在会议中常显害羞甚至紧张。但员工们很快明白,不能将他的沉默误认为胆怯。一旦理解讨论细节,这位DeepSeek创始人就会提出精准且难以回答的技术问题。 员工称他"老板",不同寻常的是他赋予年轻研究员甚至实习生承担大型项目的权力,亲自了解进展并鼓励创新。"他是个真正的技术宅,"一位前员工说,"有时我觉得他比研究员更懂研究。" 震撼全球的突破 2025年1月,梁文锋的团队发布了R1模型,在多项AI测试中击败西方竞争对手,而DeepSeek声称构建成本仅为GPT-4的约5%。这一结果引发美国市场万亿美元抛售,并质疑美国出口管制策略的有效性。 亚马逊和微软竞相将DeepSeek模型加入云服务。负责亚马逊语言模型市场的Atul Deo表示:"基本上就在一个周末,我们迅速采取了行动。" 中国AI生态的崛起 DeepSeek揭开了中国AI发展的面纱。在杭州等高科技中心,众多"AI小龙"已涌现:MiniMax、Moonshot AI等本土初创公司的聊天机器人迅速走红;阿里巴巴的Qwen系列模型在全球排行榜名列前茅;百度CEO李彦宏夸口能开发出更低成本的同等模型。 不久前,中共还在"修剪"科技行业,如今面对外国干涉,正扶持国内科技产业。习近平调集资源投入AI和半导体领域,呼吁建立"自主可控"的生态系统。 创新源于约束 地缘政治限制反而推动了中国的进步。Counterpoint分析师Wei Sun表示,中美AI差距现在以月而非年计算。"英伟达芯片的强制稀缺催生了新的AI创新,产生了达尔文式压力:只有能用更少资源做更多事情的人才能生存。" 从量化交易到AI革命 梁文锋在浙江大学学习技术,毕业后构建量化交易系统赚取财富,2015年与朋友创立幻方量化。早期招聘寻找《生活大爆炸》中谢尔顿式的"古怪才华",营造神秘感的同时保持透明度。 2019年,梁文锋开始为AI部门招募人才。到疫情初期,团队已构建高性能计算集群,采购了1000块英伟达2080Ti芯片和100块Volta GPU。这位前工程师称梁文锋是集群的"单一最大用户",痴迷深度学习如"昂贵的爱好"。 稀疏性技术的突破 2023年春天,梁文锋将DeepSeek分拆为独立实验室。他大力押注稀疏性技术——将大型语言模型分解为专业领域来更高效运行。虽然复杂,但能极大节省计算成本。 团队设计了具有更多"专家"的模型,只激活与特定提示相关的部分,而非整个模型。这引发内部激烈辩论,但最终取得突破。 开源哲学的力量 梁文锋将开源视为理念核心。他认为隐藏技术并收费的美国模式优先考虑短期优势,而非持久成功。让模型完全开放并基本免费,能加速普及并让其他人基于其技术构建。正如DeepSeek引用Linux发明者的话:"空谈误国,代码拿来。" 中国硅谷的崛起 在杭州这个1250万人口的城市,DeepSeek属于"六小龙"顶尖科技群体。西湖区有《黑神话:悟空》的游戏科学公司,有机器人巨头,还有中国版Neuralink的BrainCo。"基本上他们不缺钱,"一位基金经理说,"人们都在向他们砸钱。" 阿里巴巴承诺三年投资530亿美元建设AI数据中心,其Qwen3模型可与DeepSeek相媲美。马云在公司园区重新出现,表示希望AI服务而非凌驾于人类。 人才回流与民族自豪 顶尖中国工程师开始从硅谷回国。亚洲集团董事总经理乔治·陈表示:"硅谷对中国人才不再有吸引力,真正的行动重心可能正向东方转移。" 创始人李开复更进一步:"这些年轻的AI工程师基本是本土培养的。DeepSeek的成功正激励更多年轻人才参与中国的AI复兴。" 神秘低调的领导者 梁文锋把时间分配在杭州和北京办公室间,很少同意与外界会面,有时甚至以全息投影形式出现。他拒绝了巴黎AI峰会邀请,该活动吸引了OpenAI的Altman、谷歌CEO等重量级人物。 游客和网红涌向DeepSeek总部寻找梁文锋踪迹,当地火锅店女主人不得不告诉他们"他从不光顾"。 争议与质疑 美国批评者指责DeepSeek受中共控制,窃取训练数据,参与间谍活动。众议院委员会称其为"美国科技流入中共监控国家的直接管道"。 但DeepSeek将自己呈现为普通初创公司,称是"纯粹车库精神"的产物。Alpha Intelligence Capital合伙人Arnaud Barthelemy说:"AI界没有预料到DeepSeek,但他们本应预料到的。" 成本之谜 关于DeepSeek的真实成本存在争议。美国SemiAnalysis估计其可能拥有价值14亿美元的5万块英伟达GPU集群,包括被禁的H100芯片。但三名前员工强烈否认,称GPU不到2万块,主要是较旧芯片。 "如果我拥有数万块H系列GPU,我可能也会变得浪费,"一位前员工说。但中国技术专家愿意应对资源限制的挑战:"想看看我们能取得什么成就吗?" 正如英伟达CEO黄仁勋2023年所言:"一无所有的人会以令人惊讶的方式做出反应。"DeepSeek的崛起,正是这种反应的最佳诠释。
2025-06-01 16:34:49
2025-06-01 16:11:48
2025-06-01 15:17:57