#Qwen

最近几周,一种微妙的变化变得越来越明显。过去几个月来一直流传着低成本的、开源的中国人工智能模型可能会将全球用户从美国产品中吸引走的猜测。但现在看来,它们也在悄悄地赢得硅谷的青睐。 风险投资家查玛斯·帕利哈皮蒂亚最近在他的有影响力的《全力以赴》播客上——由白宫人工智能负责人大卫·萨克斯共同主持——表示,他合作的一家公司已经将主要工作负载转移给了北京 Moonshot AI 开发的 Kimi K2。他说,这个开源模型“坦白说比 OpenAI 和 Anthropic 便宜得多。” 不久之后,爱彼迎公司首席执行官布莱恩·切斯基承认,他没有将他的旅行应用与 OpenAI 的 ChatGPT 集成,因为连接工具还没“完全准备好”。切斯基表示,爱彼迎的新服务代理依赖于十多种不同的 AI 模型,他们“很大程度上”依赖于阿里巴巴集团的 Qwen 系列:“它非常好。它也很快速且便宜。”考虑到切斯基与 OpenAI 首席执行官萨姆·奥特曼的密切个人关系,他的评论尤其引人注目。 公开承认的名单正在不断增长。由 OpenAI 前首席技术官 Mira Murati 创立的 Thinking Machines Lab 在博客文章中表示,其最新研究灵感来源于并建立在阿里巴巴 Qwen3 团队的工作之上。 但可能更有趣的是这种转变似乎正在以更微妙的方式扎根。备受瞩目的 AI 编程领导者 Cursor,一家估值约 100 亿美元的科技公司,上个月发布了其助手的新版本。此后,互联网上开始流传一种说法,称其是基于像 DeepSeek 这样的中国 AI 工具构建的,一位科技投资者在 X 平台上指出,在他使用该工具时,其内部对话切换到了普通话。 另一家估值约 100 亿美元的美国公司 Cognition AI Inc.,似乎也是基于智谱 AI(国际名为 )的基础模型构建了其新的编程代理。在社交媒体侦探发布相关怀疑后,这家北京-based 公司似乎在一篇推文中确认了他们的发现,称其“突出了开源贡献对生态系统的积极影响和价值”。这两家美国公司没有立即回复我发去的评论请求。但中国 AI 模型的宽松许可性质意味着公司可以自由在其上构建产品。 由支持开源 AI 的美国联盟项目整理的 Hugging Face 平台数据显示证实了这一点。中国模型在开发者累计下载量方面已超过美国。这一转变起初缓慢,随后突然发生:2024 年初,Meta Platforms Inc.的 Llama 有 1060 万次下载,而阿里巴巴 Qwen 仅有 50 万次。到上个月,Qwen 的累计下载量已达 3853 万次,相比之下 Llama 为 3462 万次。基于 Qwen 构建的衍生系统现在占 Hugging Face 上发布的新语言模型的 40%以上,而 Meta 的份额已降至 15%。
Rainier
1个月前
中国的做法,其实让市场竞争变得更加激烈。 一个产品的利润,往往来自几个部分——软件,以及硬件的租赁。在过去,美国的科技公司利润主要来自软件,硬件租赁只是小头。而从边际成本来看,软件的成本要低得多。软件靠什么赚钱?靠算法和工程实现。 比如,OpenAI 是最早发现通过强化学习(RL,比如 GPRO)可以产生“涌现”现象的公司,然后他们悄悄地把这一技术用于自家产品。从商业角度看,这是完全合理的做法——既降低了成本,又提升了效果,还能与竞争对手拉开差距,提高自家模型的“token 内在价值”,缩短盈利周期。 这就像打游戏一样,OpenAI 打开宝箱抽出了一把 AK47,而其他玩家手里还拿着砍刀。 但搅局者出现了——DeepSeek 发布了一系列论文,开源了模型,相当于直接给所有玩家都发了一把 AK47。 最近,DeepSeek 又推出了 DeepSeek OCR,在极低成本下实现高效识别,计算量可降低 90%。这项技术谷歌可能也早已掌握,但 DeepSeek 却直接“发给大家一枚 RPG 火箭筒”。 结果就是,其他玩家的盈利之路变得更加艰难。 那为什么 OpenAI、Gemini 等公司不怎么开源?因为一旦开源,就会削弱它们在 AI 软件领域的利润空间。 那中国企业为什么要这样做? 因为它们在这个领域中是“追赶者”,开源能削弱领跑者的优势,有利于它们在合适的时机实现反超。 而在中国的开源模型中,表现最突出的就是阿里推出的 Qwen。阿里本身就有硬件租赁和云计算平台业务,因此在 Qwen 上投入研发,是一笔算得过的账。