orange.ai
7个月前
Hugging Face 的 Co-Founder 的回应:开源不分国界 最后花了一些时间阅读 Dario 关于 DeepSeek 和出口管制的文章,说实话,读起来很痛苦。我是 Anthropic 的忠实粉丝和 Claude* 的忠实用户,所以我这么说。 文章的前半部分读起来像是在长篇大论地试图证明闭源模型仍然远远领先于 DeepSeek。然而,它主要指的是内部未发表的评估,这限制了你可以给予它的荣誉,而像“DeepSeek-V3 接近 SOTA 模型,并且在一些非常狭窄的任务上表现更强”这样的陈述,转变为一个普遍的结论“DeepSeek-V3 实际上比那些美国前沿模型更差——在缩放曲线上可以说差了约 2 倍”,这让我总体上持怀疑态度。同样适用于 DeepSeek 的所有发现和效率改进都是很久以前由闭源模型公司发现的结论,这一说法主要源于将 DeepSeek 公开发布的 600 万美元训练数字与 Anthropic 方面一些模糊的“几千万美元”进行比较,而没有提供更多细节。我毫不怀疑 Anthropic 团队非常有才华,我也经常分享我对 Sonnet 3.5 的印象,但这种将开放研究与模糊的封闭研究和未公开的评估进行冗长的比较,让我对他们的领先地位的信心不如在阅读之前了。 更令人沮丧的是,文章的后半部分深入探讨了中美竞赛的情况,却完全忽略了 DeepSeek 模型是开放权重的,并且由于其详细的技术报告而在很大程度上是开放知识的(请随时关注 Hugging Face 的 open-r1 复制项目,了解剩余的非公开部分:合成数据集)。如果 DeepSeek 和 Anthropic 模型都是闭源的,那么军备竞赛的解释可能有意义,但在我看来,其中一个模型可以自由广泛下载并附有详细的科学报告,这使得整个“闭源军备竞赛”论点变得虚假且难以信服。 事实是这样的:开源不分国界。无论是其使用还是其创造。 现在,世界上的每家公司,无论是欧洲、非洲、南美还是美国,都可以直接下载和使用 DeepSeek,而无需将数据发送到特定国家(例如中国)或依赖特定公司或服务器来运行其技术的核心部分。 就像世界上大多数开源库都是由来自世界各地的贡献者构建的一样,我们已经看到 Hugging Face 中心上有数百个衍生模型,这些模型是由世界各地的团队根据其特定的用例和探索调整原始模型而创建的。 此外,随着 open-r1 复刻版和 DeepSeek 论文的发布,未来几个月将明显看到来自世界各地的团队发布大量开源推理模型。就在今天,另外两支团队,西雅图的 AllenAI 和巴黎的 Mistral 都各自发布了开源基础模型(Tülu 和 Small3),这些模型已经在挑战新的最先进水平(AllenAI 表示其 Tülu 模型超越了 DeepSeek-V3 的性能)。 而且其范围远不止地理方面。我们谈论得还不够:开源对我们的安全将越来越重要! 随着人工智能成为我们生活的中心,弹性将日益成为这项技术的一个非常重要的元素。今天,我们几乎一切都依赖互联网。没有互联网,我们就会失去所有的社交媒体/新闻源,无法叫出租车、预订餐厅,也无法在 WhatsApp 上联系到某人。现在想象一下我们的另一个世界,所有通过互联网传输的数据都必须经过一家公司的数据中心。这家公司发生一次中断的那一天,整个世界基本上都会停止运转(想象一下最近的 CrowdStrike 中断,其规模扩大了一百万倍)。 很快,随着人工智能助手和人工智能技术渗透到我们的整个生活,简化我们的许多线上和线下任务,我们(以及使用人工智能的公司)将开始更多地依赖这项技术来完成我们的日常活动,同样,我们也会开始发现这些人工智能助手因中断而导致的宕机令人烦恼甚至痛苦。 避免未来出现停机情况的最佳方法是在我们的技术链深处构建弹性。 开源有很多优势,比如共享训练成本、可调性、控制、所有权、隐私,但从长远来看,随着人工智能深深植根于我们的世界,其最基本的优点之一可能是其强大的弹性。它是最直接、最具成本效益的方法之一,可以轻松地在许多独立提供商之间分配计算,甚至可以以最小的复杂性在本地和设备上运行模型。 我认为,除了国家自豪感和竞赛之外,现在是时候开始从全球角度思考人工智能将给世界各地带来的挑战和社会变革了。开源技术可能是我们安全过渡到弹性数字未来最重要的资产,在这个未来中,人工智能将融入社会的各个方面。 *Claude 是我在复杂编码方面的默认 LLM。我也喜欢它的犹豫和思考特征,就像 DeepSeek 等较新的推理模型的思路链的前奏。 原文
orange.ai
8个月前
最近一年都在思考一人公司、自媒体、品牌之间的关系,今天刚好看到一位海外大佬的视频在聊这些话题,他的视角最接近我的观察,现在把笔记分享给大家。 一人公司的本质,是在社交媒体构建自己的个人品牌 首先,要明白一人公司的含义 人类社会的默认结构是金字塔型的。 十个人的团队,一个主管。 剩下九个人未来的出路在哪里? 你沿着社会的默认路径行走, 直到有一天你开始厌恶自己的工作。 你终于决定开始你自己的事情。 There are almost 7B people on this planet. Someday, I hope, there will be almost 7B companies. 这个星球上有70亿人。 我希望,有一天,这个星球上也会有70亿家公司。 ——纳瓦尔 一人公司并不是真的只靠自己一个人。 而是通过建立自己的个人品牌,解决自己的问题。 最好的企业改变生活,而这种改变本身的就是成功的产品。 停止去解决想象中的问题,去解决你自己的问题,改变自己的生活。 将改变的方法打包,贴上价格标签去卖掉它。 如果这个方法解决了你自己的问题,你大概率也能成功卖掉这个方法。 大佬们的愿景是去火星,很多地球上的问题他们并没有关注。 这就是你的机会。 通过塑造个人品牌学习真正的知识 你自己就是一个品牌。 每个品牌都在雇佣别人,来增强自己的品牌。 做好自己的品牌,你就可以把成功的经验应用到其他品牌上。 你不需要有一个企业,你只需要一个社交媒体账号。 一个为社区做贡献的账号。 社交媒体是一个公开的求职板、公立学校、公开的笔记系统、公开的聚会。 你可以在这里找到朋友,培养业务伙伴。 通过建立自己的品牌,你就是在积累真正实用的知识。 如果有一天你要打工,这些知识也是你真正的价值所在。 四个永恒的市场 这个星球上有四个永恒的市场: 健康、财富、人际关系、幸福。 要在这四个市场里选择你的领域。 对于大部分人来说,首先遇到的问题,是没有自己的兴趣。 那你真的需要停下脚步,找到自己的兴趣点。 健康,跑步,健身,瑜伽,保健品。 财富,投资,理财,基金,股票,比特币。 人际关系,社交,聚会,约会,婚姻,家庭。 幸福,心理健康,兴趣爱好,持续学习,自我实现。 在社交媒体建立个人品牌的三个路径: 1.学一招,卖一招,现学现卖。 2.成为你的兴趣领域的价值创造者 3.为了建立你的个人品牌,你要被迫去学习很多事情。写作、演讲、交流、营销。 去打造自己的个人品牌,在这个过程中你会真正知道哪些知识是有用的,哪些知识是没用的。 你有了对自己品牌的成功经验,你就可以开始帮助他人,并且开始收费。 在这个过程中问自己的几个问题: 最令你兴奋的兴趣是什么? 在打造个人品牌的过程中,你最喜欢做的事情是什么,是做设计、还是营销、还是开发? 你拿什么去售卖。你可以售卖的东西,一定是你已经在该领域内取得了结果。 品牌,讲一个故事 内容,画一张地图 产品,做一个游戏 一人公司的四大支柱: 1. 品牌,你就是利基市场,你的人生目标,你的愿景。你将带领人们走向何方。带领人们做一些事情,这是获得追随者的方式。 2.内容,记录你的想法。社交媒体是一个公共的笔记系统,他记录了:你在学习什么知识以及如何在生活中应用这些知识 你对自己技能和兴趣的想法的意见 在人生故事中你所收获的教训 但你不能只是记录,你必须朝着一个目标迈进,就是建立你自己的个人品牌 3.产品,公开的个人项目。学习营销技巧,拿到健身成果,之后你就可以谈论它,你会在往上被人挑战,你就得被迫去学习。然后你就可以去教别人。 4.市场营销,去出售你自己 self promoting。你不去做这个,你甚至就没给自己获得成果或金钱的机会。 营销的起点是你要关注你的受众,他们需要什么,把他们的需要放在首位。 最初你对他们提的问题是:我很感兴趣你正在做什么项目。你遇到了什么问题?还没有实现目标的卡点是什么? 你问的时候不要把自己变成机器人,应该像跟朋友聊天那样。 人们喜欢真实。 开始行动 停滞,就是死亡。 行动,才是活着。