宝玉
2周前
陶哲轩:我有一个初步的看法:如今社会中的各种系统、激励机制和技术发展,轻微地增强了个人的能力,大幅地强化了大型组织的力量,却极大地挤压了小型组织的生存空间。在整个人类社会的生态系统中,小组织的角色越来越不重要,要么逐渐被边缘化,要么被大组织兼并或取代。 这种不平衡的社会结构,尽管给人们带来了物质上的舒适(尽管舒适程度分配并不公平),也给予人们一种有限的掌控感(agency),但在个人心理层面却造成了严重的后果。人们开始感到孤独、疏离、缺乏归属感,并产生了深深的无力感和对未来的悲观情绪。大部分人不相信自己能够影响未来或解决重大的挑战,除非通过激烈甚至残酷的竞争,让自己变得极其富有或有影响力,从而获得类似一个小型甚至大型组织才能拥有的社会地位。 而那些规模更大的组织,则在一定程度上填补了小型社区消失后留下的空白,它们向人们提供一些合成的社会或情感产品。然而,这些产品在真实性和亲密感上,就如同高度加工的“垃圾食品”与真正健康食物之间的差距一样巨大。因为大型组织天然带有一种冷漠和非个人化的特点,这一点在先进算法和人工智能(AI)时代尤为明显。更糟糕的是,如果任由这些技术自由发展,它们往往会进一步加剧上述负面趋势。
Y11
2周前
代码世界模型:构建更智能代码系统的新工具 代码世界模型 (CWM) 是一个拥有 320 亿个参数的开源语言模型。 它的目标是帮助研究人员构建不仅能生成代码,还能理解代码和命令如何影响计算机系统的人工智能系统。你可以把它想象成一个“数字侦探”,可以逐步追踪代码的行为,从而更好地解决复杂的编程问题。 CWM 包含哪些功能? - **模型权重**:提供三个版本——预训练版本(基于海量代码数据训练)、SFT 版本(针对特定任务进行微调)和指令调整版本(根据人类指令进行训练),开发者可以根据自身需求选择合适的版本。 - **技术细节**:一份详细的报告,解释 CWM 的构建过程、功能以及使用方法。 - **工具**:启动代码以运行模型,在标准基准测试中对其进行测试,并重现结果。基准测试包括验证代码正确性(SWE-bench Verified)、测试编码速度(LiveCodeBench)以及检查数学和推理能力(AIME、MATH)。 ### CWM 的工作原理 CWM 不仅仅是在代码上进行训练,它还能模拟*代码的行为*。关键在于: - **在训练过程中学习真实世界的行为**:它从数百万条 Python 执行轨迹以及代理如何与容器化系统交互(例如在隔离环境中运行代码)中进行学习。 这有助于它实时“看到”变量如何变化、函数如何运行以及错误如何发生。 - **在训练后进行真实世界任务**:之后,它使用强化学习 (RL) 在三个方面进行微调: - 可验证编码(以确保代码按预期运行)。 - 数学问题求解(因为编码通常需要数学逻辑)。 - 多轮软件工程(用于处理长时间、复杂的对话,例如与人类协作者进行调试)。
长文:新冷战的虚与实——中美科技对决的深层逻辑 关于中美科技竞争的新闻几乎每天都在上演,从芯片禁令到人工智能的突破,各种消息层出不穷,在许多人心中营造了一种普遍的焦虑与好奇。我们似乎正处在一场决定未来数十年全球格局的竞赛之中,但大部分讨论往往流于表面。 美国顶尖智库的最新专业研究报告,为我们剥开了层层迷雾,提供了一幅更清晰、更具洞察力的图景,帮助我们更深刻地理解这场博弈的本质。 1. 貌合神离的“专制轴心”? 当普京和金正恩站在天安门城楼上,似乎宣告了一个反西方“专制轴心”的形成,引发了世界的担忧。但深入分析便会发现,这个看似团结的联盟,其内部的裂痕远比外界想象的要深。 根据华府智库外交关系委员会的最新分析,中、俄、朝三国所谓的团结,更多是利益捆绑下的权宜之计,而非建立在共同价值观或深厚互信之上。 从历史上看,朝鲜战争的经历让平壤对北京始终心存芥蒂,他们认为中国在停战谈判中将自身利益置于首位。随后的中苏交恶,更是让中朝这两个邻国陷入长达数十年的地缘政治猜忌。金日成曾系统性地清除过国内的亲华派,而金正恩也处决了以亲华闻名的姑父张成泽。相互猜疑,而非信任,才是中朝关系的常态。 即便在当下,微妙的矛盾依然存在。为了维持在乌克兰的战事,莫斯科现在严重依赖平壤的弹药和军事支持,两国甚至签署了共同防御条约。普京在某种程度上已经超越习近平,成为金正恩最重要的伙伴——这无疑削弱了北京在朝鲜半岛问题上的主导权。北京对于俄朝之间可能涉及敏感军事技术转让的深度合作,内心充满了不安,因为它不希望在家门口出现一个无法控制的、新的动荡源头。 与此同时,俄罗斯情报机构内部,依然将中国视为潜在的“威胁”,并对其在远东地区的长期野心保持警惕。这种“貌合神离”的关系,意味着这个联盟的稳定性远不如其精心策划的团结场面那样牢固。 报告一针见血地指出,中、俄、朝的目标并不一致。莫斯科和平壤更倾向于扮演“颠覆者”的角色,而北京则希望在不彻底摧毁现有秩序的前提下,重塑一个对自己更有利的世界格局。中国的目标是削弱美国的影响力,但又不想完全切断与西方世界依然有利可图的经济联系。 2. 实力天平的倾斜:科技战的真实图景 许多人仍认为美国在科技上遥遥领先,但最新数据描绘了一幅截然不同的图景:在衡量创新能力的某些关键指标上,中国已经实现了反超。这不再是一个简单的追赶故事,而是一个实力天平已经开始倾斜的现实。 美国华盛顿特区的战略与国际研究中心(CSIS)的报告显示: 顶尖科研人员数量: 2020到2024年,中国从18,805人激增至32,511人,而美国则从36,599人降至31,781人。 高质量科研产出: 中国的“份额”达到32,122,显著超过美国的22,083。 人才储备: 预计到2025年,中国每年毕业的STEM(科学、技术、工程和数学)博士数量将是美国的近两倍。 中国的快速追赶,主要归功于举国体制的战略投入。与美国的研发经费更多来自高校和私营部门不同,2023年中国政府在科研上的直接支出是美国的1.5倍以上。 但在最尖端的人工智能领域,情况有所不同。虽然中国的国家实验室在计算机视觉等基础领域贡献良多,但真正的前沿突破,仍然由美国的私营公司主导。华盛顿的核心战术,就是通过严格限制中国获取高端GPU,来扼住其通往通用人工智能(AGI)的咽喉。 与美国追求“最顶尖”模型的策略不同,中国的AI战略更侧重于“低成本、大规模”的普及应用。这与当年华为在电信领域的打法如出一辙——利用国家补贴和成本优势,迅速占领全球市场,形成事实上的技术标准和市场依赖。北京正试图在机器人和其他AI应用上复制这一模式。 更重要的是,在中国的视角里,技术从来都不只是工具,更是强化社会治理和军事力量的延伸。当一项技术在美国被视为解放生产力的工具时,在中国则可能被优先用于加强控制。 哈德逊研究所的防务专家布莱恩·克拉克对此发出了严厉警告。他认为,未来十年,谁主导了具身智能(Embodied AI),谁就将拥有巨大的经济和军事优势。他敲响了历史的警钟:1938年,德国科学家发现了核裂变。次年,爱因斯坦便致信罗斯福总统,警告这项技术的致命潜力。如果当年是极权主义政权首先造出了原子弹,世界的命运将被改写。克拉克认为,与希特勒不同,习近平更理解革命性技术的军事潜力。 克拉克也承认,华盛顿的出口管制在很大程度上是成功的,使美国在芯片性能上保持了优势。但这背后也存在悖论:中国垄断了制造芯片所需的稀土(例如,英伟达芯片所需的“镝”,99.9%由中国供应),而中国发展人形机器人所需的高精度滚珠丝杠,又严重依赖西方。 他建议,美国必须采取更主动的“组合拳”:强化芯片出口管制、补贴本土机器人和电池制造商、禁止购买中国制造的关键AI组件,并加速稀土供应链的“去中国化”。 这不再是一场简单的技术竞赛,而是一场关乎两种体系、两种未来的零和博弈。每一个技术突破的背后,都隐藏着深刻的地缘政治逻辑。