分布覆盖限制的突破更可能来自哪里？我倾向于认为不是来自这两个方向都不，原因如下：更大的模型可能会在某个临界规模下表现出更好的外推能力，但没有证据表明这已经发生。大模型的涌现能力似乎更多关于表达范围（能做更复杂的推理），而不是分布外泛化。更多样化的分布可能会产生"涌现的假象"——模型不是学会了泛化，而是学会了一个更高维的插值空间。你走过的路越多，看起来走过的地方就越多，但那不是"可以走到任何

#模型外推能力 #任务表示学习 #元学习算法 #分布内泛化 #系统设计

相关新闻

Larry & Leo Bro - Eagle of Full Stack

3个月前

让 Gemini 3.0 Pro 和 Claude 4.5 battle 一个系统设计和修复方案，简直太爽了，真理越辩越明，哪怕是两个 AI,几轮下来，Claude 4.5 就被 Gemini 3.0 Pro 说服了。工程上，实际上都承认，Gemini 给的方案是靠谱的，符合实际的，KISS 的！太棒！我好喜欢

Barret李靖

4个月前

AI 编程不是让你变懒，而是让你更像一个系统设计者。Coding 的确变少了，但你在 Architecture & Orchestration（架构与编排）上，做得比过去任何时候都多。没有对代码的组织和结构化做设计，全靠 Vibe coding，项目是很难长大的。功能越多，越容易在后期陷入稳定性差、鲁棒性低、可维护性崩塌的泥潭。 AI 本身并不关心这些系统属性，这也意味着，如果人类不主动构

𝙩𝙮≃𝙛{𝕩}^A𝕀²·ℙarad𝕚g𝕞

4个月前

Pareto最优解：任何试图用单一系统解决这个问题的尝试，都会导致一个次优解（例如，要么系统过于僵化无法学习，要么系统过于敏感而无法稳定）。因此，将这两个功能分离到两个相互作用的子系统（一个负责稳定，一个负责适应）就成了唯一能够逼近Pareto最优的架构。这不再是一个设计选择，而是一个在物理约束下的必然涌现。

宝玉

5个月前

Vibe Coding 最佳实践之原型开发法： 1. 第一版只做原型，不考虑设计、性能、安全性、代码质量这些，只考虑实现功能。这一版的重点是快速实现功能，确认需求，把一些需求上模糊的地方具体化。技术上追求跑通。这一版的代码是抛弃型的，不做后续使用，完全 AI 主导。 2. 第二版重新设计在需求确定后，Scope 就明确了，更好做系统设计。数据库 Schema 的设计可以放在这时候来做，同

ruanyf

6个月前

上周，GitHub 的高级工程师肖恩·戈德克（sean goedecke）发了一篇文章《我所知的良好的系统设计》。读完后，我觉得写得不错。他总结经验，教大家设计一个良好的系统，不是空泛之谈。下面是我的一些摘录。