𝙩𝙮≃𝙛{𝕩}^A𝕀²·ℙarad𝕚g𝕞
1周前
分布覆盖限制的突破更可能来自哪里? 我倾向于认为不是来自这两个方向都不,原因如下: 更大的模型可能会在某个临界规模下表现出更好的外推能力,但没有证据表明这已经发生。大模型的涌现能力似乎更多关于表达范围(能做更复杂的推理),而不是分布外泛化。 更多样化的分布可能会产生"涌现的假象"——模型不是学会了泛化,而是学会了一个更高维的插值空间。你走过的路越多,看起来走过的地方就越多,但那不是"可以走到任何
ruanyf
2个月前
上周,GitHub 的高级工程师肖恩·戈德克(sean goedecke)发了一篇文章《我所知的良好的系统设计》。 读完后,我觉得写得不错。他总结经验,教大家设计一个良好的系统,不是空泛之谈。下面是我的一些摘录。
NanYi
4个月前
iOS 26的更新,把系统里所有的搜索框都移到底部了,也算设计统一了😂