#公开语料

8小时前

大模型天生只输出“主流共识内容”，不会给你输出“非经典的创新内容”，所以最适合“跨领域基础知识对齐”，别让它给你直接搞一个某领域的“局部最优解方案”。根本原因就是，输入层的“训练语料”的数据源就是“幂律分布”的，主流内容占比非常高；输出层又是个概率模型，输出“下一个最可能出现的词”，导致更倾向于输出“主流共识内容”。如果问题的答案主要来自“公开语料中的稳定规律”，就适合LLM，比如通用知识问答，新闻解读等。如果问题的答案主要来自“私有反馈环中的局部试错”，就不能指望LLM直接给最优解，比如量化交易等等。

#大模型 #主流共识 #输入层 #幂律分布 #输出层 #概率模型 #稳定规律 #公开语料