Boywus 0 关注者 关注 7小时前 大模型天生只输出“主流共识内容”,不会给你输出“非经典的创新内容”,所以最适合“跨领域基础知识对齐”,别让它给你直接搞一个某领域的“局部最优解方案”。 根本原因就是,输入层的“训练语料”的数据源就是“幂律分布”的,主流内容占比非常高;输出层又是个概率模型,输出“下一个最可能出现的词”,导致更倾向于输出“主流共识内容”。 如果问题的答案主要来自“公开语料中的稳定规律”,就适合LLM,比如 通用知 #大模型 #主流共识 #输入层 #幂律分布 #输出层 #概率模型 #稳定规律 #公开语料 前往原网页查看