时政
财经
科技
虚拟货币
其他
登录
#公开语料
关注
Boywus
8小时前
大模型天生只输出“主流共识内容”,不会给你输出“非经典的创新内容”,所以最适合“跨领域基础知识对齐”,别让它给你直接搞一个某领域的“局部最优解方案”。 根本原因就是,输入层的“训练语料”的数据源就是“幂律分布”的,主流内容占比非常高;输出层又是个概率模型,输出“下一个最可能出现的词”,导致更倾向于输出“主流共识内容”。 如果问题的答案主要来自“公开语料中的稳定规律”,就适合LLM,比如 通用知识问答,新闻解读等。 如果问题的答案主要来自“私有反馈环中的局部试错”,就不能指望LLM直接给最优解,比如量化交易等等。
#大模型
#主流共识
#输入层
#幂律分布
#输出层
#概率模型
#稳定规律
#公开语料
分享
评论 0
0
个人主页
通知
我的投稿
我的关注
我的拉黑
我的评论
我的点赞