时政
财经
科技
登录
#预训练知识
关注
马东锡 NLP 🇸🇪
3个月前
大语言模型 post-training 的变迁,从 Large Language Model (LLM) 到 Large Reasoning Model (LRM) 本周推荐论文:POST-TRAINING OF LARGE LANGUAGE MODELS Post-training,本质是在做一件事,即如何运用 LLM 的 pretrained knowledge 来解决实际任务,具体的方法如 supervised fine-tuning(SFT)、instruction tuning 以及 reinforcement learning(RL)。
#大语言模型
#后训练
#Large Language Model
#Large Reasoning Model
#POST-TRAINING
#预训练知识
分享
评论 0
0
个人主页
通知
我的投稿
我的关注
我的拉黑
我的评论
我的点赞