#预训练知识

马东锡 NLP 🇸🇪

1年前

大语言模型 post-training 的变迁，从 Large Language Model (LLM) 到 Large Reasoning Model (LRM) 本周推荐论文：POST-TRAINING OF LARGE LANGUAGE MODELS Post-training，本质是在做一件事，即如何运用 LLM 的 pretrained knowledge 来解决实际任务，具体的方法如 supervised fine-tuning（SFT）、instruction tuning 以及 reinforcement learning（RL）。

#大语言模型 #后训练 #Large Language Model #Large Reasoning Model #POST-TRAINING #预训练知识