时政
财经
科技

#后训练

马东锡 NLP 🇸🇪
马东锡 NLP 🇸🇪
2025-03-17 07:10:45

大语言模型 post-training 的变迁,从 Large Language Model (LLM) 到 Large Reasoning Model (LRM) 本周推荐论文:POST-TRAINING OF LARGE LANGUAGE MODELS Post-training,本质是在做一件事,即如何运用 LLM 的 pretrained knowledge 来解决实际任务,具体的方法

#大语言模型#后训练#POST-TRAINING
没有更多了 🤐