马东锡 NLP 🇸🇪2025-03-17 07:10:45大语言模型 post-training 的变迁,从 Large Language Model (LLM) 到 Large Reasoning Model (LRM) 本周推荐论文:POST-TRAINING OF LARGE LANGUAGE MODELS Post-training,本质是在做一件事,即如何运用 LLM 的 pretrained knowledge 来解决实际任务,具体的方法预览#大语言模型#后训练#POST-TRAINING
马东锡 NLP 🇸🇪2025-03-16 07:07:32从 Chain of Thought 到 aha moment和wait,看大模型的 test time scaling和深度思考 大模型们在过去的一年,都有了自己的deep search, think, reasoning, 深度思考...等关键词或者产品。 作为NLP从业者,我都会禁不住问自己,这都是些啥...😅今天就来解读这个问题,这些产品的所有本质,来自一个学术词汇,即test time预览#深度思考#大模型#NLP