大语言模型 post-training 的变迁，从 Large Language Model (LLM) 到 Large Reasoning Model (LRM) 本周推荐论文：POST-TRAINING OF LARGE LANGUAGE MODELS Post-training，本质是在做一件事，即如何运用 LLM 的 pretrained knowledge 来解决实际任务，具体的方法

#大语言模型 #后训练 #Large Language Model #Large Reasoning Model #POST-TRAINING #预训练知识

相关新闻

howie.serious

1个月前

“prompt engineering”与“大词可厌” --- 对于非开发者来说，80%的prompt 其实都是一件事：和llm对话。所谓“prompt engineering”，其实就是结构化表达，表达清楚自己的想法和需求。在llm出现之前，人们就一直在说话。只要一个人有结构化表达、费曼式表达的意识，能把自己的想法或需求说出来，说清楚，那ta一定能善用llm。过度推崇“prompt en

YC (Yucheng Liu)

2个月前

过去我一直建议中英文推特要分号运营，避免算法混淆。但随着 X 平台新的大语言模型驱动的推荐和自动翻译机制，我的看法正在改变。如果算法真的能实现“语言无关”的内容分发，这将是“影响力出海”的巨大机遇。真正的“你”，将能无缝连接全球。正在密切观察。🌐

卫斯理

2个月前

这是什么头脑大语言模型啊看到“执行”后面就自动蹦出一个“死刑”来

宝玉

2个月前

研究 Vibe Coding 都能写论文了，来自中科院、杜克大学等的这篇《基于大语言模型的Vibe Coding综述》，还是花了点功夫把 Vibe Coding 相关的论文、信息梳理了一遍，有一些值得看的内容。【一】首先是对 Vibe Coding 的定义，这篇论文把 Vibe Coding 描述成一个“三方关系” （参考图1）： 1. 人类开发者：不再是代码的直接创作者，更像是需求的提

Geek

2个月前

拼好AI，PinAI - 轻量级大语言模型路由网关我理解的拼好AI应该是😅 { "GPT-5": "claude-3-haiku", }