4天前

深入解构一下 AK 这条推文 ### 表面意图 Karpathy 描述了一个将教科书从“人类可读”转化为“LLM 可读”的过程:提取文本到 markdown、将 worked problems 转为 SFT(监督微调)示例、practice problems 转为 RL(强化学习)环境、并通过合成数据扩展(如时钟角度问题的无限生成器)。他强调这比简单 pdf-to-text 更丰富,并给出示例代

相关新闻