Y11 0 关注者 关注 1个月前 🚀 弥合算法理论与工程实践的鸿沟 本项目是一个专为中文开发者设计的深度学习与强化学习算法全栈实验室。 我们通过对 GPT-2、RLHF、MuZero 以及 Alignment (GRPO, Weak-to-Strong) 等前沿算法的现代化 PyTorch 重构,旨在提供一个“所见即所得”的学习与研究基准。 核心差异化价值 全栈重构: 彻底告别不再维护的 TensorFlow 1.x / JA 前往原网页查看