Tony出海 0 关注者 关注 1个月前 万亿参数智能体强化学习,不再是顶级闭源实验室的专属。 🔥万亿参数推理模型 RL 仅需 10% 算力,Macaron AI 最新的研究打破了这一壁垒,发现在计算预算(FLOPs)相近的情况下,“强先验大模型 + LoRA”的效果远超“小模型 + 全量参数”。 仅用 64x H800 就能撬动万亿参数模型的推理能力进化。 📊 实测数据说话 (32B LoRA vs 1.5B Full): GP 前往原网页查看