0 关注者

1个月前

万亿参数智能体强化学习，不再是顶级闭源实验室的专属。 🔥万亿参数推理模型 RL 仅需 10% 算力，Macaron AI 最新的研究打破了这一壁垒，发现在计算预算（FLOPs）相近的情况下，“强先验大模型 + LoRA”的效果远超“小模型 + 全量参数”。仅用 64x H800 就能撬动万亿参数模型的推理能力进化。 📊 实测数据说话 (32B LoRA vs 1.5B Full)： GP

热门新闻