Tom Huang

Tom Huang

0 关注者

1个月前

就在刚刚 Google DeepMind 正式宣布革命性 LLM 模型架构 Mixture-of-Recursions 🔥 它的推理速度提升了 2 倍,训练 FLOP 有所降低,并且键值缓存内存减少了约 50%。读起来非常有趣。💥 有潜力成为颠覆 Transformer 的下一代架构👇 论文见第二条