sitin 0 关注者 关注 1天前 月之暗面把 Kimi Linear 开源了! 这东西是专门用来处理超长文本的。 简单说几个数据: KV 缓存降了 75%,处理百万字的文本时,解码速度能快 6 倍多。 技术上用了个 3:1 的混合设计, 就是 3 个线性注意力层配 1 个全注意力层。 核心模块叫 KDA,能让模型自己判断该记住什么、该忘掉什么。 测试下来,在长文本生成、代码理解、数学推理这些场景, 表现确实比传统的全注意力 #Kimi Linear #开源 #超长文本处理 #线性注意力 #月之暗面 前往原网页查看