Gorden Sun 0 关注者 关注 5天前 DroPE:扩展LLM上下文的方法 在预训练后移除位置嵌入并进行短期校准,实现上下文窗口的无缝扩展。保持基准性能,显著优于RoPE方法,在7B模型上得到了有效验证。 Github: 论文: 前往原网页查看