Gorden Sun

Gorden Sun

0 关注者

5天前

DroPE:扩展LLM上下文的方法 在预训练后移除位置嵌入并进行短期校准,实现上下文窗口的无缝扩展。保持基准性能,显著优于RoPE方法,在7B模型上得到了有效验证。 Github: 论文:

热门新闻