0 关注者

2个月前

DroPE：扩展LLM上下文的方法在预训练后移除位置嵌入并进行短期校准，实现上下文窗口的无缝扩展。保持基准性能，显著优于RoPE方法，在7B模型上得到了有效验证。 Github：论文：

热门新闻