向阳乔木 0 关注者 关注 3小时前 deepseek这个论文的想法实在是有趣。 现在大模型不是记忆不好,而是太好了,需要合理的遗忘策略。 #DeepSeek #大模型 #遗忘策略 #有趣 #论文 前往原网页查看