向阳乔木

向阳乔木

0 关注者

2个月前

deepseek这个论文的想法实在是有趣。 现在大模型不是记忆不好,而是太好了,需要合理的遗忘策略。

#DeepSeek #大模型 #遗忘策略 #有趣 #论文

相关新闻

placeholder

Mr Panda

3周前

像个小学生样, 学习币圈的知识。 大模型回我的这句给我整笑了。

placeholder

Gorden Sun

3周前

DeepSeek线上模型已更新

placeholder

Tw93

3周前

这个 AI 世界时钟有意思,由各种大模型生成的纯前端的代码的模拟时钟,每分钟生成一遍,并限制 2000 个词元,看看有多少是瞎搞的,挺有趣,不少一本正经瞎搞系统,严肃编码很重要了。

placeholder

李老师不是你老师

3周前

网友投稿 Deepseek,有中国特色社会主义思想觉悟的AI。

placeholder

Justin3go

3周前

都在比编程能力,所以哪个大模型适合文学创作?

关联事件

深度学习模型升级引发AI能力大跃进,行业迎新变革

143

深Seek R1模型完成“小版本”升级,显著增强代码能力、语义理解和复杂逻辑推理,带来性能提升。此次升级由官方宣布,用户可在官网和APP体验,模型在训练基础上基于V3-0324版本,效果明显优于之前版本。尽管期待大版本更新,但此次小升级已引发行业关注,显示出深度学习技术不断突破的趋势。未来,模型升级或将推动AI在编程、文本理解等领域的广泛应用,影响行业发展方向。

© 2025 news.news. All rights reserved. 0.10068 秒. v1.0.46
我的评论