Barret李靖

Barret李靖

0 关注者

3小时前

借助 LLM 学习 LLM,边学边问😃,《图解DeepSeek技术》这本小册子,不到一百页,把推理大模型的基本原理、MoE 架构设计和 R1 训练过程等几个东西讲清楚了,值得读两遍。

#LLM #DeepSeek #MoE #推理大模型 #技术

相关新闻

placeholder

Olivert

2小时前

大模型五大经典论文PDF,送给喜欢钻研的兄弟。 链接:

placeholder

A股证券交易员

4小时前

【DeepSeek线上模型升级:当前版本号 DeepSeek-V3.1-Terminus】记者获悉,DeepSeek线上模型已升级,当前版本号 DeepSeek-V3.1-Terminus。

placeholder

歸藏(guizang.ai)

4小时前

Deepseek 果然一到节假日就开始升级 刚才官方群通知模型已经从 V3.1 升级到 V3.1-Terminus 这个模型名字,难道说下次就是 V4 了?

placeholder

野原新之栋 Sintone

5小时前

codex: 准备阶段只产这玩意儿 AI 已经学会儿化音了,人类危⚠️

placeholder

砍砍@标准件厂长

5小时前

哈哈 i18n 没做完的 iOS 26

关联事件

深度学习模型升级引发AI能力大跃进,行业迎新变革

72

深Seek R1模型完成“小版本”升级,显著增强代码能力、语义理解和复杂逻辑推理,带来性能提升。此次升级由官方宣布,用户可在官网和APP体验,模型在训练基础上基于V3-0324版本,效果明显优于之前版本。尽管期待大版本更新,但此次小升级已引发行业关注,显示出深度学习技术不断突破的趋势。未来,模型升级或将推动AI在编程、文本理解等领域的广泛应用,影响行业发展方向。

© 2025 news.news. All rights reserved. 0.40214 秒. v1.0.46
我的评论