Barret李靖

Barret李靖

0 关注者

1个月前

借助 LLM 学习 LLM,边学边问😃,《图解DeepSeek技术》这本小册子,不到一百页,把推理大模型的基本原理、MoE 架构设计和 R1 训练过程等几个东西讲清楚了,值得读两遍。

#LLM #DeepSeek #MoE #推理大模型 #技术

相关新闻

placeholder

dontbesilent

3小时前

70 本《逻辑哲学论》 线下课人手一本,解开 AI 大模型之锁的真正钥匙🔑

placeholder

River Leaf

11小时前

ChatGPT肯定是用SwiftUI写的,不然写不出这样的bug

placeholder

砍砍@标准件厂长

14小时前

gpt-codex 懂我 我就喜欢拆 extension

placeholder

Salonbus

16小时前

Code Free Builder 又是一个大模型能力溢出后即将血洗的赛道

placeholder

lencx

17小时前

从火出圈到被删库,也就两三天时间,唯一留下的话题:Apple 竟然用的是 Svelte...

关联事件

深度学习模型升级引发AI能力大跃进,行业迎新变革

130

深Seek R1模型完成“小版本”升级,显著增强代码能力、语义理解和复杂逻辑推理,带来性能提升。此次升级由官方宣布,用户可在官网和APP体验,模型在训练基础上基于V3-0324版本,效果明显优于之前版本。尽管期待大版本更新,但此次小升级已引发行业关注,显示出深度学习技术不断突破的趋势。未来,模型升级或将推动AI在编程、文本理解等领域的广泛应用,影响行业发展方向。

© 2025 news.news. All rights reserved. 0.16453 秒. v1.0.46
我的评论