Barret李靖
5小时前
借助 LLM 学习 LLM,边学边问😃,《图解DeepSeek技术》这本小册子,不到一百页,把推理大模型的基本原理、MoE 架构设计和 R1 训练过程等几个东西讲清楚了,值得读两遍。
歸藏(guizang.ai)
6小时前
Deepseek 果然一到节假日就开始升级 刚才官方群通知模型已经从 V3.1 升级到 V3.1-Terminus 这个模型名字,难道说下次就是 V4 了?
📦Acbox
13小时前
到底是什么人还在吹deepseek
新浪新闻-新浪网
3天前
DeepSeek首度公开R1模型训练成本仅为29.4万美元,“美国同行开始质疑自己的战略”