Barret李靖
5小时前
借助 LLM 学习 LLM,边学边问😃,《图解DeepSeek技术》这本小册子,不到一百页,把推理大模型的基本原理、MoE 架构设计和 R1 训练过程等几个东西讲清楚了,值得读两遍。
A股证券交易员
6小时前
【DeepSeek线上模型升级:当前版本号 DeepSeek-V3.1-Terminus】记者获悉,DeepSeek线上模型已升级,当前版本号 DeepSeek-V3.1-Terminus。
📦Acbox
13小时前
到底是什么人还在吹deepseek
新浪新闻-新浪网
3天前
DeepSeek首度公开R1模型训练成本仅为29.4万美元,“美国同行开始质疑自己的战略”