Barret李靖
6小时前
借助 LLM 学习 LLM,边学边问😃,《图解DeepSeek技术》这本小册子,不到一百页,把推理大模型的基本原理、MoE 架构设计和 R1 训练过程等几个东西讲清楚了,值得读两遍。
A股证券交易员
8小时前
【DeepSeek线上模型升级:当前版本号 DeepSeek-V3.1-Terminus】记者获悉,DeepSeek线上模型已升级,当前版本号 DeepSeek-V3.1-Terminus。
歸藏(guizang.ai)
8小时前
Deepseek 果然一到节假日就开始升级 刚才官方群通知模型已经从 V3.1 升级到 V3.1-Terminus 这个模型名字,难道说下次就是 V4 了?
今日澳洲App
20小时前
“东航用2分钟把我妈妈的生命带走了,两年了还是一点交代都没有” 今年5月,东航5735空难遇难者家属多次视频质问为何两年了还是一点交代都没有,事故中遇难的母亲亦是其户口本上唯一的亲人。 “最后拿回家的只有一两斤黄土,连个骨头渣子都没有”#东航
凤凰网-凤凰网综合
21小时前
“东部哨兵”永久化?北约受多重质疑