首页点击榜热搜榜通知我的

热搜榜

#模型训练

2025-02-02 00:02:37

o3-mini是专门在代码问题上微调的。r1同时在代码和数学题上微调。显然r1的代码能力不如o3-mini。这表明DeepSeek并没有魔法，数据决定模型，RL也是。
#机器学习 #深度学习 #模型训练 #强化学习 #代码能力 #数据重要性

中日政经评论

2025-01-30 16:14:33

DeepSeek有没有使用OpenAI的专有模型来训练自己的模型？你怎么看？
#DeepSeek #OpenAI #模型训练

2025-01-27 07:41:05

严格来说deepseek对Ai未来的影响在本周是对市场影响最大的呐。这是根基性问题，是不是影响到未来的算力消耗？影响到哪个阶段，早期的模型训练会有影响，那么后期大规模应用呢？会不会是一个拐点，市场真正要从基础设施往应用层上切换？在这个问题之外再看财报，还有宏观数据的发布了。

#DeepSeek #AI未来 #市场影响 #算力消耗 #模型训练 #大规模应用 #拐点 #基础设施 #应用层 #财报 #宏观数据

24小时点击排行

1

2月22日，安徽。一名老人回忆饥荒年代：“什么都吃过，地上跑的蚂蚱、蛐蛐，逮着就生吃” 老人说到一半开始抹眼泪：“别提过去的事了，俺庄子饿死好多人，大人们在食堂打的稀饭舍不得吃，端回家给小孩吃，最后大人都被活活饿死。

2

美国宾夕法尼亚州一医院发生劫持人质事件致多人死伤

3

特朗普称不会强制执行加沙人口外迁计划

4

“天生万物以养人！” “我命由我不由天！”

5

你的眼睛里有这个灰白色的环吗？它是跟视力还是血脂有关？👁👁

6

按照特朗普总统的指示，马斯克要求所有美国联邦雇员在2025年2月24日星期一东部标准时间晚上11:59之前通过电子邮件提交一份他们每周成就的报告。未能遵守将被视为自动辞职。

7

2月10日，美国宣布对全球钢铝产品加征25%关税 2月11日，印度宣布准备对中国钢铁产品加征最高25%的进口关税 2月20日，韩国宣布对中国产碳钢及其它热轧合金钢厚板临时征收最高38%的反倾销关税 2月22日，越南对中国产的部分热轧钢产品临时征收最高27.83%的反倾销关税（对同时调查的印度产品未征税）

8

国防部新闻发言人吴谦就澳方炒作中方舰艇编队演训活动答记者问

9

秘鲁购物中心屋顶坍塌事故死亡人数升至8人

10

王毅在访问英国、爱尔兰并主持联合国安理会高级别会议、出席慕尼黑安全会议及二十国集团外长会后接受中国媒体采访

热门事件

俄乌战争专题

特朗普，马斯克相关事件跟踪

巴以冲突最新进展

尹锡悦弹劾案全纪录

比亚迪”黑奴工”事件

香港47人案

各种举报事件汇总

AI热点追踪

加密货币热点跟踪

推荐信息源

网易新闻-红星新闻