勃勃OC2025-02-02 00:02:37o3-mini是专门在代码问题上微调的。r1同时在代码和数学题上微调。显然r1的代码能力不如o3-mini。这表明DeepSeek并没有魔法,数据决定模型,RL也是。#机器学习#深度学习#模型训练#强化学习#代码能力#数据重要性
qinbafrank2025-01-27 07:41:05严格来说deepseek对Ai未来的影响在本周是对市场影响最大的呐。这是根基性问题,是不是影响到未来的算力消耗?影响到哪个阶段,早期的模型训练会有影响,那么后期大规模应用呢?会不会是一个拐点,市场真正要从基础设施往应用层上切换? 在这个问题之外再看财报,还有宏观数据的发布了。#DeepSeek#AI未来#市场影响#算力消耗#模型训练#大规模应用#拐点#基础设施#应用层#财报#宏观数据