deepseek就是个纯纯的小可爱,把强化学习这层窗户纸捅穿了,我看他妈的后面怎么买卡,大模型一旦走到强化学习阶段,对算力的需求会炸掉,千亿美金的数据中心只是起步。 那些喊着deepseek会减少算力需求的韭菜们发梦天,认为英伟达要崩盘了,他们后面会直接破大防。
deepseek就是个纯纯的小可爱,把强化学习这层窗户纸捅穿了,我看他妈的后面怎么买卡,大模型一旦走到强化学习阶段,对算力的需求会炸掉,千亿美金的数据中心只是起步。 那些喊着deepseek会减少算力需求的韭菜们发梦天,认为英伟达要崩盘了,他们后面会直接破大防。
独立投资人
4周前
英伟达继续看多 特斯拉方向还未确定 黄金看多 比特币目前处于一个震荡区间。
独立投资人
1个月前
英伟达继续多 特斯拉处于一个震荡区间。 黄金看多 比特币处于一个震荡区间
karminski-牙医
1个月前
Unsloth 刚刚发布了一个强化学习小教程 教程从吃豆人游戏触发,然后简单介绍 RLHF, PPO 再到 GRPO, 然后告诉你如何用 GRPO 开始训练,是个不错的入门小文章。 地址:
东方网-央视新闻
1个月前
美国企业英伟达将首次在链博会上参展