有人说DeepSeek R1 的 RL 范式也没啥创新，其实点不在这里。 o1出来后纷纷开始复刻，OpenAI 也不说怎么实现的，也不展示COT数据。所以说蒸馏o1纯属扯淡，OpenAI 防的死死的。 RL 论文上百篇方法几十种，最后 DeepSeek 肯定不是第一家试出来的（比如Google 的 gemini flash 2.0 thinking 就很好），但它是第一家说出来的，善莫大焉。

#DeepSeekR1 #RL范式 #OpenAI #COT数据 #geminiflash2.0 #论文创新 #DeepSeek

相关新闻

Inty News

3小时前

最新消息——微软目前拥有 OpenAI 27% 的股份，价值 1350 亿美元。

勃勃OC

3小时前

OpenAI 改变了美股 AI 改变了全世界这就是人类疫情后我们所进入的那个永恒成功的平行宇宙吗？

勃勃OC

3小时前

10月28日，微软盘前涨超4%，微软与OpenAI签署新协议。 OpenAI签约购买额外2500亿美元的Azure服务，而微软将不再拥有成为OpenAI算力提供商的优先选择权。 OpenAI现可与第三方联合开发产品，与第三方合作的API产品仍为Azure独占，非API产品可部署于任何云平台。微软支持OpenAI董事会成立公益公司，微软持有OpenAI集团公益公司价值约1350亿美元的投资权益。

勃勃OC

4小时前

PayPal 获得与 OpenAI 的合作协议。 $PYPL 盘前上涨 17%。 😅😅😅

小牛OTC

6小时前

Paypal与OpenAI签署协议，成为ChatGPT的支付钱包资本的力量。。。。