henu王凯

henu王凯

0 关注者

1周前

这篇解释目前强化学习技术路线的论文可以看看,“强化学习”地位非常重要,但我们其实很难看懂算法原理——这通常需要很好的数学知识。 所以如果不是做强化学习

#强化学习 #算法原理 #数学知识 #技术路线 #论文

相关新闻

placeholder

𝙩𝙮≃𝙛{𝕩}^A𝕀²·ℙarad𝕚g𝕞

6天前

当强化学习之父说"LLM是死胡同",当OpenAI创始成员说"RL很糟糕",这不是互相否定,而是同一个深渊的两个入口。Karpathy批判学习信号的稀疏,Sutton批判学习对象的悬浮——两种绝望背后,是符号与具身、表征与经验之间那道古老的鸿沟。

placeholder

向阳乔木

6天前

deepseek这个论文的想法实在是有趣。 现在大模型不是记忆不好,而是太好了,需要合理的遗忘策略。

placeholder

𝙩𝙮≃𝙛{𝕩}^A𝕀²·ℙarad𝕚g𝕞

6天前

结合最近强化学习之父Sutton提到LLM is a dead end和硅谷AI好老师Andrej Karpathy在访谈提到RL is terrible; 让我不禁想起在LLM的训练范式中,RL可能并不适合LLM这种纯符号计算,Sutton的担心是悬浮的符号计算会走向何方?Karpathy离职从事AI教育志向在于探索LLM的cognitive core如何为AI时代的人类所用。 LLM的"世

placeholder

indigo

1周前

自从 Gemini 2.5 Pro 推出之后,我消费播客、论文还有长文的数量就大幅增加!AI 的质量越高、速度越快,我的用量反而越大,花了更多时间在内容获取上,这活脱脱的“杰文斯悖论”🤣 不知道大家是不是也这样 。。。

placeholder

𝙩𝙮≃𝙛{𝕩}^A𝕀²·ℙarad𝕚g𝕞

1周前

Meta论文最近爆发了吗? 作者中有最近过去的人的署名吗

© 2025 news.news. All rights reserved. 0.05651 秒. v1.0.46
我的评论