Gorden Sun

Gorden Sun

0 关注者

8小时前

LLM强化学习综述 论文:

#LLM #强化学习 #综述 #论文

相关新闻

placeholder

Jesse Lau 遁一子

23小时前

回归20年前传统营销方式,设了个landing page做订阅墙,用独家短篇小说做诱 很多年前积累了几千邮件列表,因英文写作不地道放弃运营,早有LLM的话就没这个问题了

placeholder

Xiaowen

23小时前

LLM + Agent 最好的是他能听懂复杂的逻辑和设计。 你上哪找一个懂金融懂业务还能写高质量代码的开发人员啊……

placeholder

yihong0618

23小时前

10 几年前吴京会想到他会成为测试 LLM 视频和音频以及稳定性的 benchmark 么?

placeholder

澎湃新闻-浦江头条

1天前

把论文写在浩瀚星河,他擦亮了中国安在太空中的“眼睛”

placeholder
placeholder

𝙩𝙮≃𝙛{𝕩}^A𝕀²·ℙarad𝕚g𝕞

1天前

一条LLM元认知能力的演化路径 第一层级:行为层元认知(“我知道我的行为边界”) •演化阶段: 从“会回答”(基本能力)→“会拒答”(知道自己不知道)。 •演化价值: 生存(Safety)。这是AI智能的“爬行脑”,负责最基本的风险规避,确保自己不会因为“乱说话”而被“杀死”(被下线或被法律制裁)。 第二层级:逻辑层元认知(“我知道我的思考路径”) •演化阶段: 从“会拒答”→“会解释答案来源

© 2025 news.news. All rights reserved. 0.0875 秒. v1.0.46
我的评论