𝙩𝙮≃𝙛{𝕩}^A𝕀²·ℙarad𝕚g𝕞

𝙩𝙮≃𝙛{𝕩}^A𝕀²·ℙarad𝕚g𝕞

0 关注者

5个月前

RL为什么会导致Model collapse,自相似性危险: 模式崩塌(Mode collapse): - 重复生成相同内容 - "我是AI助手,我是AI助手,我是AI助手..." - 失去多样性 过度规律化: - 所有回答都遵循相同模板 - 失去创造性和灵活性 - "机械感"

#RL #Model collapse #自相似性 #模式崩塌 #AI助手

相关新闻

placeholder

Yadong Xie

1天前

把 claude code 中的 buddy 提取出来做成图鉴了,好玩

placeholder

花花

1天前

用了同样的问题提问claude gpt gemini,说实话,claude领先能力太强了,gemini和gpt差不多吧。 大家还有啥更聪明的大模型吗?我来学习一下。

placeholder

向阳乔木

4天前

Claude看你在达到每日限制后,手动编写代码的样子...

placeholder

旧金山不是巴黎(Meme部部长)

6天前

花9块9开通了币安的ai 这玩意儿不好使 我问它龙虾的价格 它告诉我没有海鲜 我跟它说 给它100块钱让它1个月内给我搞到100万 它也不管我搞 不过说实话 这个ai倒是挺实在挺有良心的 说的话挺中肯的 跟我一样 非常的单纯和善良

placeholder

Shiqi Chen

1周前

非常感谢马老师的打call !! 忍不住分享一点SkillCraft背后的故事。 初衷起源于我们去年对 embodied LLM agent RL 的探索。当时我们让大模型用 RL 学推箱子,怎么训都训不上去。探索之后我们发现,这不是 RL 的问题,而是 grounding 的问题:任务极度依赖坐标,但模型却无法从一堆二维字符串里自己提取出坐标信息。无奈之下我们当时用了简单粗暴的解法:直接改渲

© 2025 news.news. All rights reserved. 0.03859 秒. v1.0.46
我的评论