***土隹
0 关注者
Shiqi Chen
1周前
非常感谢马老师的打call !! 忍不住分享一点SkillCraft背后的故事。 初衷起源于我们去年对 embodied LLM agent RL 的探索。当时我们让大模型用 RL 学推箱子,怎么训都训不上去。探索之后我们发现,这不是 RL 的问题,而是 grounding 的问题:任务极度依赖坐标,但模型却无法从一堆二维字符串里自己提取出坐标信息。无奈之下我们当时用了简单粗暴的解法:直接改渲
小牛 OTC
今日深夜学习,马老师的香港演讲。
中国日报网-人民日报
2周前
日本对伊朗战事诡异的沉默:双标 软肋与盲从
中国日报网-央视新闻
企业家坐“C位” 如何让民营经济“乘势而上”
Liuping Xu
阿富汗教育部长宣布,永久禁止女性进入学校。 联合国妇女署和人权委员会对此保持沉默。