Ken Wong
0 关注者
李幺傻
1天前
昨天和一个中国政法大学的朋友聊,她上世纪90年代上大学。她聊到那时候学校里的各种讲座,同学中成立的各种学会,老师在课堂上讲到的各种观点……然后,就突然冒出一句:“那个时代,还会再回来吗?”
五岳散人
我也挺喜欢松屋的,现在隔个十天半个月也还是想去吃一次
利维坦冲浪里
1周前
经典回顾
Shiqi Chen
非常感谢马老师的打call !! 忍不住分享一点SkillCraft背后的故事。 初衷起源于我们去年对 embodied LLM agent RL 的探索。当时我们让大模型用 RL 学推箱子,怎么训都训不上去。探索之后我们发现,这不是 RL 的问题,而是 grounding 的问题:任务极度依赖坐标,但模型却无法从一堆二维字符串里自己提取出坐标信息。无奈之下我们当时用了简单粗暴的解法:直接改渲
小牛 OTC
2周前
今日深夜学习,马老师的香港演讲。