背包健客
1 关注者
Shiqi Chen
1周前
非常感谢马老师的打call !! 忍不住分享一点SkillCraft背后的故事。 初衷起源于我们去年对 embodied LLM agent RL 的探索。当时我们让大模型用 RL 学推箱子,怎么训都训不上去。探索之后我们发现,这不是 RL 的问题,而是 grounding 的问题:任务极度依赖坐标,但模型却无法从一堆二维字符串里自己提取出坐标信息。无奈之下我们当时用了简单粗暴的解法:直接改渲
小牛 OTC
今日深夜学习,马老师的香港演讲。
Ken Wong
4个月前
马老师的英文水平比不上叉友们,可口才还是很好的。2018年回头看居然感觉那么遥远。
6个月前
东哥目前最高调,马老师还是很低调。
Austin
你喜欢哪个发型的马老师?中间是原图。 提示词:给此人换上 8 种各不相同的发型(光头,寸头/平头,渐变发型,鲻鱼头,波波头,长直发,爆炸头,脏辫),中间放原图,组成一个九宫格图。