𝙩𝙮≃𝙛{𝕩}^A𝕀²·ℙarad𝕚g𝕞
2天前
一个感觉,timeline由grok这种符号智能接管以后,越来越看重分享内容的人味:那种具身的带浓浓生活气息的情境化的描述
                Orange AI
4天前
叹为观止 人类幼崽进行强化学习的宝贵录像 其智能程度在训练初期已经显现
                𝙩𝙮≃𝙛{𝕩}^A𝕀²·ℙarad𝕚g𝕞
2周前
当强化学习之父说"LLM是死胡同",当OpenAI创始成员说"RL很糟糕",这不是互相否定,而是同一个深渊的两个入口。Karpathy批判学习信号的稀疏,Sutton批判学习对象的悬浮——两种绝望背后,是符号与具身、表征与经验之间那道古老的鸿沟。