𝙩𝙮≃𝙛{𝕩}^A𝕀²·ℙarad𝕚g𝕞 0 关注者 关注 2周前 宝藏论文,虽然转过了,再转一次。 LLM的reasoning的epic failures,就像这几天大家转的50米洗车的案例,作为纯符号层的llm推理,论文中也首先提到要区分embodied和non-embodied,llm显然很难区分这一点,顾此失彼,让人走过去却忘了车! 论文的survey框架不错,不仅对于模型训练,对于如何搭建agent脚手架也有裨益。 一个会从错误中持续学习的agent 前往原网页查看