2周前

宝藏论文,虽然转过了,再转一次。 LLM的reasoning的epic failures,就像这几天大家转的50米洗车的案例,作为纯符号层的llm推理,论文中也首先提到要区分embodied和non-embodied,llm显然很难区分这一点,顾此失彼,让人走过去却忘了车! 论文的survey框架不错,不仅对于模型训练,对于如何搭建agent脚手架也有裨益。 一个会从错误中持续学习的agent

热门新闻