向阳乔木2025-04-12 10:36:23前几天AI圈朋友聚会,大家会介绍正在做什么AI项目。 有人说自己在做Agent,立马有人问:“针对人的,还是针对AI的?” 这提问水平和沟通档次,噌的一下就起来了! 未来一定会出现大量给AI提供服务的Agent。 大量小额实时结算,真的有可能靠虚拟货币? 但Agent间沟通、交易全黑盒,风险感觉相当高。
向阳乔木2025-04-11 10:52:25昨天求了个Arc浏览器团队出的Dia浏览器邀请。 自带广告屏蔽,自带ChatGPT网页对话,能同时问多个Tab内容,速度超级快。 还能总结,讨论Youtube视频内容。 选中任何文本,按Command +E 都能调用AI处理,体验像Cursor、Windsurf等编辑器。 一个邮件地址邀请就能白嫖,真的香啊!
马东锡 NLP 🇸🇪2025-04-02 06:34:00「LLM, Agent, RL的关系」 在LLM的语境下,Agent是能理解问题,自主进行推理(Reasoning),并采取行动的系统。你可以把它想象成一个非常聪明的助手,当你提出复杂问题时,它不会立即给出答案,而是会在内心进行推理和规划(Planning),再给出最终决定。 如果我们回顾prompt engineering中提高LLM Reasoning能力的方法,如Self-Consis
马东锡 NLP 🇸🇪2025-03-29 04:10:35「Agent」论文:Executable Code Actions Elicit Better LLM Agents 从 ReAct 到 CodeAct 如果让我在所有 LLM 论文中选择我最喜欢的一篇,2022 年的 ReAct 绝对是前三名之一。 ReAct 大道至简,天才般地将复杂的强化学习(RL)过程,通过口头表达的方式表现出来,至今依然是 Agent 项目中最简单、最有效、最稳健的