Jerome.Y.2025-05-28 18:21:35前两年的 LLM APPs, 无论是 ChatBot 形态的 ChatGPT 或者 IDE 形态的 Cursor,他们的共同点是都需要占据“注意力”,也就是“同步”。 2025 仍是未知。 可以确定的是:不需要占据前台和注意力的,也就是异步或者说后台执行的是一种基本确定的属性。 - 和同事讨论 Agent (Dify App Type) 重构时我的看法 #LLM#ChatGPT#Cursor
henu王凯2025-05-28 15:05:29上条我分享了Lovart的邀请码就很想写个“与Agent的协作规范”,如何更好的用起来Agent,然后我就让o3、Manus、Skywork、Genspark等写个“与它们自己如何协作”的回复。还是能清晰感知到AI、Agent的能力边界,我人工写个: #Lovart#agent#协作规范
歸藏(guizang.ai)2025-05-27 17:33:31BrowserUse 找了个方法解决 Agent 浏览网页时被登录验证拦住的问题 你可以在他们那里保存你的账号和密码,到时候 AI 就会自己填写然后登录 #BrowserUse#agent#自动登录
Victor_422025-05-26 10:31:08AI现在能独立做PPT了吗?最近在研究这个问题。 首先,所有往现成模板里填内容的AI产品我都没测,这是过渡产品,排版任务本质上还是由人完成的。内容和排版是有机整体,真正能做好的一定是Agent。 测试了4个Agent产品:天工、扣子空间、Manus、Lovart,结果如下 👇#AI#PPT#人工智能
Yangyi2025-05-25 22:32:45如果你搞不懂什么是Agent / workflow / Agentic / ReACT 那可以看看我的大白话注释: ---------------- Agent , 广泛意义上讲,是一个智能黑盒,你给一个input,Agent识别意图,按照它自己的设定去给你一个output 这个黑盒里,很可能出现套娃情况,那也就是MultiAgent,但实际上对外是无感知的,大家仍然把它理解成「一个」Agent#agent#智能黑盒#MultiAgent
马东锡 NLP 🇸🇪2025-05-25 20:16:08思科的Agent是典型的垂直Agent例子。 其护城河不是agent work flow,而是网络虚拟化这套API,是ICT行业多年从On-Premise到cloud native转型的成果。 ICT的厂商谁没有完成cloud native的转型,谁就不可能把AI融合到它的产品中。 思科的例子,也应用于其他领域。 这个阶段,tool是垂直Agent的护城河。#思科#agent#网络虚拟化
BillyHe2025-05-25 19:56:01需求面前,Agent 并不比 workflow 高级 (这边的讨论氛围太好了,拜几位大 V 转发,这个号算是冷启了。也发发我在其他平台的一些旧文) 一位刚融资的 AI 创业朋友夜里两点给我发微信:"我们团队争论一整天了,投资人希望看到更'高级'的 agent,但我们现在的 workflow 方案其实更实用...你说我们该怎么选?" 你看,搞 AI 的人人都在 FOMO(Fear Of Mis#AI创业#agent#Workflow
indigo2025-05-25 13:17:15智能不是意识,本质上所有的问题都是搜索问题!上周末对谈的话题,从开源、分布式、Agent、智能和意识,最后到自我抽离😜 和 Mohan 聊得很抽象 完整版下周发✨ #智能#意识#开源
向阳乔木2025-05-23 22:26:03突然觉得Lovart还是被低估了。 让Claude 4 opus生成了科幻加暗黑的十幕故事。 故事丢给Lovart,本意只是想生成20张图。 没想到Agent一通操作,不仅生成了20张图,还生成了BGM,还调用可灵生成20段视频。 已经运行了半小时。 现在告诉我它要给视频加字幕,让后合并成一个最终视频。 很期待最终能出来个什么!#Lovart#科幻#暗黑
向阳乔木2025-04-30 21:55:19最近参与了几个新AI工具的内测,全都是各种Agent。 效果也都可圈可点。 下半年Agent工具要全面爆炸。 预感以后,有人问做的是什么 AI 产品,如果不带个“Agent”,都不好意思跟人打招呼了...#AI工具#agent#内测
马东锡 NLP 🇸🇪2025-04-26 21:32:50读书笔记:当 LLM 成为 Agent——从自然语言到“协议语言”的演化 这两周选了四篇极其出色的文章做了分享,ReSearch, ReTool, APR 和 PASTA。 它们虽然解决的具体问题不相同,但 general 的目标都一致,即让LLM知道 when and how 做决策,这就是agent的核心,要做精准的决策。 而这种精准与人类语言的模糊性不一致,但 LLM 的 token #LLM#agent#自然语言处理
马东锡 NLP 🇸🇪2025-04-22 04:30:13「Agent, RAG, Reasoning」论文 ReSearch: Learning to Reason with Search for LLMs via Reinforcement Learning ReSearch,充满了 ReAct 的影子。它教会模型“何时求助于世界”;但局限在于,ReSearch 只能依赖一种工具。 作者提出了一种创新的框架,名为 ReSearch,旨在#agent#RAG#reasoning
马东锡 NLP 🇸🇪2025-04-17 06:14:42「codex, ACI, Agent」论文 SWE-agent: Agent-Computer Interfaces Enable Automated Software Engineering 从 Human‑Computer Interaction (HCI) 到 Agent‑Computer Interaction (ACI) —— AI IDE 的基石与框架 今天 OpenAI 开源了#Codex#ACI#agent
向阳乔木2025-04-12 10:36:23前几天AI圈朋友聚会,大家会介绍正在做什么AI项目。 有人说自己在做Agent,立马有人问:“针对人的,还是针对AI的?” 这提问水平和沟通档次,噌的一下就起来了! 未来一定会出现大量给AI提供服务的Agent。 大量小额实时结算,真的有可能靠虚拟货币? 但Agent间沟通、交易全黑盒,风险感觉相当高。#AI项目#agent#虚拟货币
马东锡 NLP 🇸🇪2025-04-02 06:34:00「LLM, Agent, RL的关系」 在LLM的语境下,Agent是能理解问题,自主进行推理(Reasoning),并采取行动的系统。你可以把它想象成一个非常聪明的助手,当你提出复杂问题时,它不会立即给出答案,而是会在内心进行推理和规划(Planning),再给出最终决定。 如果我们回顾prompt engineering中提高LLM Reasoning能力的方法,如Self-Consis#LLM#agent#RL
马东锡 NLP 🇸🇪2025-03-29 04:10:35「Agent」论文:Executable Code Actions Elicit Better LLM Agents 从 ReAct 到 CodeAct 如果让我在所有 LLM 论文中选择我最喜欢的一篇,2022 年的 ReAct 绝对是前三名之一。 ReAct 大道至简,天才般地将复杂的强化学习(RL)过程,通过口头表达的方式表现出来,至今依然是 Agent 项目中最简单、最有效、最稳健的#agent#LLM#React
马东锡 NLP 🇸🇪2025-03-20 22:59:17更强的reasoning, 更好的Agent 论文分享: Thinking Machines: A Survey of LLM based Reasoning Strategies 在我们开发Agent的项目的时候,需要 更好的LLM reasoning的能力,以获得更高的任务完成准确率。 那么有哪些方法可以增强LLM的reasoning能力呢? 沿着之前我分享的Testing time s#reasoning#LLM#agent
Leo Xiang2025-03-12 13:02:02OpenAI 这套开发工具把Agent开发需要的基础能力都提供了,搜索、RAG、意图识别、内容审核、Computer use 以及 Browser use,整个Agent开发的成本瞬间降低了很多。 预期可见的会出来一批Agent方向的产品。 #OpenAI#开发工具#agent
LE2025-03-10 23:14:54又更进了一步,现在可以在字节 coze 上使用我们的FOLOTOY AI玩具开放的端插件构建链接物理世界的 agent 了 #字节coze#FOLOTOY#AI玩具
宝玉2025-02-16 09:41:04AI Agent——“Agent”这个词本身就意味着它拥有“决策权(agency)”,所以它能自己在执行过程中遇到问题时做出决定而不需要确认,需要确认的是“Copilot”。但问题在于,如何保证 Agent 做决策时,能在没有确认时做出我们期望的结果?#AI#agent#人工智能
Yangyi2025-02-13 21:47:11为啥很少看到给agent做工具的融了钱的公司 当下都是给人类做agent agent马上作为生产力大规模应用了 那各种agent脚手架需求会大面积爆发 当下创业做这个我觉得是比较好的切入点吧 比如针对agent的权限管理 针对agent的钱包支付应用 我们都不用说未来针对agent的招聘市场啥的 这还没有那么大规模做不了供需匹配 但底层的权限 支付 这些当下就会用得上吧.. 有在做这方#agent#工具#投资
高级分析师2025-02-12 10:53:49AI发展从2022年到现在,已经经历了Chatbot、Copilot和Agent三个范式变迁。 Chatbot是用户聊天,遇到代码和文章需要手动复制,体验仍然是割裂的。Copilot阶段AI无缝衔接到了工作软件当中,读取工作环境的上下文,体验整合。但Copilot副驾驶仍需要用户手动确认。 Agent阶段则是全自动。 Cursor当中的YOLO(You Only Look Once)模式,自己#AI发展#范式变迁#ChatBot