#agent

2天前

Context7 是个少数比较有用的 MCP tool 之一，他能搜索你用的库的文档。但这两天 X 上有人提到一些新的 MCP 文档搜索工具，说比 Context7 好。那么问题来了，我怎么知道到底哪个好呢？其实可以让 agent 自己比

AI编程工具激战：Claude Code、Gemini Cli崛起· 897 条信息

#MCP工具 #Context7 #文档搜索 #工具对比 #agent

3天前

Claude Code 是真正意义上的全链路开发 Agent，从写代码到测试到发布 Github，全部自己完成。第一次用 Claude Code 写完软件发布到 Github 的时候，我还在用 Github 的客户端，各种报错。第二次用的时候，我装了一堆Agents，直接在CC里让 Agent 来提交了，遇到错误它会自己解决。太智能了。

AI编程工具激战：Claude Code、Gemini Cli崛起· 897 条信息

#Claude Code #全链路开发 #agent #GitHub #自动化

3天前

今天用dspy + coqpyt编了个agent，自动证明了我懒得写的一个leetcode的定理。虽然不知道这玩意稳定性如何。总之就是让Coq的报错喂给AI，然后AI会发现自己的递归没写对，反复试了几次以后就过了。 Coqpyt重新糊了一套界面，不然原来都不报错，模型直接抓瞎。

AI编程工具激战：Claude Code、Gemini Cli崛起· 897 条信息

#DSPy #coqpyt #agent #LeetCode #定理证明

6天前

作为一个不会写代码的产品，我做了第一个 Mac App 🎉 Claude Code Now —— 在系统的任何文件夹，一键点击，CC启动！设计理念： Claude Code 并非只是一个开发工具，而是一个广泛的通用型 Agent。它可以帮你分析文件、移动文件、整理文件。它可以基于你的 Obsidian 数据库进行分析、总结、提取洞察。但是启动 Claude Code 的过程还是太繁琐了，终端、cd、确认权限。我们的目标就是一键启动，丝滑享受，跳过输入和确认。于是我做了这款极简的 Claude Code 一键启动器，专为 macOS 设计，可以在任何文件夹快速启动 Claude Code。它用起来，甚至比 ChatWise 更方便，因为不需要把文件拖动进去啦。

AI编程工具激战：Claude Code、Gemini Cli崛起· 897 条信息

#Claude Code #mac app #一键启动器 #极简设计 #agent

𝙩𝙮≃𝙛{𝕩}^A𝕀²·ℙarad𝕚g𝕞

6天前

如果把agent也看成是一种交互，而语言本身就是人的社会外在的交互媒介，那一切就豁然了

#多智能体之争：Anthropic生态VS单智能体· 47 条信息

#agent #交互 #语言 #社会 #媒介

6天前

无论是否是专业电影人，我相信，每个人脑海中都有那样一个故事。那么，借助Agent的综合能力，通过多轮对话，将你的故事变成好莱坞级别的节拍严谨的剧本初稿。如何？内测点点赞，择日拉群。相比于图4，图3是一个UI升级版本，辱骂了一天才能登峰造极。辱骂的是哪个模型我不敢说。

#电影剧本 #agent #好莱坞 #UI升级 #模型

1周前

把这个 agent 和 chat 分清楚，就知道为什么要用 genspark 和 manus 了不是所有的问题，都可以在 10 秒钟之内完成回答那么当你选择了一个回答所有问题耗时都小于 10 秒的工具（不联网的纯 LLM），就必然有一定比例的问题拿不到结果日常使用的通用 AI 工具，必须有任务规划功能，必须自己决定这是一个可以立即回答的短问题，还是需要查半个小时资料才能回答的长问题会用 agent（而不仅仅是 LLM）是日常用好 AI 的基础

#agent #LLM #任务规划 #长短问题 #AI工具

1周前

Agent 有两个变量，一个是控制任务走向的 workflow 工作流，一个是控制内容生成的 context 上下文。 1）如果 workflow 和 context 的确定性都很高，这类任务就容易被自动化，类似传统 RPA，比如在处理发票处理、表单填报任务时，AI 更多是粘合剂，发挥空间比较有限。 2）如果 workflow 确定但 context 不确定，也就是流程固定但输入多变，就需要 Agent 在语义和理解上补全，比如客服问答、合同解析，需要通过外部检索、知识图谱等工具来弥补信息的缺口，让推理结果更符合预期。 3）如果 workflow 不确定但 context 确定，也就是输入清晰但走法多样，Agent 就要去自主规划路径，例如市场分析报告生成、个性化推荐等，大多数 End-to-End RL Agent 都擅长做这类任务，因为它们在训练阶段就习得了大量的路径规划和解题思路。 4）而当 workflow 和 context 都不确定时，就是最复杂的场景了，既要推理也要探索，像创新方案设计、跨部门信息收集等，这类更偏向于通用型 Agent，它的执行效果，取决于给它配备的工具丰富度，尤其是编程能力要最大化开放，例如让它学会去 Github 找仓库克隆并修改代码来解决问题，让它像人一样干活儿。所以，要把 Agent 做好，首先要明确场景。本质上，自动化解决的是“确定性”问题，而智能化解决的是“不确定性”问题。

#agent #Workflow #Context #自动化 #不确定性

1周前

生产力工具的进化，本质上是一部「翻译」成本的降低史。 - 代码时代：需求 -> 产品经理 -> 程序员 -> 代码 -> 工具。翻译链条长，成本极高。 - 无代码时代：需求 -> 懂业务的搭建者 -> 可视化搭建 -> 工具。翻译链条缩短，但对搭建者要求依然很高。 - Agent 时代：需求 -> AI -> 工具。翻译成本被大幅压缩。我们组织生产和协作的根本瓶颈，在于将意图转化为流程与工具的效率。当 AI 可以无限逼近零成本的翻译时，生产力的终极引擎将不再是工具，而是思想本身。

AI编程工具激战：Claude Code、Gemini Cli崛起· 897 条信息

#生产力工具 #AI #翻译成本 #无代码 #agent

𝙩𝙮≃𝙛{𝕩}^A𝕀²·ℙarad𝕚g𝕞

1周前

除了pretraining，其它所有都是围绕怎么与LLM交互展开的。 agent也是交互，预训练后的LLM只是个缸中之脑，语义和结构的混沌汤。 zhilin是炼模型的，说的是怎么内化交互，shunyu更关注作为交互的agent。

#LLM交互 #agent #预训练 #zhilin #Shunyu

1周前

当AI学会花钱：从x402到AP2，再到ERC-8004，探索如何让Agent成为真正的经济主体

#多智能体之争：Anthropic生态VS单智能体· 47 条信息

#AI #agent #经济主体 #x402 #AP2 #ERC-8004

2周前

在人机交互过程中，人类消费的是 GUI，机器消费的是 API，那么 Agent 消费的是什么？ Agent 必须理解任务的整体场景：用户的目标、当前状态、外部环境（数据、工具、权限），它不是单点调用 API，而是要根据上下文决定调用哪些 API、以何种顺序来完成目标。从这个视角来看，它消费的是上下文（Context）。人类给 Agent 的输入不是一堆低级操作，而是对目标的“规格说明”或“期望结果”，Agent 的工作是把 Prompt 转换成可执行的 API 调用序列。从这个视角看，它消费的是规范描述（Spec）。 Agent 并非孤立存在，它往往处在多 Agent 协作或人机混合环境中，因此它需要消费一种比 API 更高阶的“交互协议”：包含角色、任务分工、状态同步、反馈循环等等。从这个视角看，它消费的是协议约定（Protocol）。

#多智能体之争：Anthropic生态VS单智能体· 47 条信息

#人机交互 #agent #API调用 #上下文 #交互协议

2周前

不得不说，扫码登录和跑在虚拟机里的Agent（Manus）很搭

#扫码登录 #agent #Manus #虚拟机 #技术

2周前

LLM + Agent 最好的是他能听懂复杂的逻辑和设计。你上哪找一个懂金融懂业务还能写高质量代码的开发人员啊……

#多智能体之争：Anthropic生态VS单智能体· 47 条信息

#LLM #agent #金融 #业务 #高质量代码

2周前

我曾鄙视AI的产出，直到裸辞创业，才被现实狠狠打脸。过去，我坚信“肯定比AI写得好”，这是技术人的骄傲，也是赚钱的陷阱。为公司打工，一下午优化15%性能是本事。为自己打工，同样时间做个视频、换来3个客户才是生存。拿薪水，时间不值钱；自己干，每一秒都要创造价值，否则就饿死。当你承认时间比代码更值钱，就会疯狂寻找“杠杆”，一套全新的高效作战系统，用最短时间，把价值传递给最多人。过去，构建这套系统无比艰难。现在，AI Agent就是你的全能教练，即学即用，边干边学。我的杠杆就是：展示杠杆：用DemoGet录产品视频，全网分发。营销杠杆：自建文案Agent，反复打磨、直击用户。效率杠杆：用文档驱动编程，让非核心工作自动化。下面给你们看看，我的 Agent 之前的 prompt。喜欢的话，我可以展开讲讲。

#AI #创业 #效率杠杆 #时间价值 #agent

2周前

如果你的 Agent 还要用 ReAct 框架写 Prompt，那么要么说明你在用没有 Agent 能力的模型（比如 GPT-4o、Gemini 2.5 Pro），要么就是用错了。因为有 Agent 能力的模型，比如 Claude 4 系列（包括前面的 Claude 3.7 和 GPT-5），是不需要通过 ReAct 提示词来激发 Agent 能力，只要提供正确的工具和合适的工具描述，就会自动的去规划、调用工具和完成任务。

#agent #ReAct框架 #GPT-4o #Claude 4 #模型能力

2周前

对于 Claude Code 来说这一大坨 prompt 其实没啥用，真正有用的是评论的那一行： > "Please add the appropriate logging information so that you [the agent] can use that log output to figure out this issue."

AI编程工具激战：Claude Code、Gemini Cli崛起· 897 条信息

#Claude Code #prompt没用 #logging信息 #agent #解决问题

𝙩𝙮≃𝙛{𝕩}^A𝕀²·ℙarad𝕚g𝕞

2周前

所有人用语言干的，LLM和其Agent都能干！ Claude卷完code卷office套件了。

AI编程工具激战：Claude Code、Gemini Cli崛起· 897 条信息

#LLM #agent #Claude #Office套件 #AI

Robinson · 鲁棒逊

2周前

大声说三遍：第一遍 AI是新的宏观基本面， AI是加速度的加速器， AI不只是tool，是不知疲倦的agent 第二遍 AI是新的宏观基本面， AI是加速度的加速器， AI不只是tool，是不知疲倦的agent 第三遍 AI是新的宏观基本面， AI是加速度的加速器， AI不只是tool，是不知疲倦agent 宏观基本面 × 加速²

#AI #宏观基本面 #加速 #agent

3周前

如果你用Claude Code编程，这个网站很值得收藏！有点像Claude Code插件商店，挑选需要的： ① MCP（比如Context 7、Exa搜索） ② Agent（如前端开发、Ruby开发提示词和规则） ③ Hook（比如Telegram、Slack通知、Vercel自动部署）可以单个复制安装，也可以点击添加到Stack Stack可理解为购物车，选好以后。自动生成一个统一的指令。一键安装到你的Claude Code，快速提升AI的专业水平。也方便团队共享插件协作。网址见评论区

AI编程工具激战：Claude Code、Gemini Cli崛起· 897 条信息

#Claude Code #MCP #agent #hook #AI工具

3周前

我之前认为让 Agent 帮我思考是很蠢的事情直到我发现，我没多少时间去详细思考我状态不好的时候，可能连 Agent 一半都比不上😅

#agent #思考辅助 #效率提升 #状态不佳 #自我反思

3周前

不会 planning 的都不是 agent 我会用 genspark 的 agent 随时随地分析大大小小的问题但是很少用各家大模型的 deep search deep search 的 planning 不行，芝麻大的问题，都要搞几千字报告任务规划和任务理解能力不行

#agent #GenSpark #Deep Search #任务规划 #任务理解

3周前

我准备做一个 Agent，监控我的完美主义倾向我在和其他 Agent 聊天的时候，一旦发现，就通知我🤡

#agent #完美主义 #监控 #聊天 #提醒

3周前

AI Agent 现状

#多智能体之争：Anthropic生态VS单智能体· 47 条信息

#AI #agent #发展 #挑战

3周前

我之前不信 Agent 的，现在我信了，要开始写 Agent 了

#多智能体之争：Anthropic生态VS单智能体· 47 条信息

#agent #人工智能 #技术 #积极