#AI代理

2个月前

AI推理成本越低，token的需求越高。token的需求只会越来越高当一种资源（算力/智能）的效率提高、成本下降时，它的总消耗量不会减少，反而会呈指数级爆炸增长。 AI时代，你搜“最好的牙刷”，你的AI代理为你阅读1000篇牙刷测评，分析成分，对比价格，下单购买。这中间消耗了数百万个Token。哪怕每个Token只赚微不足道的钱，x1,000,000的用量将创造出比现在广告业大几十倍的营收规模

#AI推理成本 #token需求 #算力效率 #AI代理 #营收规模

Y11-杨继芸-靠谱找工作、找面试题、改简历、模拟面试

2个月前

微软最近宣布推出AI代理的新控制平面，这事儿挺有意思的。他们想把AI代理当成"数字员工"来管理，而不只是简单的代码。这听起来像是在给AI系统找个"工作证"和"管理手册"，让企业能用管理人类员工的方式来管AI了。这个叫Foundry的控制平面现在是公开预览阶段，能把AI开发者需要的身份管理、策略执行、状态监控和安全防护都集中在一个门户里。就像公司的HR系统能管员工入职、权限、考勤一样，这个控制平面也能管AI代理的"入职"（注册）、"日常工作"（监控）和"行为规范"（策略）。现在企业用AI代理最头疼的就是安全和大规模部署的问题。微软的Agent 365把现有的Microsoft 365管理工具扩展到了AI系统，这样公司就能在熟悉的界面里管理AI代理，还能统一设置输入输出的安全规则。就像给每个AI员工发了个统一的工牌，能看到他们每天做了什么，有没有越界。他们还推出了托管代理服务，开发人员不用自己搭服务器，就能把用微软或第三方框架做的AI代理直接放到"云办公室"里运行。这就像企业直接招了个"外包员工"，不用操心办公场地和设备。而且多代理工作流功能，能让好几个AI员工一起合作完成复杂任务，比如一个处理数据，一个做分析，一个写报告，还能可视化设计流程，就像项目经理安排任务。更贴心的是，AI代理现在能记住说话的上下文了，不用每次从头解释。就像同事之间聊天能接上话茬，不用重复说"我上次说的那个数据"。安全方面，微软把GitHub的代码安全工具和云安全防护整合起来了。开发人员写代码的时候，AI助手（Copilot）能直接提示哪里有漏洞，安全团队也能在安全系统里直接看到代码问题，就像安全主管和开发人员有了"共同的检查清单"，能一起解决问题。这些功能加起来，感觉像是给AI系统装了"身份识别"、"行为监控"和"安全防护"这三大件。以后企业用AI，可能就像用软件一样简单，不用再担心安全风险，也不用自己当"IT管理员"去维护复杂的系统。说到底，这事儿的核心是想让AI更像"工具"而不是"技术"。就像以前人们用计算器，现在用Excel，以后可能就用"数字员工"来处理日常工作了。微软这一步，可能真的在改变企业用AI的方式，让AI从实验室走向真正的日常工作场景。

#AI代理 #微软 #数字员工 #安全 #foundry

3个月前

如何构建你的第一个人工智能代理？感觉方法符合软件工程，比较靠谱哈

#多智能体之争：Anthropic生态VS单智能体· 81 条信息

#人工智能 #AI代理 #软件工程 #构建 #技术

3个月前

Claude Code webUI + Frp? ARP - AI 代理反向代理一个把内网 AI 如 Claude Code 暴露给安全、低延迟的公网入口代理系统，随时随地访问您的内网 AI 智能体这个项目复刻的 Claude Code web 真不错，还原度高。

AI编程工具激战：Claude Code、Gemini Cli崛起· 1256 条信息

#Claude Code #AI代理 #反向代理 #内网AI #公网入口

吴说区块链

3个月前

吴说获悉，Kite 宣布获得 Coinbase Ventures 投资，作为其由 PayPal Ventures 和 General Catalyst 领投的 A 轮融资的补充。此次资金将用于推进面向自主 AI 代理的支付基础设施开发，并加速 x402 协议的采用。

#Kite #Coinbase Ventures #A轮融资 #AI代理 #x402协议

3个月前

x402 现在很热,跟Eigen能扯上关系吗？还真的可以。大家都知道x402 支持AI代理之间的支付。不过，x402很纯粹，只负责支付，不管代理是否完成任务。如果在任务完成前付款，可能就白花钱了。之前也聊过，EigenCloud提供信任层，确保代理完成任务：支付了钱，然后拿到结果。这是Eigen可以提供支持的地方。简单来说，EigenCloud提供可验证计算（Tee + ZK）和任务结果上链证明。大概来说，用户通过 x402 开支付通道（锁定资金）；代理执行任务 → 结果提交至 EigenCloud 节点；EigenCloud 生成 ZK 证明或 Tee 认证，确认“任务已完成 + 结果正确”；触发 x402 条件支付（conditional release），资金解锁，完成支付。

#x402支付 #EigenCloud #可验证计算 #AI代理 #任务完成

4个月前

#每日推荐 agents - Claude Code 的智能自动化和多代理编排一个全面的生产就绪系统，结合了84 个专门的 AI 代理、15 个多代理工作流协调器和44 个开发工具，组织成62 个针对Claude Code的专用插件包括：调试工具包、后端开发、前端/移动开发、多平台应用程序、单元测试等

AI编程工具激战：Claude Code、Gemini Cli崛起· 1256 条信息

#AI代理 #Claude Code #自动化 #多代理编排 #开发工具

5个月前

抽空可以跑跑学习下，该仓库系统性地收集了多种LLM的应用案例，覆盖从入门到高级的AI代理、RAG、工作流等范畴，既有面向新手的快速上手代理，也有复杂的端到端流程与多Agent协作范例。

#LLM应用 #AI代理 #RAG #工作流 #多Agent协作

5个月前

1/6 「x402 + EIP-3009 == 不用KYC和账户的付费服务」「Agent狂喜的支付服务」这篇推文的结构： - x402 结合 EIP-3009 解决了什么问题？ - http402 和 EIP-3009 的协议介绍 - 完整支付流程 - 风险点和总结（已经了解eip3009和http402可以跳到完整支付流程） 1. x402 结合 EIP-3009 解决了什么问题？ - 不需要KYC: 现实世界的付款服务都需要复杂的账户体系和KYC，而通过 EIP3009 我们可以解决 - 自动化与无账户支付：传统API/内容付费需要注册、API Key、信用卡，流程繁琐且不适合AI代理自动化消费。x402 让“只要能U就能访问”，无需账户、无需人工干预。 - 微支付\支付宝等不同支付平台的服务：虽然都有MCP, 但是还是需要复杂的人类 KYC。结算快、无需信任：传统支付结算慢、易被拒付。x402 支付即结算，链上原子性强，适合AI/自动化场景。 AI/代理经济：AI代理可以自主为API、模型推理、数据存储等服务付费，真正实现“agentic commerce”。

#x402 #EIP-3009 #KYC #无账户支付 #AI代理

6个月前

应用已死，提示词万岁就在今天，2025 年 8 月 7 日，OpenAI 即将揭晓其 GPT-5 的面纱。当整个科技界都在屏息以待参数与性能的飞跃时，一个更根本的问题却被喧嚣所掩盖。我们每天稳定交互的手机应用，不足 10 个，但在数字坟场里，却沉睡着超过 500 万个僵尸程序。 GPT-5 和它的同类们带来的，不是对这个问题的修补，而是彻底的颠覆。它们在暗示，我们或许不再需要“应用”了。交互即应用。一个更准确的说法是，通过“提示词”的直观交互正在吞噬我们所熟知的那个“应用”。这不是又一场关于“小程序”或“超级应用”的陈旧辩论。那套逻辑依旧是在一个固定的壳里，做功能的加减法。而我们正在谈论的，是一种更彻底的瓦解：当用户的一个念头、一句指令，可以直接生成一个仅为此次交互而生的、用完即焚的临时界面与功能流时，我们不再需要那个预先下载、固化在屏幕上的图标了。它不是被谋杀的。是自杀。长久以来，我们默认了一条产品开发的朝圣之路：市场调研、产品定义、UI/UX 设计、前后端开发、测试、上架、迭代……每一个环节都沉重而昂贵，也固化了一套我们与数字世界打交道的神圣仪式。让我们用一个具体的念头来触碰这个未来： “帮我规划一个周末去苏格兰高地的三天自驾游，要避开游客密集区，预算 200 英镑，并且把每天的路线、住宿建议和打包清单发给我妻子。” 在旧世界，你需要打开地图应用、预订网站、点评APP、笔记软件，可能还要在社交媒体上问朋友，最后在微信或 WhatsApp 里手动整理、发送。你像一个数字世界的原始人，在不同的信息孤岛间艰难地迁徙、狩猎、采集。而在“交互即应用”的图景里，你的这段话就是那个“应用”本身。AI 代理（Agent）会像一个顶级私人助理，在后台自行调用地图 API、天气数据、酒店接口、交通信息，然后为你生成一个一次性的、高度个人化的信息聚合页面。这个页面，就是专为你这个“周末计划”而生的临时应用。任务完成，它便消失。要理解这种嬗变在专业领域的威力，Anthropic 对 Claude Artifacts 的一次演示，比任何宣言都更具说服力。在那个演示中，开发者输入一个简单的提示词，要求创建一个小游戏。Claude 不仅瞬间生成了代码，更关键的是，它在界面一侧同步渲染出一个功能齐全、可直接操作的“应用窗格”。开发者可以一边与这个临时生成的小游戏互动，一边用自然语言继续对它提出修改意见。应用，在这里成了一种流体。它在对话中被塑造、被重构，完全服务于当下的意图。它不是产品，它是一次交互的回响。这才是“交互即应用”的真正威力：它消解的不仅是 App 的外壳，更是完成任务的“过程”本身。但这种“应用的液化”，也正在无声地重构权力与风险的版图。当交互的入口，从一个个壁垒分明的 App，收束到少数几个强大的 AI 代理上时，市场的天平就发生了根本性的倾斜。未来，开发者竞争的或许不再是应用商店的排名，而是谁的 API 能被 AI 代理更频繁、更优先地调用。这是一种从 to C 到 to AI 的范式转移。与此同时，一个更切肤的风险在于，当“意图”可以直接转化为“执行”时，其中的模糊地带就成了新的攻击界面。一个心怀不轨的提示词，完全可以伪装成无害的请求。在传统的应用世界里，邮件App 和支付App 之间有着严格的权限沙盒。而在一个万物互联、API 皆可调用的 AI 代理面前，这堵墙正在变得千疮百孔。当然，就此断言所有应用都将消亡，是一种技术上的傲慢。反对的声音会说，我们高估了效率，却低估了习惯与情感的引力——对一个精心设计的应用图标的依赖、对一套熟悉交互逻辑的品牌忠诚，不会轻易消失。这不无道理。但我怀疑，这或许只属于我们这一代数字移民的怀旧。对于那些在提示词环境中长大的数字原住民而言，“忠于”一个 App，或许就像我们今天看待“忠于”一个浏览器主页一样，显得古怪而不必要。一个更坚实的壁垒，在于信任与风险的边界。银行、医疗或工业控制这类严肃领域，其核心价值是可控、可靠与可追溯，而非即时便利。它们绝不会将自己的命运交给一个面目模糊的通用AI。毕竟，一个通用 AI 或许能帮你预订餐厅，但你大概不会想用它来操作一台核磁共振仪。专业化与通用化之间的张力，依然存在。但对于那 90% 的、处理日常信息与服务的应用而言，它们的城墙正在倒塌。新发布的 GPT-5，以及它所有的竞争者，就像是盘旋在城外的巨兽，它们要改写的不是一城一地的得失，而是整片大陆的法则。应用死了。继承大位的，是提示词。它把权杖交给了那个能直接与你对话的“上帝之手”，也催生了我们这些习惯了即时满足、用完即走的信徒。这看似是技术的胜利，背后却是人性的博弈——对掌控的渴望与对繁琐的厌倦，两者永恒的拉扯。而你的下一个念头，也会不经他人之手，直接幻化成可交互的现实。乌拉！

#GPT-5 #提示词 #交互即应用 #AI代理 #应用消亡

張小珺 Xiaojùn

6个月前

给大家整理了技术报告link：第一篇技术报告：Kimi K2: Open Agentic Intelligence 第二篇技术报告访谈：Introducing ChatGPT agent: bridging research and action 红杉访谈OpenAI：OpenAI Just Released ChatGPT Agent, Its Most Powerful Agent Yet 第三篇技术报告：Qwen3-Coder: Agentic Coding in the World 第四篇技术博文：AI代理的上下文工程：构建Manus的经验教训（作者：Yichao 'Peak' Ji）

OpenAI新德里发布会：ChatGPT语音翻译功能引发热议· 869 条信息

#Kimi #ChatGPT Agent #Qwen3-Coder #AI代理 #技术报告

7个月前

🤖 Claude Code + Gemini CLI = AI协作新高度！刚试了这个神奇的工作流： 1️⃣ 安装配置 Gemini CLI 2️⃣ 在中描述任务需求 3️⃣ 启动 Claude Code，添加 "Proceed in consultation with Gemini" 虽然不是真正的 A2A（Agent-to-Agent），但这种 AI 代理协作的效果令人惊叹！ #AI协作 #ClaudeCode #GeminiCLI

AI编程工具激战：Claude Code、Gemini Cli崛起· 1256 条信息

#AI协作 #ClaudeCode #GeminiCLI #A2A #AI代理

7个月前

#每日推荐将AI代理转化为现实世界产品的开源操作手册提供了端到端的代码优先教程，涵盖了生产级别的通用人工智能（GenAI）代理的所有层次，引导用户从原型到生产的实现，提供了成熟的设计模式和可复用的蓝图，以及实际部署的案例学习。

#AI代理 #开源操作手册 #生产级 #通用人工智能 #设计模式 #案例学习

7个月前

做 Agent 研究的不要错过今天 Anthropic 发布的关于多智能体系统的文章。 ## 什么是多智能体系统？多智能体系统是指由多个AI代理（如LLM）协同工作、并行使用工具来完成复杂任务的系统。与单智能体相比，多智能体系统能同时探索多个方向，分工明确，提升效率和覆盖面，尤其适合开放性、动态变化的问题。 ## 为什么要用多智能体系统？在过去的十万年里，人类个体的智能水平不断提升。而在信息时代，随着人类集体智慧和协调能力的提升，人类社会的能力也呈指数增长。 Agent 也是类似的，即便是通用的智能体，在单独运作时也会遇到瓶颈，而 Agent 群体可以完成更多的任务。在内部研究评估中，Claude Opus 4 为主导 Agent，Claude Sonnet 4 为子 Agent 的系统，比 Claude Opus 4 的单 Agent 性能高出 90.2% 。举例来说，当被要求识别信息技术标准普尔 500 指数公司的所有董事会成员时，多 Agent 系统通过将其分解为子 Agent 的任务找到了正确答案，而单 Agent 系统则无法通过缓慢的顺序搜索找到答案。 ## 为什么多智能体系统是有效的？搜索的本质就是压缩。从庞大的语料库中提炼 Insights。但是语料过于庞大，压缩就会失真。通过多智能体系统就能有效解决这一问题。子 Agent 在自己的上下文窗口中进行压缩，自主地为主 Agent 提供多个方面的浓缩信息。子 Agent 各有分工，使用不同的工具、提示词、探索路径，这样减少了路径依赖，实现多个独立方向的同时调查。多 Agent 系统的有效是因为他们使用了足够多的 token 来解决问题。在 BrowseComp 评估（测试浏览智能体查找难以找到的信息能力），80%的性能差异都可以用 token 使用的多少来解释。15% 的差异可以用工具调用次数和模型选择来解释。所以，多 Agent 是一种非常有效的架构。把工作分配给具有单独上下文窗口的智能体，以增加并行推理能力。 ## 多智能体系统的缺点缺点嘛，就是贵。智能体使用的 Token 一般是聊天的 4 倍。而多智能体系统使用的 Token 一般那是聊天的 15 倍。只有任务的价值足够高，才能对得起这么高的成本。此外，一些任务并不适合多智能体系统，比如要求所有智能体共享上下文，或多智能体之间具有依赖关系的任务。例如，大多数的编码任务，可并行化任务比较少。 ## 多智能体系统和 RAG 的区别是什么？传统的方法使用 RAG，静态检索。获取与输入查询最相似的一组数据块，并用这些数据块进行回应。而多智能体架构使用多步骤搜索，动态查找相关信息，结合新发现的信息，分析结果，并形成高质量的答案。流程图展示了我们多智能体研究系统的完整工作流程。当用户提交查询时，系统会创建一个 LeadResearcher 智能体，并进入迭代研究流程。 LeadResearcher 首先仔细考虑方法并将其计划保存到内存中以保留上下文，因为如果上下文窗口超过 200,000 个标记，它将被截断，并且保留计划非常重要。然后，它会创建专门的子代理（此处显示两个，但数量可任意），并执行特定的研究任务。每个子代理独立执行网络搜索，运用交叉思维评估工具结果，并将结果返回给首席研究员。首席研究员会综合这些结果，并决定是否需要进一步研究——如果需要，它可以创建更多子代理或改进其策略。一旦收集到足够的信息，系统就会退出研究循环并将所有发现传递给 CitationAgent，后者处理文档和研究报告以确定引用的具体位置。这确保所有声明都正确归属于其来源。最终的研究结果（包括引文）将返回给用户。

#多智能体之争：Anthropic生态VS单智能体· 81 条信息

#Anthropic #多智能体系统 #AI代理 #LLM #智能水平提高

8个月前

研究人员利用 #Copilot 中的逻辑漏洞让 AI 代理帮忙窃取敏感数据，整个过程不需要用户点击，只需要向目标企业员工发送一封普通的文本邮件即可。这封邮件包含提示词，邮件会被 RAG 收集并按照指令进行操作，AI 代理未经用户同意的情况下会将数据发送给攻击者。查看全文：

#Copilot #AI代理 #数据窃取 #RAG #网络攻击

8个月前

如何开始学习AI代理！来自：Python Developer

#AI代理 #学习 #Python开发者 #人工智能 #编程 #技术 #入门 #课程

8个月前

local-ai-packaged 是一个开源的本地 AI 开发环境模板，通过 Docker Compose 集成了多种主流工具，包括 n8n、Supabase、Ollama、Open WebUI、Flowise、Qdrant、Neo4j 和 SearXNG 等。用户可以通过该项目一键部署本地大型语言模型（LLM）、AI 代理和检索增强生成（RAG）等应用。n8n 负责自动化和工作流编排，Supabase 和 Qdrant 提供数据及向量数据库支持，Ollama 实现本地 LLM 推理。Neo4j 用于知识图谱场景，SearXNG 可以作为隐私友好的搜索引擎。 Open WebUI 和 Flowise 提供方便的可视化界面，用于与 LLM 和 AI 工作流交互，简化了应用开发和使用体验。所有组件均在本地部署，保障了数据隐私和自主控制，适合开发、测试和个性化扩展。详细内容和部署方法见项目仓库：

#开源 #AI开发 #Docker Compose #n8n #Supabase #Ollama #Open WebUI #Flowise #Qdrant #Neo4j #SearXNG #本地部署 #大型语言模型 #AI代理 #检索增强生成

8个月前

12-Factor Agents - 构建可靠 LLM 应用的原则 "12-Factor Agents" 项目借鉴了经典的 "12 Factor Apps" 理念，为构建生产级别的、基于大型语言模型的应用程序提供了一套清晰、实用的工程原则。作者 Dex 通过自身丰富的实践经验，指出当前许多 AI 代理框架虽然功能强大，但在追求高可靠性、可维护性和可扩展性的生产环境中，开发者往往需要回归到更基础的软件工程实践。该项目认为，许多成功的智能体应用，其核心并非完全不可控的自主决策循环，而是精心设计的、以确定性代码为主导，并在关键环节巧妙嵌入 LLM 能力的软件系统。因此，它提出了12个核心要素，旨在帮助开发者： - 增强控制力：例如“拥有你的提示”、“拥有你的上下文窗口”、“拥有你的控制流”。 - 提升工程质量：例如“工具即结构化输出”、“小型、专注的代理”、“通过简单的 API 启动/暂停/恢复”。 - 确保系统稳健性：例如“将错误压缩到上下文窗口”、“统一执行状态和业务状态”。 - 实现人机有效协同：例如“通过工具调用联系人类”。其根本目标是让开发者，即使没有深厚的 AI 研究背景，也能将 LLM 的强大能力以模块化、可控的方式整合进现有产品，从而更快地交付高质量、能真正服务于生产客户的 AI 软件。

#12-Factor #LLM #大型语言模型 #AI代理 #生产级应用 #工程原则

BNB Chain 華語

8个月前

Caila 是一個基於BNB Chain MCP 協議開發的現實世界AI代理，專為處理氣象數據並輔助旅行、交通及緊急情境的決策而設計。☁️☔️☀️ 註：本文僅供參考，不構成財務建議，請自行調研（DYOR）。

#Caila #BNB Chain #MCP协议 #AI代理 #气象数据 #旅行助手 #交通决策 #紧急情境 #技术发展

11个月前

Manus 体验报告能自动完成任务并交付结果的AI代理全部是在一个云端电脑上完成，AI自动思考分析、自动通过浏览器访问网站收集数据、完成内容撰写最后在云端电脑运行各种程序并编写代码给你交付出相应的文档、音频、视觉、网站交互结果。真实体验是一个任务运行的时间会很长，但是你可以干别的事情等待它完成。总体来看交付的结果还是不错的。

#AI代理 #自动化任务 #云端计算 #任务管理

11个月前

OpenAI 计划推出 AI“代理”（agents），月订阅费用在 2,000 美元至 20,000 美元之间，专注于编程和博士级研究等特定任务。这一定价策略引发了关于其合理性的讨论，批评者指出，这一成本远高于雇佣具备灵活性且可能更具成本效益的人类专家。竞争对手如 Anthropic 提供类似服务，但价格远低于 OpenAI，这使其定价策略受到质疑

#OpenAI #AI代理 #定价策略 #Anthropic #成本效益 #编程 #博士级研究

11个月前

Manus：一个真正能完成任务的AI代理它不仅可以帮你解答问题，而且还能直接分析问题并自动执行任务然后直接最终交付结果。比如收集、分析数据，直接分析股票市场、然后生成一份财务报告甚至直接给你生成一个网页展示😅 反正就是直接交付可视化的最终结果而不是单纯的答案！可以执行的任务：计划旅行：Manus 可以整理行程、个性化推荐路线，并生成旅行手册。股票分析：自动分析 Tesla 或 Amazon 等公司的财务状况，生成可视化报表。在线店铺优化：分析电商销售数据，提供增长策略。深度数据处理：Manus 能够收集、清理、分析数据，并以表格、图表、仪表盘等方式呈现数据。商业决策支持：帮助企业进行市场分析、财务分析、竞争对手研究等。自动制作教学材料：生成教学视频、PPT、课程笔记等。优化工作流：帮助整理任务、写作、编程、调研等，提高效率。

#Manus #AI代理 #任务执行 #数据分析 #股票分析 #旅行规划

1年前

帮网友问：如果想用AI agent去阅读我的领域的每天最新的文献，每篇文献写一个简短的总结，每晚总结成一封邮件发到我邮箱里。请问现在有类似的工具吗？谢谢🙏

#AI代理 #文献阅读 #工具 #邮件总结

1年前

OpenAI首席执行官萨姆·阿尔特曼（Sam Altman）对通用人工智能（AGI）的发展表示乐观，他指出，公司相信已经掌握了构建AGI的方法，并预测到2025年AI代理可能会进入劳动力市场，从而可能重塑企业运营。他还提到了关于超级智能的讨论，暗示未来AI可能显著加速科学和技术的进步。这些前瞻性的声明表明，OpenAI正向更雄心勃勃的AI目标迈进，体现了其战略转变。

#通用人工智能 #AGI #劳动力市场 #AI代理 #超级智能 #科学进步 #技术进步 #OpenAI #战略转变

1年前

这个是swarms的中文版v1白皮书等真正完成的时候看吧，看能做成什么样子，swarms按里面说作代理间的支付层消耗. Openai有个sama框架都抄袭了部分swarms代码. Swarms框架开发了三年，支持多个 AI 代理协同工作，凭借自主性、模块化和扩展性，让 AI 代理高效协作，擅长拆解复杂任务，甚至兼容ai16z的eliza框架😂.

#swarms #白皮书 #OpenAI #支付层 #AI代理 #自主性 #模块化 #扩展性 #协同工作 #AI16z #Eliza框架