#开源项目

2周前
#BestBlogs 从 browser-use 出发,品 Agent 实现 | 阿里云开发者 从工程师视角深入解析了 LLM Agent 的实现原理与工程实践,以开源项目 browser-use 为例。 摘要: 本文从工程师的视角出发,系统地回顾了 LLM 应用从纯对话到 Workflow 编排再到 Agent 的演进过程。重点阐述了 Agent 的三个核心组成部分:记忆(Memory)、规划(Planning)和工具(Tools)。详细介绍了 Agent 的两种规划范式(分解优先与交错分解)和记忆的分类(短期与长期)。 作者以 browser-use 项目为例,剖析了其工程架构,包括 Agent Core、MessageManager、Memory、LLM Interface、Controller 和 BrowserContext 等组件及其交互流程。文中特别强调了 SystemPrompt、AgentMessagePrompt、PlannerPrompt 和 toolPrompt 在 Agent 运行中的作用,并分析了 browser-use 如何通过 SystemPrompt、示例引导和 Pydantic 进行结构化输出的保证。最后,文章探讨了 browser-use 的记忆管理实现,并对生产环境的持久化存储提出了建议。 主要内容: 1. Agent 是 LLM 应用演进的新阶段,具备自主规划和执行能力。 -- Agent 相比 Workflow 编排更进一步,能够根据用户需求自主决策、规划步骤,并调用工具与环境交互,大幅提升生产力。 2. 记忆、规划和工具是构建 Agent 的三大核心要素。 -- 记忆(短期/长期)提供上下文和经验,规划负责任务分解和策略调整,工具赋予 Agent 与外部世界交互的能力。 3. ReAct 框架是实现 Agent 运行时逻辑的有效方式。 -- 借鉴人类思维模式,通过思考(Thought)→行动(Action)→观察(Observation)循环,使 Agent 能逐步逼近目标并从错误中学习。 4. 结构化输出是 Agent 稳定性的核心。 -- 通过在 System Prompt 中明确格式、提供示例和使用 Pydantic 等工具进行强制验证,确保 LLM 输出稳定可靠,便于后续处理和工具调用。
1个月前
《CCXT可能已经默默的偷取了数千万U》 昨天发了的推引起量化圈的震动,几乎大家都不知道CCXT在偷偷干这勾当。 我粗算了下这两个月光HL、KUCOIN、BYBIT三个所就偷走了我大约15000U的手续费返佣,1年下来可能得接近10W U。如果按整个币圈来算,3年下来偷取的手续费可能几千万甚至上亿U,绝对比币圈大部分项目方都赚钱,完全脱离了开源的本质。 昨天我在github issue发文说了这个问题,官方DEV直接以开源的你可以改自己不改为由,close了issue并且关闭评论,也难怪这么多年一直没人提这事,原来都被封口了。 然后今天突然发现我的推下面出现很多洗地的号,口径也都是和官方DEV一直,反正开源的出事你自己承担。 我是不会改开源代码吗?是TM这些broker id藏的很深啊。 CCXT每个交易所的代码都是几千行,每个交易所带的参数都不一样,有的藏在sign方法里,有的藏在create order里,有的藏在header里。 别说你根本不知道有broker这回事,就算知道你如果不是很仔细的看过每一行代码,都不一定能找出来。 CCXT有反佣是在页面上写清楚的,大家可以自己选择使用无可厚非。但是私带broker id从来没有在官方任何的网页和文档里说过,提出问题的人也被删帖了,这不是偷窃是什么??? 看了一下github更新记录,broker id应该是在2022年ccxt pro版本从收费改成免费以后,全部带上的。所以这个世界上,也许免费的才是最贵的。 这件事触动的利益极大,甚至我看了其他如humming bot等开源的代码也带了(有没有告之用户我没去核实),但至少代码是写在非常醒目的位置不难发现,不像CCXT藏的那么深。 为了便于大家定位和修改问题,我把常用的交易所代码都贴出来给大家看一下: