时政
财经
科技
虚拟货币
其他
登录
#LLM工具
关注
宝玉
1个月前
确实,Manus 很聪明,他们把工具分成了 3 层: 第 1 层:函数调用 (Function Calling) 这是最基础的一层,只保留一小组固定的、原子化的函数,比如:读写文件、执行 Shell 命令、搜索文件等。在 LLM 的系统提示词中就只有这一层的工具定义,相对比较少,15 个以内,输入格式和输出格式都很清晰,不容易出错,但这里面有两个工具很特殊,一个是 Shell, 一个是 File。 第 2 层:沙箱工具 (Sandbox Utilities) 每个 Manus 会话都运行在一个完整的虚拟机沙箱里。就是原推文提到的,虚机预装了很多命令行工具,比如格式转换器、语音识别工具,甚至一个 mcp 命令行客户端。 然后这些工具都通过第 1 层中定义的 Shell 来调用,就是命令行工具,命令行调用。 但是这么多工具模型怎么知道呢? Manus 在系统提示词里会直接告诉 LLM,在一个特定的文件夹里有很多预装的命令行工具。对于最常用的工具,直接列出它们的名字。不常用的,LLM 可以直接通过原推提到的命令列出所有命令行工具,通过 --help 参数来查看任何一个工具的用法,因为所有这些工具都是他们自己开发的,格式统一。 第 3 层:代码包与 API (Packages and APIs) 这一层其实就是 LLM 实时编写 Python 代码,通过代码实现更复杂的功能。比如用户想查询某个 API 的数据,可以直接用 Python 写一个函数,fetch API 的数据,并解析成需要的格式。 其实在 Codex 中,用 Python 代码当工具已经用的很多了。 由于复杂的运算都是代码完成的,返回给 主 Agent 的知识计算后的结果,所以并不会占用主 Agent 的上下文。 这样 3 层设计的好处是,从模型的角度看,它需要调用的工具就固定是第 1 层的十几个,而借助命令行和代码,它又可以衍生出无数的工具组合。 还有一点就是我在之前推文提到的子智能体,Manus 也是大量采用“智能体即工具 (agent as tool)”的模式。把子智能体当工具用,比如负责检索是一个子智能体,但是这个子智能体在主 Agent 看来就是一个工具。同时也可以很好的起到减少上下文的效果。
#Manus
#LLM工具
#分层设计
#智能体即工具
#代码生成
分享
评论 0
0
fin
10个月前
最近仔细调研了一下,发现一个有点意外的事情,其实即便是FAANG这样的互联网大厂程序员,经常使用GPT的SDE的比例(比如说每周至少用一次,门槛很低了)比想象中低,准确的说,只有50~60% 刚得到这个数据的时候还是有点惊讶的,比直觉上低太多,这已经是排除了所有其他干扰项只看SDE的使用比例数据了 互联网公司内部做genAI/LLM工具的组,竟然也得自己分析如何提高公司内部用户留存率,笑死,竟然不是程序员们求着要用,chatGPT都问世已经两年了 所以在大厂里做SDE,只需要每周用一次GPT/genAI,就已经在拥抱genAI这项上四舍五入超越了快一半同行🤣 至于可能的原因,估计主要是现有老业务比较熟悉,coding和debug也都是业务逻辑,能用的地方不多,就算用了GPT也提升不大。 以至于在公司呆的越久的人用GPT热情越低,也是非常明显的普遍现象 另外的原因,估计也是LLM的表现不尽如人意,就算是有公司内部组专门做RAG而且水平不低,神经刀式不稳定降智也是常有的事 用公司内部的agent tool的人就更少了,百分比太低,以现在agent处理复杂业务问题的稳定性和可控性水平,能经常性玩转真是不容易 我也搜了一下网上其他人的调研进行验证,和我的数据结论基本是接近的,比如Gemini找了不少resource也说大厂weekly使用比例在50~75%之间 所以劈柴去年10月说的什么Google内部超过25%的code都是AI写的,那纯粹是画饼都不讲基本法了 这还是和genAI离得最近的程序员群体,如果把其他领域算上,那普及率就更低了,半导体员工经常使用公司genAI tool的比例,在20%以下 绝大部分传统半导体厂甚至没有内部支持的靠谱RAG(RAG做的非常差劲+不同组之间的资料是全保密的无法access,更不说RAG),经常用genAI tool工作的比例(定义为每周用一次)能有10~15%不错了 openAI的颠覆所有领域取代程序员取代人的雄心壮志,只能说路漫漫其修远兮,即便是在硅谷,也没那么快 作为一个半导体从业者,这一年我也算是尽可能的使用genAI tool了,工作中平均每天的使用次数在10次以上,目前的感受是提高的效率很有限,可能…有5~10%?大概就是每周能节约几个小时的水平 ---------------------------------------- 2025新年resolution,更加积极的使用genAI tool,能通过genAI提高工作效率20%,我就非常非常满意了
#互联网公司
#程序员
#GPT使用率
#FAANG
#genAI
#LLM工具
#用户留存率
#数据调查
分享
评论 0
0
个人主页
通知
我的投稿
我的关注
我的拉黑
我的评论
我的点赞