#工具调用

砍砍@标准件厂长

3天前

4.0.2 上架了对工具调用的逻辑进行了优化修复了后续对话丢之前工具输出的 bug

iOS 26 Beta 2：流畅优化难抵卡顿发热· 186 条信息

#工具调用 #逻辑优化 #Bug修复 #对话优化 #中性

迈克 Mike Chong

1个月前

真的重磅新闻： Gemini 3.0 出现在了 Cursor。速度极快，工具调用（tool calling）极强。一个 thread（2楼有视频 live vibe coding with Gemini 3.0）

Google Gemini 2.5发布引发AI模型性价比热议· 280 条信息

OpenAI新德里发布会：ChatGPT语音翻译功能引发热议· 654 条信息

#Gemini 3.0 #Cursor #工具调用 #速度极快 #积极

1个月前

目前 Qwen Code 更好用了，工具调用成功率较高，识别图片后自动转图片模型，之后再自动回到 Coder 模型

深度学习模型升级引发AI能力大跃进，行业迎新变革· 131 条信息

#Qwen Code #工具调用 #图片模型 #Coder 模型 #成功率较高

2个月前

Agentic coding 的形态随着模型能力提升也在发生变化，开发者越来越不关心 coding 的过程，而是 chatting 和 orchestration 的体验，Agent 需要干好的事情变成了：维持多轮对话 + 准确的工具调用 + 能自愈的任务闭环。 Claude Code 的设计就把 coding 过程本身给抽象掉了。未来要把护城河做出来，产品需要考虑，1）具备澄清需求的能力，也就是帮助用户把好的问题给定义清楚；2）具备验证闭环的能力，提供完善的自动化测试、安全扫描和回滚机制等等。前者保证事情被做对，后者保证交付结果稳定且可靠。

AI编程工具激战：Claude Code、Gemini Cli崛起· 1155 条信息

#Agentic Coding #多轮对话 #工具调用 #任务闭环 #Claude Code

3个月前

一直就觉得 json based tool call 是个错误

#JSON #工具调用 #错误 #技术评估 #负面情绪

𝗖𝘆𝗱𝗶𝗮𝗿

3个月前

12-Factor Agents 是一个由humanlayer组织维护的开源项目，旨在提供构建可靠 LLM 应用程序的原则和方法论。以下 12 个核心原则，大家看看有没有似曾相识？ ○ 自然语言到工具调用 ○ 拥有你的提示词 ○拥有你的上下文窗口 ○ 拥有你的上下文窗口化输出 ○ 统一执行状态和业务状态 ○ 使用简单 API 启动/暂停/恢复 ○ 通过工具调用联系人类 ○ 拥有你的控制流 ○ 将错误压缩到上下文窗口 ○ 小型、专注的代理 ○ 从任何地方触发，在用户所在的地方与他们相遇 ○ 使你的代理成为无状态化简器

#12-Factor Agents #LLM应用程序 #开源项目 #原则和方法论 #工具调用

3个月前

最近我也在思考 Workflow 和 Agent 到底什么关系，我的一个初步想法： Workflow 本质上是工具，只是工具中用到了 AI 能力，所有能被定义成 Work Flow 的就应该能被做成工具。 Agent 更像是 AI，它能主动规划、去调用工具，Workflow 应该是 Agent 的一个可以被调用的工具。你怎么看？

#Workflow #agent #AI工具 #AI能力 #工具调用

3个月前

这里面很有意思的点是 Agent 1.0 到 Agent 2.0 的升级，其中最大的变化： Agent 1.0 的时候会压缩历史会话，Agent 2.0 就不压缩了，只处理用户输入的大内容。这其实现在也是 Agent 请求的标配，不再花精力去压缩上下文，无脑把历史会话都发过去，一方面这样不担心上下文损耗，一方面 Prompt Caching 可以降低成本。但是对工具的调用仍然会对结果进行总结和记忆，因为工具是相对独立的上下文，只要把关键信息加入主上下文即可。同时工具还可以是子智能体，也可以帮助分担上下文，避免很快上下文就爆掉。

#Agent升级 #上下文处理 #Prompt Caching #工具调用 #子智能体

4个月前

我用 ClaudeCode 花 2 小时没写一行代码做了一个翻译智能体，并且开源了整个过程这周没怎么更新内容，主要是忙于研究 AI Agent，深度体验了 Claude Code，并且模仿着它的原理实现了一个简单的翻译智能体，最终成品效果不错，只要你输入一段要翻译的文字、或者网址、或者本地文件路径，它就能帮你提取要翻译的内容并翻译。（参考图1）可能你会觉得这似乎没什么了不起的，跟传统的聊天应用也没什么区别，但麻雀虽小五脏俱全，它却是一个真正的 AI Agent。那么 AI Agent 和普通 AI 聊天工具有什么区别呢？关于 AI Agent，我觉得写的最好的文章是 Anthropic 的《构建高效 Agent》，它把 Agent 定义的很清楚： > 智能体（Agent）这个词可以有几种不同的定义。部分用户认为智能体是完全自主的系统，能够在长时间内独立运作，通过使用各种工具来完成复杂任务。另一部分用户则将智能体定义为更具指令性的实现方式，即严格按照预先设计的工作流程运行的系统。在Anthropic，我们将这些不同的系统统称为具备智能体特征的系统（agentic systems），但在架构上，我们明确区分两类系统： > - 工作流（Workflows） > 这种系统的特点是：大语言模型（LLM）与各种工具的调用顺序，由事先定义好的代码逻辑所控制。 > - 智能体（Agents） > 与工作流不同的是，在智能体系统中，大语言模型能够自主决定如何运用工具、动态地引导整个任务的执行过程，从而具备更强的自主性。归纳下来主要就是这几点区别： 1. AI Agent 能和外部环境交互比如它能使用工具读取本地文件；能读取远程网页 2. AI Agent 能动态的使用工具比如我如果只是输入要翻译的文本，它就不会调用任何工具，如果我在一段文本中包含一个要翻译的网址，它就会从中提取要翻译的网址，并抓取内容再翻译 3. AI Agent 能决定任务是否完成举例来说，如果我的指令不是简单的翻译某一个网址，而是比较复杂的指令，像下面这样的： > 请访问这个博客https[:]//ingrids[.]space/ 并将前两篇文章的内容翻译为中文那么它就会先抓取首页，然后分析首页的内容，找到前两篇文章的链接，再去分别抓取前两篇文章，最后再一起翻译，在这个过程中它使用了三次网页抓取工具，直到它认为已经完成任务了才会停止工具的调用。（这个使用案例的截图见图3，有兴趣的也可以自己下载代码运行试试看） Agent 能处理高度复杂的任务，但它们的实现通常很简单：本质上就是 LLM 利用环境反馈在循环中调用工具。连 Claude Code 这样复杂的 AI Agent，底层原理都是这样的，也是不停的调用工具，直到完成任务为止，就像图4 这样。 Claude Code 和普通 Agent 主要的不同在于 Claude Code 能启动子 Agent，也就是它能开分身，把分身当作自己的一个工具来用。就好比一个 AI 程序员，要去实现一个相对复杂一点的功能模块，它会先调用 TODO 工具，把任务分解，然后每个子任务让自己的分身去实现模块，分身只需要专注的完成子任务，这个分身有 AI 程序员本体一样的能力，也能调用所有的工具，等它完成子任务了，AI 程序员再让新的分身去继续下一个任务，直到所有任务完成为止。为什么我在这里选用的是豆包 1.6 模型呢？在实现这个智能体的过程中，我使用的是豆包 1.6 的模型。主要是因为像 AI Agent 这样的任务，普通的大语言模型并不擅长调用工具，即使是普通推理模型都不行，必须要经过专门针对工具调用强化学习（RL）过的模型。简单理解就好比一个大学生，每天要反复练习怎么使用各种工具，用对了工具就有奖励，没用对就没有奖励，这样经过一段时间的学习后，就会特别擅长使用各种工具。只有这样经过强化训练的模型才能胜任好 AI Agent 的任务。目前主流的模型除了豆包 1.6，还有 o3、Claude 4、Gemini 2.5 Pro 来开发 Agent 都很好，豆包 1.6 相对性价比是很高的，国内使用也没有封号的风险。另外火山引擎提供了 MCP Servers，像一些第三方工具可以方便的集成，比如我现在自己实现的网页抓取就很简陋，大部分网页其实都抓不了，如果要让它兼容更多网页，最简单的选择就是去选一个成熟的网页抓取的 MCP 服务，或者后面要支持 PDF 的翻译，这些都能在火山引擎上找到对应的可用 MCP 服务。

AI编程工具激战：Claude Code、Gemini Cli崛起· 1155 条信息

#AI Agent #ClaudeCode #翻译智能体 #豆包 1.6 #工具调用

4个月前

前些天字节跳动火山引擎举办Force原动力大会。发布了豆包大模型1.6、视频生成模型Seedance 1.0 pro等新模型。尤其是豆包1.6系列，非常重要。为什么？很多人说，今年是 AI Agent 落地元年。 Agent 产品第一步要做任务拆解规划。这块非常依赖大模型的深度思考能力、工具调用能力，还有多模态支持能力。火山引擎总裁谭待的说：深度思考、多模态和工具调用等模型能力提升，是构建Agent的关键要素个人非常认同！另外，因模型备案、数据安全、地缘政治等诸多原因。国内 AI Agent 产品发展，必须依赖国内模型的强大。 Deepseek R1 非常棒！但是，有点可惜，它不支持多模态，这样应用场景会很受限。所以，拥有媲美 Deepseek R1 推理能力，又支持多模态的豆包 1.6 系列大模型发布。无疑是国产 AI 产品的希望之光。一起了解、测试下豆包 1.6 系列模型。

深度学习模型升级引发AI能力大跃进，行业迎新变革· 131 条信息

#字节跳动 #火山引擎 #Force原动力大会 #豆包大模型1.6 #Seedance视频生成模型 #AI Agent #任务拆解 #多模态 #大模型 #深度思考 #工具调用

6个月前

看 Cursor 的 AI 工作流，代码改着改着可能是因为工具调用传错参了，导致源码直接被删了一半，于是它又凭借刚刚阅读过的 context 记忆，把代码给背诵了一遍还原了出来😂

#Cursor #AI #工具调用 #源码恢复 #代码记忆 #Context