#工具调用能力

空谷 Arvin Xu

4个月前

其实我个人最好奇的是 Gemini 3.0 Pro 的工具调用能力，因为工具调用能力基本决定了驱动 Agent 的上限。之前聊架构方案还是 2.5 Pro 最 solid ，但它的问题就是不爱调工具，所以不太适合作为驱动 Agent 的核心。然后刚刚用 LobeHub 桌面端的 Local System 插件写了个手上的性能优化需求测试了下，整个分析很准确，实现也很精准，在我们这样一个近 20w+ 行代码的项目要做到这一点还是比较不容易了的。这次测试并没有很强的提示词工程约束，Gemini 3.0 Pro 累计用时 17 分钟完成了这个任务，总共调用了 63 次工具，消耗 3.5M token ，花费 1.5 刀。我感觉这样一个相对白坯的情况下，这个程度还是挺让人满意了，用来做 agent 应该是个还挺不错的选项了

Google Gemini 2.5发布引发AI模型性价比热议· 475 条信息

OpenAI新德里发布会：ChatGPT语音翻译功能引发热议· 869 条信息

#Gemini 3.0 Pro #工具调用能力 #agent #性能优化 #lobehub

10个月前

DeepSeek 官方公布了最新 R1 的更新内容，分别是： - 数学，编程，逻辑比肩o3 - 幻觉大幅下降 50% - 写作能力多面提升 - 工具调用能力大幅提升训练得很猛 respect

深度学习模型升级引发AI能力大跃进，行业迎新变革· 143 条信息

#DeepSeek #R1更新 #数学 #编程 #逻辑 #幻觉减少 #写作能力 #工具调用能力