时政
财经
科技
虚拟货币
其他
登录
#工具调用能力
关注
空谷 Arvin Xu
1个月前
其实我个人最好奇的是 Gemini 3.0 Pro 的工具调用能力,因为工具调用能力基本决定了驱动 Agent 的上限。之前聊架构方案还是 2.5 Pro 最 solid ,但它的问题就是不爱调工具,所以不太适合作为驱动 Agent 的核心。 然后刚刚用 LobeHub 桌面端的 Local System 插件写了个手上的性能优化需求测试了下,整个分析很准确,实现也很精准,在我们这样一个近 20w+ 行代码的项目要做到这一点还是比较不容易了的。 这次测试并没有很强的提示词工程约束,Gemini 3.0 Pro 累计用时 17 分钟完成了这个任务,总共调用了 63 次工具,消耗 3.5M token ,花费 1.5 刀。我感觉这样一个相对白坯的情况下,这个程度还是挺让人满意了,用来做 agent 应该是个还挺不错的选项了
Google Gemini 2.5发布引发AI模型性价比热议· 475 条信息
OpenAI新德里发布会:ChatGPT语音翻译功能引发热议· 869 条信息
#Gemini 3.0 Pro
#工具调用能力
#agent
#性能优化
#lobehub
分享
评论 0
0
orange.ai
7个月前
DeepSeek 官方公布了最新 R1 的更新内容,分别是: - 数学,编程,逻辑比肩o3 - 幻觉大幅下降 50% - 写作能力多面提升 - 工具调用能力大幅提升 训练得很猛 respect
深度学习模型升级引发AI能力大跃进,行业迎新变革· 143 条信息
#DeepSeek
#R1更新
#数学
#编程
#逻辑
#幻觉减少
#写作能力
#工具调用能力
分享
评论 0
0
个人主页
通知
我的投稿
我的关注
我的拉黑
我的评论
我的点赞