时政
财经
科技
虚拟货币
其他
登录
#Tool
关注
Kai
1周前
一个观察: 为什么我说 cursor 的本质上就是二道贩子,因为如果你想做一个很强的 agent,定义一些自己的“高科技”tool。 但如果这种 tool 是在训练模型的数据中没有相似的,也就是模型完全没见过这种模式的 tool,模型是很难正确调用这个 tool 的,因为 GPT 这种架构的泛化能力并不强。 这就是为什么你看到 cursor 的 tool 都是模仿现有的 tool,比如 grep 这种模型已经见过格式和形式。 如果你发明了一种特别高效 特别强的 tool,那必须用大量的跟这个 tool 相关合成数据在训练的时候交互模型这个 tool 的使用方式。但靠 prompt 是教不会的。 这也就是为什么在 kimi 公开的文档中,为了强化 k2 的 agent 能力,他们搞了一堆模拟真实 coder 会用的 tool 调用的输入和输出,让模型学会不同类型的 tool 大概是什么样的,才能强化模型在 agent 的场景的能力。 TLDR: 好的 agent 必须搭配针对这个场景 fine-tune 过后的 model
#Cursor
#agent
#Tool
#GPT
#Kimi
分享
评论 0
0
不鍊金丹不坐禪
2个月前
拿 DSPy 改造 "Agent as function Tool” 太舒服了8️⃣ 😄,严格结构化工作流型的 ReAct ToolCalling Agent 实现起来可控性非常强。如果作为 MCP(agent as MCP)或A2A的 工作流Agent内部实现也很合适。[DSPy]()
#DSPy
#agent
#Tool
#MCP
#React
#工作流
#A2A
#可控性
分享
评论 0
0
个人主页
通知
我的投稿
我的关注
我的拉黑
我的评论
我的点赞