Kai

Kai

0 关注者

1天前

一个观察: 为什么我说 cursor 的本质上就是二道贩子,因为如果你想做一个很强的 agent,定义一些自己的“高科技”tool。 但如果这种 tool 是在训练模型的数据中没有相似的,也就是模型完全没见过这种模式的 tool,模型是很难正确调用这个 tool 的,因为 GPT 这种架构的泛化能力并不强。 这就是为什么你看到 cursor 的 tool 都是模仿现有的 tool,比如 grep 这种模型已经见过格式和形式。 如果你发明了一种特别高效 特别强的 tool,那必须用大量的跟这个 tool 相关合成数据在训练的时候交互模型这个 tool 的使用方式。但靠 prompt 是教不会的。 这也就是为什么在 kimi 公开的文档中,为了强化 k2 的 agent 能力,他们搞了一堆模拟真实 coder 会用的 tool 调用的输入和输出,让模型学会不同类型的 tool 大概是什么样的,才能强化模型在 agent 的场景的能力。 TLDR: 好的 agent 必须搭配针对这个场景 fine-tune 过后的 model