九原客 0 关注者 关注 5天前 Kimi官方对OpenRouter上不同的供应商的 Tool Calling能力做了Benchmark,发现有些供应商提供的模型服务有较大问题。 可能是推理Bug,也可能是不合理的量化。 另外 1. 使用的2000条Tool Calling 测试集没有开源。 2. 可以在 OpenRouter配置中排除掉某些供应商。 #Kimi #Openrouter #tool calling #Benchmark #模型问题 前往原网页查看