马东锡 NLP 🇸🇪 0 关注者 关注 6个月前 读了 Kimi K2 的 blog,Agentic Capabilities 令人印象深刻。 如blog中所说,Kimi K2 借鉴了ACEBench,在evaluation上,不仅衡量端到端 End Accuracy,针对每一步tool call也给出 Process Accuracy,这种对process的重视,能显著提升 LLM 的 Planning 能力。 所以,JavaScript 前往原网页查看