meng shao 0 关注者 关注 16小时前 今天看到这个「Benchmark Prompts」开源数据集,是用来测试 AI Agent 前端真实任务表现的。 数据集有 200+ 真实前端任务,包含各种 Figma 设计和文本指令,覆盖不同前端技术栈(如 React/Next.js、组件库、CSS 框架),聚焦复杂、非基准式任务。从编译成功率、代码审查通过率和功能实现率三个方面判定。 测试结果 Kombai 这个前端 AI Agent 表 #AI Agent #Benchmark Prompts #前端任务 #Figma #Kombai 前往原网页查看