meng shao

meng shao

0 关注者

16小时前

今天看到这个「Benchmark Prompts」开源数据集,是用来测试 AI Agent 前端真实任务表现的。 数据集有 200+ 真实前端任务,包含各种 Figma 设计和文本指令,覆盖不同前端技术栈(如 React/Next.js、组件库、CSS 框架),聚焦复杂、非基准式任务。从编译成功率、代码审查通过率和功能实现率三个方面判定。 测试结果 Kombai 这个前端 AI Agent 表

相关新闻