今天看到这个「Benchmark Prompts」开源数据集，是用来测试 AI Agent 前端真实任务表现的。数据集有 200+ 真实前端任务，包含各种 Figma 设计和文本指令，覆盖不同前端技术栈（如 React/Next.js、组件库、CSS 框架），聚焦复杂、非基准式任务。从编译成功率、代码审查通过率和功能实现率三个方面判定。测试结果 Kombai 这个前端 AI Agent 表

#AI Agent #Benchmark Prompts #前端任务 #Figma #Kombai

相关新闻

sitin

1小时前

刷 GitHub，看到几个给 AI Agent“接互联网”的开源项目 1.web-access 给 Claude Code 补完整上网能力，它可以直接接管你正在用的 Chrome，连登录态都能复用。你已经登录的小红书、GitHub、各种网站，AI 都能直接进去看。还可以开子 Agent 并行查资料，查多个网站时速度明显快很多。 2.Lightpanda 它是直接从零造了一个给机器用的浏览

Geek

2天前

lark-cli 飞书/Lark 开放平台命令行工具一个专门为人类和 AI agent 设计的飞书 / Lark 命令行工具覆盖消息、文档、多维表格、电子表格、日历、邮箱、任务、会议等核心业务域，提供 200+ 命令及 19 个 AI Agent Skills

吕立青_JimmyLv 2𐃏26

5天前

我目前干任何事情的三个步骤： /deep-research 不管啥概念，先深度调研 /find-skills 不管啥技能，让 AI Agent 去学 /plan 直接开干，递归实现

fox hsiao

1周前

再見了 Figma ? Tailwind CSS 的設計師 Steve Schoger 最近發了一支一小時的影片，展示他怎麼用 Claude Code 從零建出一個金融 App 的行銷首頁。影片開頭他就先打了預防針：「我對命令列還是非常新手，這些東西對我來說都很陌生。Adam Wathan 幫我做了初始設定，現在我就是有一個 Vite 專案模板，每次開新專案就複製一份。」他說自己大概只會兩件

卡比卡比

1周前

OpenCLI 迎来重磅更新：External CLI Hub 发布！ 🚀 以前，为了让 AI Agent 调用某个工具，你需要反复教它写不同的命令行。 OpenCLI 成为所有 CLI 的统一入口与路由中心！这样只需要让 AI agent 知道通过 OpenCLI 就能知道他有哪些 CLI可以使用，不用再搞一堆 CLI skill 了核心亮点：零配置纯透传不用写任何适配代码！直接运