meng shao
3小时前
-
🤗 Hugging Face 24 小时开源复现 DeepResearch:解放 AI 搜索助手 概述:OpenAI 发布网页搜索系统 DeepResearch 后,Hugging Face 团队在 24 小时内启动开源复现项目,利用 CodeAgent 等创新方法将验证准确率提升至 54%,并计划持续改进以打造人人可用的开源 AI 搜索助手 OpenAI 发布背景: - OpenAI 在
🤗 Hugging Face 24 小时开源复现 DeepResearch:解放 AI 搜索助手 概述:OpenAI 发布网页搜索系统 DeepResearch 后,Hugging Face 团队在 24 小时内启动开源复现项目,利用 CodeAgent 等创新方法将验证准确率提升至 54%,并计划持续改进以打造人人可用的开源 AI 搜索助手 OpenAI 发布背景: - OpenAI 在2月3日发布了 DeepResearch 系统 - 该系统可以浏览网页、总结内容并回答问题 - 在 GAIA 基准测试上取得了显著成绩(67% 正确率) 开源复现计划: - 由于 OpenAI 没有公开其框架(agent framework)的细节 - 作者团队决定在24小时内尝试复现并开源这个框架 关键技术突破: - 使用 CodeAgent 而不是传统的 JSON 格式 - 代码方式可以减少30%的步骤数量 - 提供了基础工具:简单的网页浏览器和文本检查器 初步成果: - 在 GAIA 测试集上达到54%的验证准确率 - 超过了之前开源框架的最好成绩(46%) - 已发布在线演示供人们试用 未来发展方向: - 计划开发更强大的网页浏览能力 - 准备构建 GUI Agent(可以查看屏幕并用鼠标键盘操作) - 正在招募全职工程师推进项目