#深度研究

《智能体设计模式》第六章「规划模式」完成翻译,目前已翻译章节: 00 - 前言部分 01 - 第一章:提示链模式 02 - 第二章:路由模式 03 - 第三章:并行模式 04 - 第四章:反思模式 05 - 第五章:工具使用模式 06 - 第六章:规划模式 规划模式让智能体具备前瞻性思维能力,能够将复杂任务拆解为更小且可管理的步骤,并制定实现预期结果的策略。通过规划能力,智能体不再只是对眼前输入作出反应,而是能够自主规划从初始状态到目标状态的完整路径。这里为大家梳理几个关键要点: 1. 核心理念:从被动响应到主动规划 规划模式的核心在于建立「理解目标 → 制定计划 → 执行步骤 → 灵活调整」的智能流程,让智能体具备战略性、目标导向的执行能力。 - 传统模式的局限:基础智能体只能对眼前输入作出反应,缺乏处理复杂多步骤任务的能力,无法将高层次目标拆解为可执行的子任务。 - 规划模式的价值:智能体能够接收高层次目标并自主拆解为有序的执行步骤,在遇到阻碍时灵活调整路线,从而有效处理包含多个步骤和相互依赖的复杂任务。 2. 规划的关键特征 规划模式通过以下特征实现智能化的任务执行: - 目标驱动:接收高层次的目标声明(做什么)而非具体指令(如何做」,由智能体自主决定实现路径。 - 即时生成:计划不是预先存在的,而是根据当前状况和目标要求即时生成的。 - 灵活应变:初步计划只是出发点,智能体能够接纳新信息并在遇到阻碍时动态调整策略。 - 结构化分解:将复杂目标拆解为一系列更小、可执行的步骤或子目标,按逻辑顺序处理依赖关系。 3. 典型应用场景 规划模式在四大领域展现出核心价值: - 流程自动化:编排复杂工作流,如新员工入职流程,包括创建账户、分配培训、部门协调等有序子任务。 - 机器人与自主导航:进行状态空间遍历,生成从起始状态到目标状态的最优路径,同时遵守环境约束。 - 结构化信息整合:生成研究报告等复杂输出,规划包含信息收集、数据归纳、内容结构化、迭代打磨等阶段。 - 多步骤问题解决:制定并对系统化流程进行诊断、实施解决方案,并在必要时升级处理。 4. 实现框架与特点 - CrewAI:通过定义明确的智能体角色和任务,支持先规划后执行的工作流,适合结构化的多步骤任务。 - Google 深度研究:利用多步骤动态迭代流程,把用户提示拆解为研究计划,循环执行搜索与分析,生成带引用的结构化报告。 - OpenAI 深度研究接口:提供编程化控制能力,支持 MCP 协议连接私有知识库,展示完整的中间步骤(推理、搜索、代码执行)。 5. 使用时机与权衡 当任务复杂度超出单一操作范围时,应当使用规划模式,但需要权衡灵活性与可预测性: - 适用场景:任务需要多个相互依赖的步骤才能完成;「如何做」的方案需要探索而非已经明确;需要自动化处理复杂的工作流程;需要生成全面、综合的结果。 - 权衡考量:当问题的解决方法已经清楚且可重复时,固定流程比动态规划更有效;规划增加灵活性的同时也引入了不确定性;需要在自主性和可预测性之间找到平衡。 - 核心价值:将智能体从简单的被动响应者提升为战略性、目标导向的执行者,能够管理复杂流程并产出全面综合的结果。 点击项目链接 可双语对照阅读,跟踪最新翻译进展,也欢迎加入交流群一起阅读讨论、反馈问题或随个 Star ~
Kimi居然上了Agent会员服务! 昨晚打开Kimi的时候,界面突然弹出了一封给打赏用户的感谢信。点开后,是给打赏用户的会员福利。 你以前打赏的金额会在首次订阅Agent会员后全额返还,作为会员的时间。我试着冲了一个月,直接送了我九个月的会员,这也太好了! 之前打赏过的朋友可以去看一下,顺便看看自己的打赏序号。 说回会员,目前付费和免费用户主要区分还是Agent使用次数上,免费用户依然可以使用 kimi 的所有对话服务,只是深度研究Agent额度跟会员有区别。现有的功能不充会员一样用。 新的会员服务命名还蛮有创意的,我查了一下是音乐节拍的单词: Adagio(慢板)对应的是免费版本。 Andante(行板)49 元中档订阅,更多的 K2 和深度研究额度,另外会送等额 API 兑换券。 Moderato(中速)99 元有更高的额度,支持深度研究并发,依然送等额 API 代金券。对比海外同档位是19美金的价格,国服还是有优势的。 另外,海外还有一个 199 美元的会员等级 Vivace,多了一个高峰时段优先访问的权限。 之前我也分享过关于 Kimi 的深度研究能力,基于专有模型的和基于常规模型的体验还是不太一样的。具体表现就是研究报告的搜索能力和专业度更强,可以输出更多观点认知类的研究发现,并非只是简单的信息罗列,没试过的朋友也可以去试试。
openai deep research vs google deep research: 如果美国和中国明天突然决定停止一切相互贸易,哪个国家会面临更大的麻烦?|结论:openai更deep,google更broad,看谁更适合你。 why:一方面这是当前的特点话题,意义重大,值得思考;另一方面,两个DR报告呈现出完全不同的特征,而且相当有代表性,可以看出两个DR的特点。 原始报告太长,都是2万字左右。所以,我用gpt-4.5对两份报告的内容进行了“压缩”。我仔细看了一下,报告结构和内容要点都高度保留(人类要做到这一点可不容易),读总结可以快速了解两份报告的结论,包括对比二者对同一个prompt的应对差异。 图1-2是openai DR的总结;图3是google DR的总结。 我的总结:openai的DR报告更deep,报告内容字数略少于google,但是全文都紧密围绕问题本身,从GDP影响、就业、科技产业链、供应链中断、消费品价格这些角度深度分析; 对比之下,google的DR报告更broad,报告字数略多于前者,但是全文铺的很广,具体分析部分只占报告全文很小一部分; openai DR的这个“deep”特点,充分利用了o3模型的强大推理能力,指令跟随能力,强调智能体的基础模型本身的智能。 google DR的这个“broad”特点,充分展示了google search的原生search index,访问网站数量数百个,参考网站100多个,是前者的近10倍! 在主题研究这件事上,到底你需要deep,还是需要broad?研究报告质量、研究目标的完成度,多大程度上取决于智能本身,或者搜索资料的资料,这是我们需要持续在实践中观察、思考和总结的。 两份原始报告的link,我放在评论区。有空大家可以细细阅读。