#任务拆解话题下的最新新闻、事件- news.news·换个方式看新闻|AI看新闻、实时追踪事件后续

1个月前

我未来的目标，拥有一支由多个AI员工组成的团队所以我最近一直研究如何让AI Agent真正自己干活。很快我就遇到了所有AI代理最致命的缺陷：失忆。每次重启，上下文窗口一关，它就忘了一切，变成一个对自己项目一无所知的“新人”。这导致它要么留下烂摊子，要么草草宣布胜利。而Anthropic最近提出的框架给了我巨大的启发。它的核心思想不是治好AI的“失忆”，而是为它打造一套外部记忆和工作流。他们用了两个AI Agent，分工堪称绝妙：初始化代理 (项目经理): 它不写代码，只负责把任务彻底拆解成详细的功能清单并建立 git 仓库。这相当于为AI植入了项目的“长期记忆”。编码代理 (轮班码农): 它每次“上班”，先读取清单和 git 日志来“恢复记忆”，然后只专注完成一个功能，测试、提交。这确保了AI拥有可靠的“短期执行力”。关键不在于AI模型本身有多强，而在于我们设计的工作流有多聪明。我已经按照这套思想植入到自己的项目中，感觉非常有用！原文：给你们翻译理解文章后共享出来：

#多智能体之争：Anthropic生态VS单智能体· 81 条信息

#AI Agent #外部记忆 #项目管理 #任务拆解 #工作流

Xiaowen

2个月前

这个逻辑在生产力科学里叫双流理论，人为拆解复杂任务，把规划和执行分成两个切面单独做，大大降低心智负担，无形提高自己真正的产出完成率。

#生产力 #双流理论 #任务拆解 #效率提升 #方法论

ginobefun

2个月前

《智能体设计模式》第六章「规划模式」完成翻译，目前已翻译章节： 00 - 前言部分 01 - 第一章：提示链模式 02 - 第二章：路由模式 03 - 第三章：并行模式 04 - 第四章：反思模式 05 - 第五章：工具使用模式 06 - 第六章：规划模式规划模式让智能体具备前瞻性思维能力，能够将复杂任务拆解为更小且可管理的步骤，并制定实现预期结果的策略。通过规划能力，智能体不再只是对眼前输入作出反应，而是能够自主规划从初始状态到目标状态的完整路径。这里为大家梳理几个关键要点： 1. 核心理念：从被动响应到主动规划规划模式的核心在于建立「理解目标 → 制定计划 → 执行步骤 → 灵活调整」的智能流程，让智能体具备战略性、目标导向的执行能力。 - 传统模式的局限：基础智能体只能对眼前输入作出反应，缺乏处理复杂多步骤任务的能力，无法将高层次目标拆解为可执行的子任务。 - 规划模式的价值：智能体能够接收高层次目标并自主拆解为有序的执行步骤，在遇到阻碍时灵活调整路线，从而有效处理包含多个步骤和相互依赖的复杂任务。 2. 规划的关键特征规划模式通过以下特征实现智能化的任务执行： - 目标驱动：接收高层次的目标声明（做什么）而非具体指令（如何做」，由智能体自主决定实现路径。 - 即时生成：计划不是预先存在的，而是根据当前状况和目标要求即时生成的。 - 灵活应变：初步计划只是出发点，智能体能够接纳新信息并在遇到阻碍时动态调整策略。 - 结构化分解：将复杂目标拆解为一系列更小、可执行的步骤或子目标，按逻辑顺序处理依赖关系。 3. 典型应用场景规划模式在四大领域展现出核心价值： - 流程自动化：编排复杂工作流，如新员工入职流程，包括创建账户、分配培训、部门协调等有序子任务。 - 机器人与自主导航：进行状态空间遍历，生成从起始状态到目标状态的最优路径，同时遵守环境约束。 - 结构化信息整合：生成研究报告等复杂输出，规划包含信息收集、数据归纳、内容结构化、迭代打磨等阶段。 - 多步骤问题解决：制定并对系统化流程进行诊断、实施解决方案，并在必要时升级处理。 4. 实现框架与特点 - CrewAI：通过定义明确的智能体角色和任务，支持先规划后执行的工作流，适合结构化的多步骤任务。 - Google 深度研究：利用多步骤动态迭代流程，把用户提示拆解为研究计划，循环执行搜索与分析，生成带引用的结构化报告。 - OpenAI 深度研究接口：提供编程化控制能力，支持 MCP 协议连接私有知识库，展示完整的中间步骤（推理、搜索、代码执行）。 5. 使用时机与权衡当任务复杂度超出单一操作范围时，应当使用规划模式，但需要权衡灵活性与可预测性： - 适用场景：任务需要多个相互依赖的步骤才能完成；「如何做」的方案需要探索而非已经明确；需要自动化处理复杂的工作流程；需要生成全面、综合的结果。 - 权衡考量：当问题的解决方法已经清楚且可重复时，固定流程比动态规划更有效；规划增加灵活性的同时也引入了不确定性；需要在自主性和可预测性之间找到平衡。 - 核心价值：将智能体从简单的被动响应者提升为战略性、目标导向的执行者，能够管理复杂流程并产出全面综合的结果。点击项目链接可双语对照阅读，跟踪最新翻译进展，也欢迎加入交流群一起阅读讨论、反馈问题或随个 Star ~

#智能体 #规划模式 #任务拆解 #自主规划 #深度研究

sitin

4个月前

Claude code 真的细啊，给我一个任务拆了 30 个步骤，诚不欺我，我给他说我是新手，他真的很用心教我，真的我哭死

AI编程工具激战：Claude Code、Gemini Cli崛起· 1256 条信息

#Claude #代码 #新手 #任务拆解 #积极

向阳乔木

6个月前

前些天字节跳动火山引擎举办Force原动力大会。发布了豆包大模型1.6、视频生成模型Seedance 1.0 pro等新模型。尤其是豆包1.6系列，非常重要。为什么？很多人说，今年是 AI Agent 落地元年。 Agent 产品第一步要做任务拆解规划。这块非常依赖大模型的深度思考能力、工具调用能力，还有多模态支持能力。火山引擎总裁谭待的说：深度思考、多模态和工具调用等模型能力提升，是构建Agent的关键要素个人非常认同！另外，因模型备案、数据安全、地缘政治等诸多原因。国内 AI Agent 产品发展，必须依赖国内模型的强大。 Deepseek R1 非常棒！但是，有点可惜，它不支持多模态，这样应用场景会很受限。所以，拥有媲美 Deepseek R1 推理能力，又支持多模态的豆包 1.6 系列大模型发布。无疑是国产 AI 产品的希望之光。一起了解、测试下豆包 1.6 系列模型。

深度学习模型升级引发AI能力大跃进，行业迎新变革· 143 条信息

#字节跳动 #火山引擎 #Force原动力大会 #豆包大模型1.6 #Seedance视频生成模型 #AI Agent #任务拆解 #多模态 #大模型 #深度思考 #工具调用

宝玉

1年前

问：体验了一下 AI 编程，我发现这个编程能力受限于上下文的限制，对于大型项目的构建能力偏弱，不知道有没有什么好的方法能够解决这个问题呢？答：编程能力确实受限于上下文的限制，但是使用 Cursor 这样的开发工具，有一些技巧可以让你在大型项目中，也能大幅提升效率。核心是两点： 1. 将复杂任务拆分成小任务，每次只实现一个小任务 2. 每次交互选取最相关的上下文，让它可以照葫芦画瓢既然我们知道大语言模型的上下文窗口长度是有限的，那么就需要最大化的利用好上下文。最简单有效的就是每次任务小一点，输入的代码和提示词少一点，这样就可以让模型在上下文窗口限制内很好的完成任务。比如说我要让 Cursor 帮我实现一个爬虫，抓取某个网站的数据，要抓一级页面、二级页面、三级页面、四级页面。每一级页面还有很多细节。如果我一次性要求 AI 去实现，那可能无法实现，或者完成的不好。但是我可以拆成若干小任务。所以我第一步会要求 Cursor 帮我实现一个最基本的爬虫功能，能抓取网页、能解析网页内容，能保存内容到静态文件，这个任务 Cursor 能完成的很好。第二步我要求 Cursor 帮我实现抓取首页，把页面的 HTML 结构发给它，让它能解析首页的内容成结构化的数据，并且保存到一个 sqlite 数据库。这个任务 Cursor 能完成代码，执行时可能会有点小问题，但是稍微修改就能正常运行。并且对代码细节进行半手动半AI辅助的完善。第三步继续要求 Cursor 实现一个记录抓取位置的功能，让它可以中断后从上一次抓取位置继续。然后再完善优化代码。第四步让它对去抓取二级页面，提供二级页面的结构给它，并且把之前优化好的抓取解析代码添加到上下文，让它去抓取二级页面。由于提供了优化好的代码参考，新的代码也会参考优化好的代码。后面的步骤都是类似的，就是把之前写好的优化好的代码作为上下文，加上新的需求，让它去实现。这样一步步下来，一个复杂的模块就完成了，而使用过程中也没有超出上下文长度。所以不用担心上下文窗口长度的限制，也不用担心你的项目太大它不理解，核心是要把复杂任务拆成简单的任务，要一点点迭代，先优化好前面的代码，然后生成新的代码的时候参照前面优化好的代码。同步发布于博客：

AI编程工具激战：Claude Code、Gemini Cli崛起· 1256 条信息

#AI编程 #Cursor #任务拆解 #上下文限制 #迭代优化