我们团队开源了 Multi-Agent 强化学习的框架 MrlX，它能够让你同时训练多个 Agent 模型。当我们试图让大模型变得更聪明时，大多数人都在做同样的事：训练一个模型，让它自己跟自己对话，希望它能学会反思验证，能学会使用工具。但如果你仔细想想，这其实很奇怪。真实世界不是这样运作的。人们是在与其他人的互动中变聪明的。医生通过与病人交谈来提升诊断能力，而病人也在这个过程中学会更好

#Multi-Agent 强化学习 #MrlX框架开源 #Agent共同进化 #医生-病人对话训练 #深度研究Agent分工

关联事件

#多智能体之争：Anthropic生态VS单智能体

81

Anthropic与Cognition就多智能体系统构建展开激辩，核心争议在于上下文共享与否。Anthropic强调构建多智能体生态，提升复杂任务处理效率，近期发布多智能体构建指南，阐述“协调者-执行者”架构，并通过代理协调和系统评估提升任务性能，认为单个智能体的上下文有限，压缩比太大就会失真。Cognition则更关注单个Agent的效率和稳定性。Anthropic还发布了关于多智能体系统的文章，详细阐述构建多个智能体所面临的工程挑战，并强调带宽、结构、机制的重要性。这场争论反映了AI发展路径的不同选择，对未来AI系统的设计和应用具有重要意义。