时政
财经
科技
登录
#机制
关注
勃勃OC
2周前
我发现我和jojo确实很像 我体内的stunt就是“看到别人装逼” 这个动漫作者水平很高 机制看似弱智,其实写出了很多人内心的真相 😅😅😅😅
#jojo
#动漫
#内心真相
#装逼
#机制
#作者
分享
评论 0
0
凡人小北
2周前
读完 Anthropic 的多智能体系统文章,有几个点挺触动的,尤其是放回我们平时在做 agent 编排和系统落地的过程中,对应起来很多痛点被他们提前踩过、总结得非常系统。 这套系统看上去是给 Claude 提升复杂研究任务能力,底层其实是三个关键词:带宽、结构、机制。 1️⃣从 token 到带宽:扩容问题其实是系统问题 他们很明确地说,单个 agent 很快就会遇到 token 限制,这不是模型能力不行,而是容量不够。很多时候 LLM 的“不会”、“忘了”、“答不出来”,只是 context 塞不下。这一点在我们自己调长链条、多跳调用的时候也很明显。Anthropic 选择的解法不是扩模型,而是拆任务、开并发、分 agent,每个 agent 自带上下文窗口,从系统结构层面扩容。 这种设计非常实用,因为它绕过了 token 墙的天然限制,通过多 agent 并发变相把 token 维度拉开了。这是我最近做 agent 编排时反复体会到的:不是把 prompt 写得多聪明就能解决,而是要想清楚结构怎么设计,谁来拉信息、谁来拼结构、谁来追引用。 2️⃣提示词是系统指令,很重要、很重要、很重要! 这篇文章有个细节写得特别清楚:主 agent 的提示词,是负责分配任务、指明目标、交代格式、选工具的。这个逻辑其实是我们做复杂 agent 系统中很容易忽略的一块:提示词不只是沟通语言,更是调度逻辑、任务协议、格式规范的集中承载体。 尤其是多个 agent 并行运行时,如果没有一个清晰、格式化、结构稳固的 prompt 模板,每个子 agent 拉回来的信息会特别散、错漏率高、很难合并。这时候,主 agent 的提示词就等于一个调度中枢的“编程语言”。 从我们平时用的实践来看,这就意味着主 agent 的提示词策略应该和流程图一样严谨:每一步要预设结果、预设失败、预设上下游。这块我觉得是现阶段很多 agent 框架还不够成熟的地方。 3️⃣系统级机制,决定了能不能撑进生产环境 我觉得特别值得借鉴的工程概念:checkpoint、异步重试机制、全链路 tracing、彩虹部署。这几个在大数据异步系统里很常见概念,AI 领域得好好学习下。 这些词不是为了好听,它们背后都是在回答一个问题:这个系统崩了怎么办?agent 卡死怎么办?升级逻辑还没验证好怎么办?一整套机制让这个系统不是在 demo 一个可能性,而是在上线跑任务、自动修复、平滑演进。 平时我们在做流程型 AI 系统的时候,很容易只关注“怎么生成”“怎么判断好坏”,但 Anthropic 的做法提醒我:agent 系统本质上要往服务化方向走,就必须预设失败是常态,重试是能力。 4️⃣评估机制是不可缺的闭环,不然做不出反馈导向的系统进化 他们有一个细节很打动我:让另一个 LLM 去评审 agent 的结果,从准确性、引用合理性、覆盖度等多个维度打分。这就相当于在系统里内嵌了 QA 流程,而且不是事后人评,而是可以插入调试链路的 LLM 评测器。 我们自己在调多 agent 结构时常遇到一个问题:任务执行完了,但结果质量很难量化,只能靠人工判断或者事后比对。这套“LLM 评估 LLM”的机制,让我们开始可以想象一种更自动化的 agent 演化路径:系统自己跑,自己打分,自己选择 prompt A 还是 B,更适合持续调优。 5️⃣并发是工具,不是策略,适用场景边界要想清楚 这套系统最适合的场景是:问题复杂度高、信息广度要求强、非实时产出型任务。例如政策研判、产品调研、文献综述、竞品分析这些,在私域服务里也可以类比成“多维标签用户意图研判”这种复杂工作。 但如果放在需要紧密配合、频繁迭代、低延迟要求的任务上,例如代码生成、对话任务、实时接口构建,多 agent 的协调成本反而可能放大系统复杂度。所以并发结构是个好工具,但什么时候该开几个 agent,什么时候该单线程跑到头,这种策略边界要想清楚。 这篇文章最核心的不是“我们做了一个多 agent 系统”,而是他们已经把多 agent 作为一种工程能力进行制度化建设:有流程、有容错、有评估、有上线机制。 对在第一线实际落地 AI 能力的团队来说,有一个非常直接的启发是:构建 agent 系统,不能只是对话式的 prompt 编排,而要像搭服务一样,从任务定义到评估反馈,从并发机制到异常兜底,形成一整套可以持续运行的系统逻辑。 这一点,比起模型调优,本质上更像是一种架构能力的竞争。
多智能体系统“三国杀”:Anthropic生态VS单智能体,AI未来谁主沉浮?· 7 条信息
#Anthropic
#多智能体系统
#Claude
#复杂研究任务
#系统落地
#带宽
#结构
#机制
分享
评论 0
0
XinGPT🐶
1个月前
出来玩没卷Loud,就这样吧,卷不动了,fcfs感觉也是坑。机制挺好的,一旦涉及到排名,亚洲区哥们就打鸡血。
#出来玩
#fcfs
#机制
#排名
#亚洲区
#卷
分享
评论 0
0
新华网-新华网
1个月前
陈文清在俄出席第十三届安全事务高级代表国际会议和中俄执法安全合作机制第十次会议
陈文清在俄出席第十三届安全事务高级代表国际会议和中俄执法安全合作机制第十次会议-
#陈文清
#俄
#安全事务
#高级代表
#国际会议
#中俄
#执法安全合作
#机制
#第十三届
#第十次会议
分享
评论 0
0
币到家 BDJ
1个月前
晚上8点后可能还要涨📈 $SSTZ | $SSTB 没有任何线上的动作,动作只有机制 社区地推牛X 还是这种好玩,线上p的太快 撒尿功夫就输了。 0xe8a9bf6313950544501db41d498ea6d6dc90b305
#涨价
#金融
#社区推广
#机制
#线上线下对比
分享
评论 0
0
中国日报网-央视新闻客户端
1个月前
乌拉圭总统:中拉论坛机制非常有效 前景光明
#乌拉圭
#总统
#中拉论坛
#机制
#有效
#前景光明
分享
评论 0
0
红网-光明日报
3个月前
【光明论坛】建立常态化长效化的纪律教育机制
#光明论坛
#纪律教育
#常态化
#长效化
#机制
分享
评论 0
0
红网-央广网
3个月前
一习话丨“建立健全更加合理高效的教育资源配置机制”
“建立健全更加合理高效的教育资源配置机制”
#教育资源
#机制
#高效
#合理
#配置
#健全
#资源配置
#建立健全
#习话
分享
评论 0
0
宝玉
4个月前
现在可以对 ChatGPT 进行定制,输入自己的名字、职业、ChatGPT回复消息时的风格(比如话唠、机制、直接、鼓舞等等)、额外信息、支持的功能(网页搜索、DALL-E、代码、画布、高级语音等等)
#ChatGPT
#定制
#话唠
#机制
#鼓舞
#网页搜索
#DALL-E
#代码
#画布
#高级语音
分享
评论 0
0
新华网-经济日报
5个月前
完善机制加力扩围实施“两新”
完善机制加力扩围实施“两新”-"日前,国家发展改革委和财政部发布关于2025年加力扩围实施大规模设备更新和消费品以旧换新政策的通知,部署加力推进设备更新、扩围支持消费品以旧换新、加快提升回收循环利用水平等多方面工作。"
#两新
#机制
#加力扩围
分享
评论 0
0
新华网-新华网
5个月前
法国对美国“元”公司将取消“事实核查”机制表示担忧
法国对美国“元”公司将取消“事实核查”机制表示担忧-
#法国
#美国
#元公司
#事实核查
#机制
#担忧
分享
评论 0
0
新浪新闻-新京报
6个月前
最高检:健全完善反制裁、反干涉、反“长臂管辖”检察工作机制
新京报讯12月30日,最高检印发《关于加强涉外检察工作的意见》。以下为全文:为全面贯彻党的二十大和二十届三中全会精神,切..._新浪网
#最高检
#反制裁
#反干涉
#长臂管辖
#检察工作
#机制
分享
评论 0
0
个人主页
通知
我的投稿
我的关注
我的拉黑
我的评论
我的点赞