#自动化

LLM 出来之后,在应用层的折腾从未停歇。从 Prompt 调优到 Workflow 配置,再到 Agent 构建,最终目的都是一样的:让 LLM 更好地为人类干活,把机器的性能压榨到极致。 对 LLM 的压榨,可以分为两个维度。一是帮助它找到最优算法,让推理少走弯路。 为此我们几乎把能想到的路子都走了一遍,让 LLM 学会反思(reflection、self-consistency、self-critics),学会推理和规划(reasoning、planning、chain-of-thought、tree-of-thought);学会记忆(short-term memory、long-term memory),不至于对话一长就失忆;学会找知识(RAG、knowledge graph),在外部世界里补充事实;学会构建上下文(context building),在有限 token 里塞下更多有效信息;学会用工具(tool-use,function calling,MCP),把事情交给外部程序去跑,而不是光靠自己生成;等等。 这些东西,说到底都是技巧和机制,本质目的是让 LLM 更快理解人类要干啥,围绕目标(goal-oriented)尽可能找到一条代价最小的路,跑到最优解上去。 第二个维度,是对时间的压榨,让 LLM 可以做到 7×24 小时不停歇。当我们对 LLM 有了更深入的理解之后,很容易想到把它打造成属于自己或组织的“数字员工”,它不知疲惫、不会抱怨,可以持续运转、不断学习。 大部分人今天用 AI 的方式,还停留在查资料、总结内容、写周报月报这些单点场景上,如果要真正构建一名“不停歇的 AI 数字员工”,光靠这些还不够。我们需要先规划出属于自己的 AI 数字工厂 ——想清楚要造出来的“产品”是什么,是沉淀知识的系统,是自动化的业务流程,还是一个可以长期迭代的服务。 在这座工厂里,AI 是生产线上的执行者,它负责具体的加工与产出;而人类的角色发生了转变,从“亲自干活的工人”变成“监工与管理者”。 人类不再亲手完成每一步,而是要设计流水线,设定规则,制定指标,监控质量,并在需要时调度资源。换句话说,AI 的价值不在于替我们“干一点活”,而在于帮把整条流水线跑起来,而人类更像是“数字工厂的管理者”。 当这两个维度结合起来时,真正的拐点就出现了。LLM 不再只是一个冷冰冰的工具,而是逐渐变成了可以长期协作的伙伴。它既能承担重复性劳动,也能在复杂问题上提供洞见。它不仅仅是“帮你做事”,更是“和你一起做事”。 未来的差距,不在于谁能写出更漂亮的 Prompt,而在于谁能把 LLM 真正融入到自己的时间和组织里,形成稳定的生产方式。 因此,会不会用、用到什么深度、能否持续优化,这些才是长期的竞争力来源。谁能把 AI 运行成“工厂”,让自己从执行者转为监工和管理者,谁就能在未来的日常工作和业务中,获得真正可复用、可累积的优势。
Agent 有两个变量,一个是控制任务走向的 workflow 工作流,一个是控制内容生成的 context 上下文。 1)如果 workflow 和 context 的确定性都很高,这类任务就容易被自动化,类似传统 RPA,比如在处理发票处理、表单填报任务时,AI 更多是粘合剂,发挥空间比较有限。 2)如果 workflow 确定但 context 不确定,也就是流程固定但输入多变,就需要 Agent 在语义和理解上补全,比如客服问答、合同解析,需要通过外部检索、知识图谱等工具来弥补信息的缺口,让推理结果更符合预期。 3)如果 workflow 不确定但 context 确定,也就是输入清晰但走法多样,Agent 就要去自主规划路径,例如市场分析报告生成、个性化推荐等,大多数 End-to-End RL Agent 都擅长做这类任务,因为它们在训练阶段就习得了大量的路径规划和解题思路。 4)而当 workflow 和 context 都不确定时,就是最复杂的场景了,既要推理也要探索,像创新方案设计、跨部门信息收集等,这类更偏向于通用型 Agent,它的执行效果,取决于给它配备的工具丰富度,尤其是编程能力要最大化开放,例如让它学会去 Github 找仓库克隆并修改代码来解决问题,让它像人一样干活儿。 所以,要把 Agent 做好,首先要明确场景。本质上,自动化解决的是“确定性”问题,而智能化解决的是“不确定性”问题。
最近听的最有价值的播客,是 Claude Code 使用量全球榜一大哥,刘小排在koji的十字路口的播客。 听完的一些收获: 1. 刘小排发现,人们都说 AI 不赚钱,其实是榜单头部的 AI 产品基本都不赚钱。但这跟他的体感完全不同。只要你不乱花钱投放,降低营销和人力成本,从第一天就开始赚钱。 2. 别被 Claude Code 的 Code 这个单词所迷惑,它是一个通用 Agent 工具,从调研到写代码都可以做。 3. 只要在虚拟世界中,任何有标准操作程序(SOP)的事情都可以通过 Claude Code 实现自动化。 4. Claude Code 的价值在于其可控性,允许用户根据需要为其提供工具,从而实现无限级的扩展,这与 Manas 等内置工具受限的 Agent 不同。 5. 用 Claude Code 之前可以先读官方文档,很多功能比如7x24地跑都是官方宣传的功能,根本不是黑科技 6. 使用 Claude Code 如何避免屎山代码?你先在飞书里把需求文档写清楚,最好配上图,然后再和AI讨论一下需求的细节,需求不清楚的结果就是屎山代码。 7. 猎豹移动的产品方法论,核心在于 “简单”,即专注于一个功能并做到极致,而不是做加法 8. 他从猎豹移动学到的产品三段论是:预测、单点击穿、All-in,即预测市场趋势,找到一个点站稳脚跟,然后投入所有资源。 9. 在微软亚洲研究院实习时发现 “科技” 是两个词,即 “科学” 和 “技术”,并意识到自己做的是工程而非科学,这一认知影响了他日后的创业方向。
sitin
1周前
很多人觉得折腾代理、配置环境、申请账号这些事情太麻烦,于是选择放弃。 但恰恰相反:能不用代理就不用代理,能直连官方就直连,因为很多官方功能代理模式下都不完整,比如手机 App 无法用。 咱们要是花个一两个小时把流程摸透,环境搭好,基本就都解决了。之前我在 AI 出海的直播里也讲过:你只要把流程理清楚,后面转手去卖各种 AI 账号,一个月轻轻松松多赚小几百,没任何难度。 你觉得麻烦,别人也觉得麻烦。可是偏偏这是刚需。那能帮别人搞定麻烦的人,收点钱很正常啊。 所以这是问题,也是商机。 尤其是做 AI 出海的兄弟们,花个两千块注册一家海外公司,就能解锁很多信用卡、支付玩法,套利空间一下子大了,业务能玩的方向也就多了。我们千里会就是从国内玩法,逐渐往海外玩法去靠的。 有些细节我讲得不够清楚,其实不用慌,直接丢给 ChatGPT,让它帮你把步骤、流程补齐就行。昨天我在课上也演示过,哪怕只是一张图,AI 就能把所有操作细节整理出来。我们要做的,就是对照着看,理解背后的逻辑。 我最近用 AI 做了很多调研和自动化,像行业报告分析、PDF 信息萃取、批量数据处理,以前靠人摸索要花好久,现在 AI 基本几分钟就能跑完。 所以说,AI 出海不是只有“做工具”这一个方向。比如 YouTube 批量视频,用自动化工作流也能跑,赚的还是美金。都是值得尝试的项目。