#工程化落地

5个月前

所谓的「普通人」不知道怎么用好 AI，其实很多时候都不是提示词的问题，是不理解 AI 的输入和输出我在这里的一个不成熟的推测是：大模型没有做到的 AI 普及率，可能会靠 agent 实现举个例子，用户希望这个 AI 可以分析某个短视频博主的视频，然后帮他自己改进短视频那么第一步，他应该发什么内容给 AI，就成了大问题 1、如果你是想直接发视频给 AI，可以用 gemini，但是用户需要自己下载视频，多数用户不知道如何下载，这一步和 AI 无关，这就是「输入问题」 2、如果你想发送大量视频给 AI 分析，就需要一个工作流了，手搓工作流，超出 99% 用户的承受范围 3、如果你是想发送大量短视频文稿给 AI，需要选择上下文够长的大模型（多数用户不知道什么是上下文），并且要用 get 笔记、通义听悟、各种 chrome 插件实现视频的批量下载、转录，这个步骤之多，也劝退了 99% 的人 4、如果你希望一句话实现让 AI 分析某个博主的短视频，用 manus、genspark 可以实现（也未必一次成功），而这两个产品的知名度，远远不如 gpt 等大模型，更不要说普及到豆包用户了 5、就算 AI 成功帮你分析完了，你希望 AI 如何介入修改你的短视频呢？直接给剪映装上 gpt5 吗？目前还不现实。要用现成的 AI 剪辑工具吗？大部分对时长、视频体积的支持都很烂。万一需要你修改口播内容呢？难道还要再把 heygen、11 labs 都装进来，给你做声音克隆、对口型吗？简单讲是输入、输出的问题，考虑到实操程度，都是工程化落地问题如果没有 manus、genspark 这种一键完成 xxx 的 agent，多数用户是拒绝使用大模型的 AI 大模型和一个成熟的 AI agent 在商业普及上的区别，我认为是 2007 年初代 iPhone 对比 2010 年的 iPhone 4 07 年的 iPhone 是很牛逼，但是你连 app store 都没有，大众是不认的

#AI普及 #AI Agent #大模型局限性 #用户体验 #工程化落地