宝玉

Operator 是由 OpenAI 开发的一款“AI 智能体”（AI Agent），它最大的特点在于可以像人一样使用浏览器，并能自动为你执行一些指定的网络操作。相比过去的 AI 只能回答问题或给出建议，Operator 可以进一步帮你“动手”去完成任务，比如浏览网页、点击按钮、填写表单等。简单来说，就是你给它一个目标，它就能利用内置的浏览器自己去做事情，而不再仅仅是给你一段文字回答。它能做什么？填写网页表单例如，你想在某个政府网站上提交一份申请表，但不想自己一栏栏去填写，或者表单太长需要重复输入很多信息；你只需告诉 Operator，它就能帮你填写相关内容并提交。在线购物或订购服务你想在超市 App 上购买日常用品，或在旅行网站上预订机票酒店、在美食平台点外卖，都可以让 Operator 代劳。它能自行浏览商品列表、添加购物车，然后在付款前再请你确认支付。执行重复任务如果你经常要上网做一些相似的流程，例如定期在某个网站上更新资料，或管理多个账号的信息，Operator 也可以帮你省下许多重复操作的时间。工作原理 Operator 依托一个名为「计算机使用代理」（Computer-Using Agent, CUA）的新模型。简单来说，这个模型让 AI 能够“看到”网页界面（通过截图等方式）并“操作”网页（像使用鼠标和键盘一样点击、输入、滚动等）。 “看”：它会截取网页画面，然后从截图中提取文本和界面布局。 “点”：它像真人一样点击网页上的按钮和链接。 “输”：它可以往输入框里输入搜索词、收货地址、用户名等文本信息。在执行任务过程中，如果遇到需要登录账户、输入支付信息或解决验证码这些环节，Operator 会请求你亲自接管控制，确保安全性和敏感信息不被泄露。安全防护 - 需要输入敏感信息时，强制人工接管； - 在确认最终提交订单或发送邮件前，会征求用户确认； - 不允许执行过于敏感或风险极高的任务； - 可以随时删除浏览历史和对话记录，不被用于模型训练； - 对可疑的网站或恶意攻击会保持警惕，必要时会暂停操作。虽然没有任何系统是万无一失的，但官方也在努力完善，计划通过研究预览阶段的用户反馈不断升级和改进安全策略。不足之处 Operator 目前仍是一个早期的研究预览版，功能还不够完善： - 在非常复杂的网站上，AI 可能还会“晕头转向”或出错； - 在处理涉及多步骤、多条件的流程时，易出现失误； - 只在美国的 Pro 用户中小范围开放，普通用户可能需要再等等。 OpenAI 也表示，他们会持续改进 Operator 的稳定性与适配性，并逐步向更多用户和不同服务扩展。 API 开放未来可能会将 Operator 所用的 CUA（计算机使用代理）模型开放给开发者，让他们打造自定义的自动化解决方案。与 ChatGPT 的整合后续或许会把 Operator 的功能深度融合到 ChatGPT 中，让用户在同一个界面里既能聊天也能让 AI 帮忙“动手”，真正实现一站式的智慧助理。对绝大多数人而言，Operator 是一个新鲜而有趣的概念：不仅能回答问题，还能“亲自”帮你去完成网络上的各种操作。尽管它还在起步阶段，但它所代表的“让 AI 更实用、更贴心”的趋势引人瞩目。想象一下，当我们每天的大量琐事都能交给这样一个智能助手时，或许就能把更多时间和精力放在更重要、更有创造力的事情上。