宝玉
6天前
话说OpenAI这帮天才疯子,自从用ChatGPT把地球人的脑子搅成一锅粥后,就觉得不过瘾。他们憋了个大招,名叫Sora 2。这玩意儿是什么?你可以把它想象成一个装满了全世界影碟店、图书馆和动漫网站的硬盘,然后被喂给了一个患有“创作欲过剩症”的人工智能。 他们没跟任何人打招呼,迪士尼的米老鼠、任天堂的马力欧、派拉蒙的派大星……有一个算一个,全被“请”进了这个数字炼丹炉。然后,伴随着山姆·奥特曼(Sam Altman)那标志性的、仿佛在说“我没做错任何事,只是世界还没准备好”的微笑,Sora 2上线了。市场宣传? aggressive得像是要把传单塞进你家猫的嘴里。 发布后的72小时,互联网疯了。 这不是文艺复兴,这是文艺复“疯”。皮卡丘在CVS里零元购的监控录像,比《教父》的点击率还高;海绵宝宝梳着希特勒的小胡子在汉堡王发表演讲;盖酷家庭的彼得·格里芬和马力欧兄弟因为一根水管的所有权问题在《南方公园》的街头大打出手。 这玩意儿在48小时内,像一枚文化核弹一样登顶了App Store。OpenAI内部,香槟开得比代码跑得还快。 > “老板,成了!用户正在疯狂地解构人类所有的文化IP!” > “很好,”奥特曼可能正用Sora生成自己登上时代周刊封面的视频,“一切尽在掌握。” > 新一轮融资光速到位,估值直接飙到$5000亿。这笔钱烫手得,仿佛是用全世界法务的眼泪铸成的金条。 然而,狂欢的BGM还没结束,门外就传来了敲门声——不,是撞门声。迪士尼那群穿着西装的哥斯拉、纽约时报的笔杆子军团,以及所有你能想到的内容巨头,带着山一样高的律师函,把OpenAI的服务器围得水泄不通。 面对十面埋伏,你以为奥特曼会道歉?会赔款?太天真了。他玩了一招“乾坤大挪移”,玩得比张无忌还溜。 “快!把责任这坨烫手山芋扔出去!” 一夜之间,一个紧急更新推送给了所有用户。打开Sora 2,一个硕大的弹窗怼到你脸上,字体大到像是怕你瞎。内容翻译过来就是: * 《你好,背锅侠》协议: * 你! 尊贵的用户,你发誓你上传的任何提示词、图片、想法,都不涉及任何有版权的东西。马力欧是你自己画的,皮卡丘是你家后院抓的。 * 你! 尊贵的用户,你保证你拥有你生成内容的所有权利,迪士尼找你麻烦,跟我们OpenAI没半毛钱关系。 * 滥用? 呵呵,你的Sora和ChatGPT账号将一起人间蒸发,永世不得超生。 与此同时,奥特曼慢悠悠地发了篇博客,标题是:“请负责任地使用我们的魔法 :)”。那感觉,就像一个把军火库钥匙交给疯子的军火商,然后贴心地说:“亲,别伤到自己哦。” 至于版权方?“我们提供了‘退出’机制嘛,”OpenAI的公关说,“你们可以一个一个一个一个一个地把你们的角色申请排除出去。” 米老鼠、唐老鸭、高飞、艾莎、安娜、辛巴……迪士尼法务部看着那长得像电话黄页的角色列表,默默地点了根烟。 用户们也不是傻子。当他们看清这份“卖身契”后,愤怒了。社交媒体上,“#DeleteSora”运动风起云涌。 他们点下“删除账户”按钮,以为能潇洒离去。 然后,真正的恐怖降临了。 一个提示框跳了出来:“删除Sora账户将永久删除您的整个OpenAI账户,包括ChatGPT、API访问权限以及所有历史数据。此操作不可逆,您的邮箱和手机号将被永久拉黑。” 所有人都愣住了。 想走?可以。把你过去几年和ChatGPT培养的感情、你赖以为生的API接口、你所有的数据和心血,统统烧掉。你不仅要离开这个公园,你还要在公园的黑名单上挂一辈子。 你以为你在用他的产品,其实你已经成为了他产品的一部分,一个无法移除的、自带法律责任的插件。你被困住了,被你自己的数据和习惯困在了这个数字牢笼里。 这已经不是“LOL, LMAO even”了。 这剧本,连好莱坞的编剧看了都得给奥特曼递根烟,说一句:“哥们,还是你们硅谷会玩儿。”
宝玉
6天前
如果你在为公司现有业务集成 AI Agent,或者迁移到 AI Agent,我自己的一点思考供参考: 1. 如果你流程的路径很确定并且效率很高,那么也许你只需要在原有流程上集成一些 AI 功能就可以,并不一定要变成 Agent 通常 Agent 没有固定流程,依赖于用户的输入来由 LLM 决策调用什么工具 2. 为 Agent 去重新设计新的工具而不是让 Agent 去用现有的工具 通常公司内部已经有一些成熟的工具,但这些工具是为人设计的而不是 Agent 设计的,当你去做 Agent,要重新为 Agent 做新的工具,什么工具是最适合 Agent 就去打造什么工具,但不是因为你有什么工具所以让 Agent 去用什么工具。 另外 Agent 的工具要融入上下文管理: - 描述要清晰具体,让 LLM 知道什么场景该使用什么工具 - 输入参数要明确:即让 LLM 知道该传什么参数,又要让工具有足够的数据可以执行 - 输出结果要清晰明了,不要有太多无关上下文内容,因为工具输出的结果会加入 Agent 的上下文,有些很长的输出可以保存到外部文件按需读取 3. 不要为了 MCP 而用 MCP MCP 很流行,但它的优势是让你的工具可以兼容不同的模型,不同的 AI 平台,如果你的工具只有你自己的 Agent 用,没必要做成 MCP,普通的命令行、脚本、API 都可以。你看 Claude Code 的十几个工具没有一个是 MCP。 4. 工具数量不要太多,基于功能可以适当拆分子智能体 由于工具的描述、输入和输出都占用上下文空间,所以工具数量不能太大,否则会影响 Agent 的能力。 如果你的工具实在太多,可以考虑按照功能拆分成子智能体,让一个子智能体负责某些特定功能的任务,它可以拥有自己的工具集,主 Agent 则负责调度这些子 Agent,为子 Agent 提供独立的上下文,并收集子 Agent 返回的结果。 如果子 Agent 或者工具的结果之间有依赖关系,不要并行执行任务,否则会搞乱上下文 5. 需要为 Agent 重新设计交互 你的软件也许已经有一套交互方式了,但当你去做 Agent 的时候,要重新思考什么是最佳交互方式。 Agent 的交互和传统的软件交互是不一样的,通常以对话为主,用户可以通过对话框输入文本信息,上传文档、图片等作为上下文一部分,信息则更像聊天对话,实时可以看到 AI 返回文本、工具调用结果等。 还可以是有一个主要工作区,类似于传统的软件交互,侧边栏是 Agent 聊天对话。 在 Agent 交互方面,ChatGPT、Claude、Cursor、Notion、Gemini 等产品都有很多交互可以参考,多借鉴前沿主流的 Agent 交互方式
中国水墨风格真龙复活(By Sora2) Sora2提示词: 1. 整体风格 一条中国传统水墨画风格的巨龙“活”了过来,闯入上海陆家嘴金融区,在摩天大楼间穿梭。采用8K超高清画质,电影感镜头,将水墨的空灵飘逸与玻璃幕墙的冰冷现实结合,营造强烈的视觉冲击和超现实感。焦点在于神龙的优雅与现代文明的脆弱。 2. 场景分镜版 (总时长: 10秒) 分镜 1 (0-2秒): 金融中心 镜头: 远景,仰拍镜头。 画面: 上海陆家嘴,东方明珠、上海中心等地标性建筑林立。一块巨大的户外LED屏幕上正在播放一则充满中国风的公益广告,结尾是一条水墨龙盘绕的动画。 音效: 现代都市的背景音,轻柔的广告背景音乐。 分镜 2 (2-3秒): 笔墨成真 镜头: 远景,镜头震动。 画面: 广告播放结束,屏幕上的水墨龙突然化为立体的墨汁,从屏幕中“流淌”出来,在空中迅速凝聚成一条半透明、流淌着墨韵的巨龙。地面上的人们纷纷停下脚步,抬头仰望。 音效: 广告音乐停止,水滴和墨汁流动的声音被放大,人群发出集体性的惊叹声。 分镜 3 (3-6秒): 神龙之舞 镜头: 中景切换至巨龙的特写。 画面: 人们的脸上写满了敬畏与难以置信。镜头以极具压迫感的角度对准巨龙,它优雅地盘旋在上海中心大厦的顶端,水墨构成的身体在阳光下若隐若现,与玻璃幕墙形成虚实对比。 音效: 环境音消失,只有风声和巨龙游动时带起的空灵水墨声。 分镜 4 (6-8秒): 敬畏变恐慌 镜头: 远景,手持摄像机般的剧烈晃动镜头。 画面: 巨龙发出一声低沉的龙吟,摆动龙尾时,无意间扫过一座大楼的楼顶天线,引发一阵电光火花。人群的敬畏瞬间化为恐惧,开始尖叫着涌入地铁站和商场躲避。 音效: 震耳欲聋的龙吟声,金属断裂声,电流声,人群惊恐的尖叫。 分镜 5 (8-10秒): 云端的迷惘 镜头: 对龙头的极限特写。 画面: 镜头聚焦在水墨龙的头部,它的眼神充满古老而纯粹的智慧,看着下方混乱奔逃的渺小人类,眼神中流露出一丝不解和迷惘。 音效: 混乱声减弱,只剩下悠远的风声和一声充满困惑的、更轻柔的龙吟。