2025-04-01 13:46:31
仔细对比这两张图,你会发现一个令人毛骨悚然的细节,GPT-4o 将原图桌上的书本换成了 Peace Sattlement,这说明他知道这张图背后的故事 GPT-4o 的绘图能力是模型原生的,而不是像以前那样简单去调用 Dall-E,而是经过思维链思考后结合自己的知识去反馈你的指令 你可能不知道这意味着什么,那我来说句暴论: 当下资本热捧的所有 AI 衍生工具,在多模态 AI 的面前可能都会价值归零,包括不限于各种 RAG 工具、AI IDE、AI Workflow 工具、各种 Agent、各种场景化衍生品 想想 23 年我花了一晚上搞个 lora 才能实现图片换脸,而现在在 GPT 上你只需要不到 20 个汉字就能实现 一个盲人 + 一个聋子永远比不过一个正常的人类,多模态能力的共振对于 AI 能力的提升也并不是 1+1=2 的线性增长。在发展更加多维 AI 这个努力目标面前,所有的试图曲线救国或者投机取巧的努力都将白费 此刻我脑袋里只有《三体》中托马斯·维德的那句话 前进!前进!不择手段地前进!
2025-04-01 13:46:31
2025-04-01 10:12:27
2025-03-30 11:13:58