#视觉AI

6个月前

Google 研究揭示：Veo 3 达到了视觉AI领域的“GPT-3”时刻 Google DeepMind 通过对Veo 3进行18,384个最简单的视频生成任务测试后，发现： Veo 3，除了生成视频，还能在没有训练的情况下，自动完成各种复杂的视觉任务，比如找物体、修照片、玩迷宫、解数独。它可以: - 看懂图像：自动识别边缘、轮廓、物体位置、颜色、形状等； - 理解物理：知道什么会漂浮，什么会下沉；知道光是怎么反射的； - 动手编辑图像：可以“自动P图”，像移除背景、添加文字、转成油画风格等； - 自己“推理”：比如看一张迷宫图，它可以画出走迷宫的路线！研究认为，Veo 3 可能达到了视觉AI领域的“GPT-3”时刻！

智谱直播发布全球最佳视觉模型GLM-4.5V，挑战AI视觉领域极限· 21 条信息

#Veo 3 #视觉AI #GPT-3时刻 #Google DeepMind #视频生成