时政
财经
科技
虚拟货币
其他
登录
#视觉AI
关注
小互
1天前
Google 研究揭示:Veo 3 达到了视觉AI领域的“GPT-3”时刻 Google DeepMind 通过对Veo 3进行18,384个最简单的视频生成任务测试后,发现: Veo 3,除了生成视频,还能在没有训练的情况下,自动完成各种复杂的视觉任务,比如找物体、修照片、玩迷宫、解数独。 它可以: - 看懂图像:自动识别边缘、轮廓、物体位置、颜色、形状等; - 理解物理:知道什么会漂浮,什么会下沉;知道光是怎么反射的; - 动手编辑图像:可以“自动P图”,像移除背景、添加文字、转成油画风格等; - 自己“推理”:比如看一张迷宫图,它可以画出走迷宫的路线! 研究认为,Veo 3 可能达到了视觉AI领域的“GPT-3”时刻!
智谱直播发布全球最佳视觉模型GLM-4.5V,挑战AI视觉领域极限· 5 条信息
#Veo 3
#视觉AI
#GPT-3时刻
#Google DeepMind
#视频生成
分享
评论 0
0
个人主页
通知
我的投稿
我的关注
我的拉黑
我的评论
我的点赞