AIGCLINK

AIGCLINK

0 关注者

1周前

谷歌发布的Veo3的核心技术CoF(视觉模型思维链),正在推动视觉模型从特定任务模型到通用视觉模型的演进,犹如当年大语言模型经历了NLP到LLM的进化,视觉模型也在经历从特定任务的CV到通用视觉基础模型的进化。 Veo 3 有很强的泛化能力,其在未训练任务上表现出极强的零样本能力,如物体分割、边缘检测、物理模拟和迷宫求解等。通过 18,384 个生成视频评估 62 个定性任务和 7 个定量任务,