牛P了 Vidu 的 Reference-to-Video 功能 支持一次性上传最多 7 张参考图片 并结合一段文字提示,生成具有高度一致性、风格统一、视觉保真度高的视频内容 参考图可以是人物、场景、道具等任意内容 下面是我的测试介绍... 利用 Vidu Q1 模型的多模态对齐机制 能实现结构保持、纹理迁移、风格还原同步完成 模型还会根据参考图和 Prompt 自动进行智能镜头推演,构建“视觉叙事”结构,如推镜头、平移、场景切换等 这是目前行业内首个支持多图引用、并具有角色/场景一致性的开放式视频生成工具。 下面是教程