2025-04-24 01:50:45
今天喝酒见了一个朋友,他分享了他们怎么做视频生成。 先以商业软件为主,如Midjourney、可灵等,生成人物IP的多角度图。 抽卡后人工评判可用性,生成图片角色IP。 然后用阿里的WanX(Wan2.1)做3D旋转,取图,然后用这些图做基座模型。 再用Wan做生成无声但有嘴部动作的基座视频。 最后用SoVITS结合脚本做对嘴型,加上场景切换。 这套流程下来,计划做上千个IP形象,占领多个赛道。 两年前就开始探索,他认为最大的转折点就是阿里视频模型Wan的开源,一切商业流程就全打通了。
2025-04-24 01:50:45
2025-04-23 20:33:09
2025-04-23 19:40:56
2025-04-23 11:23:26
2025-04-23 10:13:00