小互2025-04-07 17:08:14阿里的这个项目牛P啊 OmniTalker:只用一段“参考视频”就能学会视频里人物说话 并保持唇形同步和表情 也就是你给它一段视频它可以同时提取视频中人物的说话风格和面部表情。 比如你给它一段罗翔的视频),它就能学会“罗翔是怎么说话、什么表情”,然后你随便给它什么文字,它就用这种风格去说话。 不用你训练模型、调参数,也不用配音演员,全自动!#阿里#OmniTalker#视频处理
小互2025-01-04 14:48:00字节跳动终于开源了一个好东西 LatentSync:精准的唇形同步工具 可以根据音频输入,自动调整视频中角色的嘴型,实现精准的口型同步。 直接用声音驱动嘴巴的动作,不需要复杂的中间步骤。 提出了一种“时间对齐”的技术,专门解决画面可能会跳动或不一致的问题。 左:原视频,右:口型同步后 提供了全套工具,可以轻松处理视频和音频,比如调整帧数、检测人脸、去除质量差的视频,保证最终生成的视频效#字节跳动#开源#LatentSync
北美王路飞2024-12-29 03:55:53我刚弄了一个新的github repo来上传我的视频处理脚本,目前上传了两个脚本: 脚本 1 - 音频转文字(便于后期做视频总结) 脚本 2 - 音频转字幕 (直接生成 .srt) 其他脚本我会陆续添加到repo,大家如果有反馈可以在这个帖子里给我留言。 #GitHub#视频处理#脚本