#通义万相

5个月前

我那条用通义万相替换人物的视频，发到视频号之后播放量过了 200w，评论区大概有两种一种是希望我卖他们一个数字人软件，割他们另外一种是呼吁净网行动打击AI，防范数字人诈骗，认为视频模态的大模型是邪恶的（“邪恶”一词为评论区原话）所以呢，虽然我也看不上割韭菜的行为但是如果你下次看见有人在视频号割韭菜，请你对手持镰刀的人多一点宽容他们是被逼的，被迫收割

#通义万相 #数字人 #视频号 #割韭菜 #AI诈骗

WaytoAGI｜通往AGI之路

5个月前

9月24日阿里夸克发布了AI创作平台“造点”，支持AI 生图和AI生视频两大能力，并且率先接入通义万相Wan2.5，甚至直接开放了 7 天免费体验！这是国内首个支持音画同步视频生成的平台，生图方面，造点AI还引入了图像生成模型Midjourney V7。一个夸克「造点AI」= 生图 + 生视频 + 加配乐 + 对口型 +P 图编辑，太丝滑了！

AI视频井喷：Midjourney领跑，多模态混战· 337 条信息

#阿里 #夸克 #AI创作平台 #造点 #通义万相

6个月前

通义万相开源了全新多模态视频生成模型「Wan2.2-S2V」。模型仅需一张静态图片和一段音频，能生成电影级数字人视频，视频时长可达分钟级，大幅提升数字人直播、影视制作等行业的视频创作效率。模型支持真人、卡通、动物等多种图片类型，可通过文本控制视频画面。核心功能多模态视频生成：仅需一张静态图片 + 一段音频，就能生成电影级数字人视频支持多种图片类型：真人、卡通、动物、数字人等，支持肖像、半身、全身等任意画幅多种动作生成：说话、唱歌、表演等动作，面部表情自然、口型同步、肢体动作流畅技术亮点视频时长：单次生成可达分钟级，达到业界领先水平文本控制：支持通过Prompt控制视频画面，让动作和背景变化更丰富技术创新：融合文本引导的全局运动控制和音频驱动的细粒度局部运动采用AdaIN和CrossAttention控制机制层次化帧压缩技术，支持73帧历史参考帧多分辨率训练和推理应用场景主要提升数字人直播、影视制作、AI教育等行业的视频创作效率

AI视频井喷：Midjourney领跑，多模态混战· 337 条信息

#通义万相 #多模态视频生成 #数字人 #AI #视频创作