HuMo：专注生成人物的视频框架支持文本、图片、语音输入，生成人物为中心的视频。后续会开源HuMo-17B和HuMo-1.7B视频模型，目前也可以用Wan-2.1作为视频模型。项目地址： Github：

#HuMo #视频生成 #人物视频 #开源模型 #Wan-2.1

相关新闻

nicekate

3天前

Grok Imagine 图生视频效果不错，支持中文语音，文字稳定性也保持得很好提示词：make it fun

Gorden Sun

3天前

Cohere开源语音识别模型Transcribe 2B参数，本地能跑，可能是目前的开源最佳，但是不确定中文识别的效果如何。模型：

Gorden Sun

5天前

PrismAudio：视频生成音效阿里开源的模型，输入视频，自动生成跟画面匹配的音效。效果还不错。项目地址：模型：

Gorden Sun

1周前

悲报：Grok取消了免费用户生成视频的额度

Xiaowen

2周前

Qwen3.5 系列确实厉害。手机上能跑的 Qwen 3.5 2B 版本，已经可以流畅合理的进行很多有内容的复杂对话了，其他任何一个国外开源的 2-4b 版本，几乎完全是智障。

关联事件

AI视频井喷：Midjourney领跑，多模态混战

337

AI视频生成领域竞争白热化，Midjourney持续领跑并更新视频模型，提升指令遵循能力。Hailuo AI、Heygen等推出易用AI视频工具，阿里云发布多模态模型Qwen VLo。BlackForestLabs发布图像生成神器FLUX。百度发布音视频一体化生成模型MuseSteamer。纳米AI推出视频生成Agent。Soul Inpaint实现图像和视频编辑。AI虚拟演员被大规模使用于广告。各平台降低视频制作门槛，加速行业发展，并涌现出AI生成短视频变现新模式。

HuMo：专注生成人物的视频框架 支持文本、图片、语音输入，生成人物为中心的视频。后续会开源HuMo-17B和HuMo-1.7B视频模型，目前也可以用Wan-2.1作为视频模型。 项目地址： Github：

相关新闻

关联事件

HuMo：专注生成人物的视频框架支持文本、图片、语音输入，生成人物为中心的视频。后续会开源HuMo-17B和HuMo-1.7B视频模型，目前也可以用Wan-2.1作为视频模型。项目地址： Github：