Gorden Sun

Gorden Sun

0 关注者

6个月前

HuMo:专注生成人物的视频框架 支持文本、图片、语音输入,生成人物为中心的视频。后续会开源HuMo-17B和HuMo-1.7B视频模型,目前也可以用Wan-2.1作为视频模型。 项目地址: Github:

#HuMo #视频生成 #人物视频 #开源模型 #Wan-2.1

相关新闻

placeholder

nicekate

3天前

Grok Imagine 图生视频效果不错,支持中文语音,文字稳定性也保持得很好 提示词:make it fun

placeholder

Gorden Sun

3天前

Cohere开源语音识别模型Transcribe 2B参数,本地能跑,可能是目前的开源最佳,但是不确定中文识别的效果如何。 模型:

placeholder

Gorden Sun

5天前

PrismAudio:视频生成音效 阿里开源的模型,输入视频,自动生成跟画面匹配的音效。效果还不错。 项目地址: 模型:

placeholder

Gorden Sun

1周前

悲报:Grok取消了免费用户生成视频的额度

placeholder

Xiaowen

2周前

Qwen3.5 系列确实厉害。 手机上能跑的 Qwen 3.5 2B 版本,已经可以流畅合理的进行很多有内容的复杂对话了,其他任何一个国外开源的 2-4b 版本,几乎完全是智障。

关联事件

AI视频井喷:Midjourney领跑,多模态混战

337

AI视频生成领域竞争白热化,Midjourney持续领跑并更新视频模型,提升指令遵循能力。Hailuo AI、Heygen等推出易用AI视频工具,阿里云发布多模态模型Qwen VLo。BlackForestLabs发布图像生成神器FLUX。百度发布音视频一体化生成模型MuseSteamer。纳米AI推出视频生成Agent。Soul Inpaint实现图像和视频编辑。AI虚拟演员被大规模使用于广告。各平台降低视频制作门槛,加速行业发展,并涌现出AI生成短视频变现新模式。

© 2025 news.news. All rights reserved. 0.03592 秒. v1.0.46
我的评论