时政
财经
科技
虚拟货币
其他
登录
#MoE架构
关注
orange.ai
2周前
今晚,阿里开源视频生成模型「通义万相Wan2.2」 此次共开源三款模型,分别是文生视频、图生视频、统一视频生成模型。 其中文生视频模型和图生视频模型均为业界首个使用MoE架构的视频生成模型,总参数量为27B,激活参数14B; 同时,首创电影美学控制系统,光影、色彩、构图、微表情等能力媲美专业电影水平。
AI视频井喷:Midjourney领跑,多模态混战· 83 条信息
#阿里
#通义万相Wan2.2
#视频生成模型
#MoE架构
#电影美学
分享
评论 0
0
歸藏(guizang.ai)
2周前
Wan 2.2 视频模型开源 ! 大幅提升电影美学控制和复杂运动质量,ComfyUI 已经支持。 是我见过的第一个使用 MoE 架构的视频模型,高噪声专家(负责整体布局)和低噪声专家(精细调整细节) 5B 版本采用高压缩 VAE,优化显存使用,相比 2.1 版本数据大幅升级。
AI视频井喷:Midjourney领跑,多模态混战· 83 条信息
#视频模型
#开源
#电影美学
#MoE架构
#高压缩VAE
分享
评论 0
0
karminski-牙医
1个月前
Google Gemini-2.5 系列的技术报告出了, 有很多高价值信息 比如这个,确认的确是MoE架构的。虽然大家都能猜到现在头部闭源模型是MoE的,但这个是第一次书面确认是MoE的。 另外从价格vs性能这张图来看,Gemini-2.5 系列的确在性价比上建立了一个非常好的护城河,Gemini-2.5-Pro 就是现在的 SOTA 文本模型,Gemini-2.5-Flash 则是目前则专门对着 GPT-4.1 打。 我看这周或者下周有时间给大家安排个详细解读。 技术报告地址:
Google Gemini 2.5发布引发AI模型性价比热议· 97 条信息
OpenAI新德里发布会:ChatGPT语音翻译功能引发热议· 328 条信息
#Google Gemini-2.5
#MoE架构
#性价比优势
#SOTA文本模型
#GPT-4.1
分享
评论 0
0
个人主页
通知
我的投稿
我的关注
我的拉黑
我的评论
我的点赞