sitin

sitin

0 关注者

1个月前

昆仑万维推出并开源了多模态统一预训练模型Skywork UniPic。 模型融合图像理解、文本生成图像和图像编辑三大核心能力,采用自回归路线,基于大规模高质量数据进行端到端预训练。 采用 MAR + SigLIP2 混合架构,兼顾视觉细节与语义理解,突破传统 VQ/VAE 编码器的局限。支持 端到端联合训练,实现三大任务协同优化,避免能力权衡。引入 Skywork-ImgReward 与 Sk

相关新闻