sitin 0 关注者 关注 1个月前 昆仑万维推出并开源了多模态统一预训练模型Skywork UniPic。 模型融合图像理解、文本生成图像和图像编辑三大核心能力,采用自回归路线,基于大规模高质量数据进行端到端预训练。 采用 MAR + SigLIP2 混合架构,兼顾视觉细节与语义理解,突破传统 VQ/VAE 编码器的局限。支持 端到端联合训练,实现三大任务协同优化,避免能力权衡。引入 Skywork-ImgReward 与 Sk #昆仑万维 #Skywork UniPic #多模态预训练模型 #图像理解 #文本生成图像 前往原网页查看