时政
财经
科技
虚拟货币
其他
登录
#文生图模型
关注
sitin
1天前
通义千问团队开源了20B参数的文生图模型Qwen-lmage,是通义千问系列一个开源的、具备极强文本渲染与图像编辑能力的图像生成基础模型,适用于广泛创作场景, 核心亮点: • 文字渲染达到业界领先水平,英文效果媲美 GPT-4o,中文表现更是同类最佳 • 原生文字生成技术,文字直接融入像素,无需后期叠加处理 • 支持中英双语,兼容多种字体和复杂版面设计,生成效果清晰、准确、风格一致。 • 支持风格迁移、物体增删改、文字修改、姿态调整等,编辑结果与原图高度一致。 • 支持写实、动漫、极简等多种风格,适用场景广泛。 以后在生成中文字的稳定性和复杂性方面终于有开源可用的方案了!效果比即梦 AI 和 GPT-4o 还强! 阿里巴巴推出 20B 参数的 MMDiT 模型,专门针对带文字的图像生成进行优化,现已完全开源。
#通义千问
#文生图模型
#Qwen-lmage
#开源
#图像生成
分享
评论 0
0
个人主页
通知
我的投稿
我的关注
我的拉黑
我的评论
我的点赞