#图像编辑

Black Forest Labs 发布 FLUX.2,依旧开源! 支持文生图、多图参考以及图像编辑,文本生成和提示词遵循能力大幅提高。 具体的模型能力有: - 最多同时参考 10 张图片,提供最佳一致性。 - 更丰富的细节、更清晰的纹理和更稳定的光线。 - 复杂排版、信息图、表情包和用户界面的文字渲染 - 在遵循复杂、结构化指令方面得到改进 - 现实世界知识、光照和空间逻辑方面显著更有根据 - 支持高达 4MP 分辨率的图像编辑 这次发布了四个模型版本: FLUX.2 [pro]:与最优秀的封闭模型相媲美的最先进图像质量,在提示遵从性和视觉逼真度方面与其他模型相当,同时生成图像更快且成本更低。速度与质量两者兼得。 FLUX.2 [flex]:可控制模型参数,例如步数和引导强度,让开发者对质量、提示遵从性与速度拥有完全控制。该模型在渲染文本和细节方面表现出色。 FLUX.2 [dev]:32B 开放权重模型,源自 FLUX.2 基础模型。当前最强大的开源图像生成与编辑模型,将文本到图像合成与多输入图像的图像编辑结合在单一模型中。 FLUX.2 [klein](即将推出):开源,Apache 2.0 许可证模型,从 FLUX.2 基础模型通过蒸馏得到的同尺寸模型。比同等尺寸且从头训练的可比模型更强大且更利于开发者使用。 FLUX.2 - VAE:一种新的变分自编码器,用于潜在表示,在可学习性、质量和压缩率之间提供优化的权衡。
sitin
4个月前
哪里不对改哪里!全能图像编辑模型Qwen-lmage-Edit来啦 Qwen团队推出全能图像编辑模型Qwen-lmage-Edit。模型基于20B参数的Qwen-lmage模型进一步训练, 具备语义与外观双重编辑能力,支持中英文双语文字精准编辑,可实现原创P创作、视角转换、风格迁移、元素增删改等功能。 不仅能P图换风格,还能直接改图片里的字,而且修得又准又好,旨在让所有人都能轻松成为修图大师。 主要亮点和特性: 1.双重编辑能力: 语义编辑 (High-level):改变图片的整体风格、视角、角色形象(如IP创作),允许整张图片像素变化,但保持核心内容语义一致(例如,把真人变成吉卜力动画风格,或将一个物体旋转180度)。 外观编辑 (Low-level):对图片进行局部、精细的修改,要求图片其他部分完全不变(例如,删除图片里的一根头发丝、给衣服换颜色、添加一个带倒影的路牌)。 2.精准的文字编辑:这是它的一大杀手锏。模型能够直接理解和修改图片中的文字,无论是中文还是英文,并且能尽力保持原有的字体、大小和风格。这对于修改海报、修正错误文字极其有用。 3.强大的性能:文章称,在多项公开测试中,该模型都达到了SOTA(当前最先进)的性能水平,是一个强大的基础模型。 4.链式编辑:文章展示了一个重要应用——可以通过多次、逐步的编辑指令,不断修正图片,直到达到完美效果(例如,逐步修正书法作品中的每一个错别字)。 目的是什么? 降低视觉内容创作(如IP设计、海报修改、照片修复、风格化创作)的技术门槛,让用户能够通过简单的语言指令就能完成复杂的图片编辑任务。