#图像编辑

4个月前

Adobe正式发布网页版PhotoShop，用户只需在2025年12月8日前注册，即可免费试用12个月，无需支付费用。方法：需要安装一个PhotoShop的Chrome扩展（Edge也可以）：…网页图片左上角将出现PS图标，点击后可直接进入在线编辑界面。

#Adobe #PhotoShop网页版 #免费试用 #Chrome扩展 #图像编辑

歸藏(guizang.ai)

4个月前

Black Forest Labs 发布 FLUX.2，依旧开源！支持文生图、多图参考以及图像编辑，文本生成和提示词遵循能力大幅提高。具体的模型能力有： - 最多同时参考 10 张图片，提供最佳一致性。 - 更丰富的细节、更清晰的纹理和更稳定的光线。 - 复杂排版、信息图、表情包和用户界面的文字渲染 - 在遵循复杂、结构化指令方面得到改进 - 现实世界知识、光照和空间逻辑方面显著更有根据 - 支持高达 4MP 分辨率的图像编辑这次发布了四个模型版本： FLUX.2 [pro]：与最优秀的封闭模型相媲美的最先进图像质量，在提示遵从性和视觉逼真度方面与其他模型相当，同时生成图像更快且成本更低。速度与质量两者兼得。 FLUX.2 [flex]：可控制模型参数，例如步数和引导强度，让开发者对质量、提示遵从性与速度拥有完全控制。该模型在渲染文本和细节方面表现出色。 FLUX.2 [dev]：32B 开放权重模型，源自 FLUX.2 基础模型。当前最强大的开源图像生成与编辑模型，将文本到图像合成与多输入图像的图像编辑结合在单一模型中。 FLUX.2 [klein]（即将推出）：开源，Apache 2.0 许可证模型，从 FLUX.2 基础模型通过蒸馏得到的同尺寸模型。比同等尺寸且从头训练的可比模型更强大且更利于开发者使用。 FLUX.2 - VAE：一种新的变分自编码器，用于潜在表示，在可学习性、质量和压缩率之间提供优化的权衡。

#FLUX.2 #开源 #文生图 #图像编辑 #Black Forest Labs

4个月前

在做角色设计、3D建模及电商商品展示场景的朋友们，看过来！阿里的的这个开源软件，可以生成图片物品的多角度视图，同时保持角色身份特征和风格一致性 Qwen-Image-2509-MultipleAngles是阿里巴巴通义千问团队开发的图像编辑模型 Qwen-Image-Edit-2509的扩展插件，通过自然语言指令实现图像的多角度自由转换。支持9种基础相机操作：前后左右移动、左右旋转45度、俯视/仰视、广角/特写镜头切换，也可通过简单提示词如"将镜头向左旋转45度"或"转为俯视视图"直接调整视角。旋转过程中主体特征保留率达95%，显著降低传统工具旋转后的人物面部失真问题。免费体验地址：

#Qwen-Image-2509-MultipleAngles #图像编辑 #多角度视图生成 #阿里巴巴通义千问 #角色身份保持

4个月前

刚发现一个 Nano-Banana 精选案例库，收录了 110+ 个实战案例，做 AI 图像的朋友们可以省去无数试错时间。它不只是简单的效果展示，每个案例都附带完整的输入图 + 输出图 + 提示词，可以直接上手复现。覆盖的场景非常全：人物编辑：换装、换发型、换妆造、表情迁移创意合成：照片变手办、线稿上色、草图变实景实用修复：老照片修复、去水印、图片增强设计辅助：产品包装、材质转换、风格迁移多图融合：场景重构、构图参考、元素组合他们还开源了 Nano-consistent-150k 数据集，这是针对「人物身份一致性」专门设计的，同一个人在 35+ 种编辑任务下都能保持稳定。这对做图像生成或多模态模型的人来说，参考价值很高。案例都是从 Twitter 和小红书等自媒体平台精选出来的真实应用，不是 Demo 级别的玩具效果。找提示词灵感，学习图像编辑思路，了解多模态能力边界，一个库解决三个需求。 Star 一下不亏，说不定下次做项目就能用上

#AI图像 #Nano-Banana案例库 #图像编辑 #多模态模型 #开源数据集

歸藏(guizang.ai)

5个月前

Adobe firefly 的新能力，支持将一张图片拆分成不同的图层而且每个图层内容支持自然语言编辑也支持拖动

#Adobe Firefly #图像编辑 #图层分离 #自然语言编辑 #AI

5个月前

nano banana提示词：编辑图片，把图像垂直分成两半：左侧是写实照片，右侧是细致的黑白素描，采用漫画风格。素描部分包含星星、爱心、笑脸等可爱的涂鸦，头部周围还有小卡通人物。素描部分还包含手写的英文文字和俏皮的装饰。写实部分与素描部分流畅地融合，营造出一种半人半涂鸦的艺术效果。简洁、美观、富有创意的现代插画风格。

#AI绘画 #图像编辑 #写实与素描结合 #漫画风格 #创意插画

5个月前

周五软件分享 - Sumo Paint：图像编辑工具，Photoshop的网页替代品 - pdoc：将Python脚本注释转为API文档 - Scribe OCR：对图片和PDF文件进行OCR的网页应用更多软件 #科技爱好者周刊（第368期）

#软件分享 #图像编辑 #Python API文档 #OCR网页应用 #科技爱好者周刊

6个月前

Google 相册现在可以通过文字或语音直接编辑图像点击图像可以直接调用Banana对照片进行编辑拥有自有模型和应用、硬件的优势凸显出来了 Google正在将模型能力整合到自己的各种产品应用和硬件中，让模型能快速的得到广泛的使用，探索各种可能性这对苹果来说有着很大的压力，苹果封闭的策略是不是要改变了。

#Google 相册 #图像编辑 #模型整合 #苹果压力 #开放生态

7个月前

#每日推荐免费在线体验Google最强AI图片模型网址： Edit images 10x faster with text prompts. Nano Banana AI keeps perfect character consistency, 3-second generation. Free unlimited access, no signup.

#AI图片模型 #Google #免费在线体验 #图像编辑 #Nano Banana AI

7个月前

nano-banana 大展宏图！开个我的图像编辑测试大合集贴！目的： ✅探索模型能力边界 ✅模型各有所长，方便大家根据细分场景找到最合适自己的模型 ✅方便整活/灵感参与对比模型（当前版本四强/各有所长）： 1️⃣nano-banana（Gemini2.5FlashImg 2️⃣GPT-Img 3️⃣Flux-Kontext-Pro 4️⃣Qwen-Img-Edit 1/n

Google Gemini 2.5发布引发AI模型性价比热议· 475 条信息

OpenAI新德里发布会：ChatGPT语音翻译功能引发热议· 869 条信息

#nano-banana #图像编辑 #模型对比 #Gemini2.5FlashImg #Qwen-Img-Edit

7个月前

Gemini 2.5 Flash Image 生成图像和编辑图像都好快啊

Google Gemini 2.5发布引发AI模型性价比热议· 475 条信息

OpenAI新德里发布会：ChatGPT语音翻译功能引发热议· 869 条信息

#Gemini 2.5 #图像生成 #图像编辑 #快速 #积极

7个月前

哪里不对改哪里！全能图像编辑模型Qwen-lmage-Edit来啦 Qwen团队推出全能图像编辑模型Qwen-lmage-Edit。模型基于20B参数的Qwen-lmage模型进一步训练，具备语义与外观双重编辑能力，支持中英文双语文字精准编辑，可实现原创P创作、视角转换、风格迁移、元素增删改等功能。不仅能P图换风格，还能直接改图片里的字，而且修得又准又好，旨在让所有人都能轻松成为修图大师。主要亮点和特性： 1.双重编辑能力：语义编辑 (High-level)：改变图片的整体风格、视角、角色形象（如IP创作），允许整张图片像素变化，但保持核心内容语义一致（例如，把真人变成吉卜力动画风格，或将一个物体旋转180度）。外观编辑 (Low-level)：对图片进行局部、精细的修改，要求图片其他部分完全不变（例如，删除图片里的一根头发丝、给衣服换颜色、添加一个带倒影的路牌）。 2.精准的文字编辑：这是它的一大杀手锏。模型能够直接理解和修改图片中的文字，无论是中文还是英文，并且能尽力保持原有的字体、大小和风格。这对于修改海报、修正错误文字极其有用。 3.强大的性能：文章称，在多项公开测试中，该模型都达到了SOTA（当前最先进）的性能水平，是一个强大的基础模型。 4.链式编辑：文章展示了一个重要应用——可以通过多次、逐步的编辑指令，不断修正图片，直到达到完美效果（例如，逐步修正书法作品中的每一个错别字）。目的是什么？降低视觉内容创作（如IP设计、海报修改、照片修复、风格化创作）的技术门槛，让用户能够通过简单的语言指令就能完成复杂的图片编辑任务。

#Qwen-lmage-Edit #图像编辑 #AI模型 #文字编辑 #SOTA

WaytoAGI｜通往AGI之路

7个月前

Qwen-Image是什么？ Qwen-Image是通义千问系列中的最新成员，也是该系列首个图像生成基础模型。它在复杂文本渲染和精确图像编辑方面取得了显著进展，成为图像生成领域的一颗新星。亮点功能抢先看

#Qwen-Image #通义千问 #图像生成 #文本渲染 #图像编辑

8个月前

Mistral Al推出升级版Le Chat，全方位对标ChatGPT。 Le Chat新增深度研究模式，可生成结构化研究报告; 语音模式借助新发布的Voxtral模型实现语音输入; 原生多语言推理功能提供更精准回答; 项目管理功能可组织对话内容; 高级图像编辑功能支持复杂图像修改。卷起来了。

OpenAI新德里发布会：ChatGPT语音翻译功能引发热议· 869 条信息

#Mistral AI #Le Chat #ChatGPT #语音模式 #图像编辑

9个月前

字节的多模态模型 - BAGEl - 开源免费对比优势 • 多模态理解、生成和编辑能力在主流榜单上整体领先，超越 Qwen2.5-VL、InternVL-2.5、SD3 等开源模型 • 图像生成质量高，细节丰富，媲美 SD3 • 图像编辑、风格迁移、自由视觉操作等功能更强 • 支持多轮对话、复杂推理和世界建模，综合能力突出线上直接体验官网 Github

#多模态模型 #BAGEl #字节 #Qwen2.5-VL #InternVL-2.5 #SD3 #图像生成 #图像编辑 #风格迁移 #自由视觉操作 #多轮对话 #复杂推理 #世界建模 #开源模型

歸藏(guizang.ai)

9个月前

即梦图片 3.0 的智能参考太猛了，想怎么改图就怎么改

#即梦图片3.0 #智能修改 #AI技术 #图像编辑

10个月前

#每日推荐 Flux.1 Kontext - 可以实现GPT 4o图像能力快速在线免费体验新一代多模态图像生成与编辑模型：Flux.1 Kontext；Kontext 同时理解文本与图像输入，能够实现真正的“上下文生成与编辑”。

#多模态图像生成 #图像编辑 #Flux.1 Kontext #GPT-4 #人工智能 #上下文理解 #免费体验 #新技术推荐

偶像派作手

1年前

我的“改成吉卜力风格”

#改成吉卜力风格 #吉卜力 #艺术风格 #图像编辑

1年前

OpenAI 发布最新的图像生成模型直接内置在GPT-4o中支持进行多轮对话修改编辑图像 📌 精准性提升可准确渲染文字精细控制图像结构支持用户通过对话逐步修改迭代图像内容 📌 上下文理解增强可记住对话中用户的需求和偏好比如：用户要求“与上一张保持人物发型相同”，GPT-4o 可自动执行 GPT-4o 的图像生成不仅能提供传统的图像生成，还可以生成更复杂的图像，包括插图、图表、PPT 元素、logo、游戏角色设计等。对复杂 prompt 的遵循度高，支持 prompt 中描述 10–20 个物体对象及其属性、关系，超越 DALL·E 3 的 ~5–8 个极限每个物体的属性、关系可被分别控制，图像结构更加精细清晰

#OpenAI #图像生成 #GPT-4o #多轮对话 #图像编辑 #精准渲染 #上下文理解 #需求偏好 #复杂图像 #人工智能

1年前

Grok3也开放了图像编辑，我用它和Gemini 2.0的图像编辑做了一个对比，结论是Grok3的不能用，对有人像的照片进行编辑，竟然能让人脸变形。Gemini 2.0有的AI PS图的意思了。

#Grok3 #Gemini 2.0 #图像编辑 #人脸变形 #AI编辑软件

1年前

豆包客户端里的图像编辑厉害，我以为网传段子。刚截图测试了下还真可以。。。这个使用场景牛逼！

#豆包 #图像编辑 #网传段子 #使用场景