时政
财经
科技
虚拟货币
其他
登录
#图像编辑
关注
松果先森
6天前
在做角色设计、3D建模及电商商品展示场景的朋友们,看过来! 阿里的的这个开源软件,可以生成图片物品的多角度视图,同时保持角色身份特征和风格一致性 Qwen-Image-2509-MultipleAngles是阿里巴巴通义千问团队开发的图像编辑模型 Qwen-Image-Edit-2509的扩展插件,通过自然语言指令实现图像的多角度自由转换。 支持9种基础相机操作:前后左右移动、左右旋转45度、俯视/仰视、广角/特写镜头切换, 也可通过简单提示词如"将镜头向左旋转45度"或"转为俯视视图"直接调整视角。 旋转过程中主体特征保留率达95%,显著降低传统工具旋转后的人物面部失真问题。 免费体验地址:
#Qwen-Image-2509-MultipleAngles
#图像编辑
#多角度视图生成
#阿里巴巴通义千问
#角色身份保持
分享
评论 0
0
Latte
1周前
刚发现一个 Nano-Banana 精选案例库,收录了 110+ 个实战案例,做 AI 图像的朋友们可以省去无数试错时间。 它不只是简单的效果展示,每个案例都附带完整的输入图 + 输出图 + 提示词,可以直接上手复现。 覆盖的场景非常全: 人物编辑:换装、换发型、换妆造、表情迁移 创意合成:照片变手办、线稿上色、草图变实景 实用修复:老照片修复、去水印、图片增强 设计辅助:产品包装、材质转换、风格迁移 多图融合:场景重构、构图参考、元素组合 他们还开源了 Nano-consistent-150k 数据集,这是针对「人物身份一致性」专门设计的,同一个人在 35+ 种编辑任务下都能保持稳定。这对做图像生成或多模态模型的人来说,参考价值很高。 案例都是从 Twitter 和小红书等自媒体平台精选出来的真实应用,不是 Demo 级别的玩具效果。 找提示词灵感,学习图像编辑思路,了解多模态能力边界,一个库解决三个需求。 Star 一下不亏,说不定下次做项目就能用上
#AI图像
#Nano-Banana案例库
#图像编辑
#多模态模型
#开源数据集
分享
评论 0
0
歸藏(guizang.ai)
2周前
Adobe firefly 的新能力,支持将一张图片拆分成不同的图层 而且每个图层内容支持自然语言编辑也支持拖动
#Adobe Firefly
#图像编辑
#图层分离
#自然语言编辑
#AI
分享
评论 0
0
Gorden Sun
1个月前
nano banana提示词: 编辑图片,把图像垂直分成两半:左侧是写实照片,右侧是细致的黑白素描,采用漫画风格。素描部分包含星星、爱心、笑脸等可爱的涂鸦,头部周围还有小卡通人物。素描部分还包含手写的英文文字和俏皮的装饰。写实部分与素描部分流畅地融合,营造出一种半人半涂鸦的艺术效果。简洁、美观、富有创意的现代插画风格。
#AI绘画
#图像编辑
#写实与素描结合
#漫画风格
#创意插画
分享
评论 0
0
ruanyf
1个月前
周五软件分享 - Sumo Paint:图像编辑工具,Photoshop的网页替代品 - pdoc:将Python脚本注释转为API文档 - Scribe OCR:对图片和PDF文件进行OCR的网页应用 更多软件 #科技爱好者周刊(第368期)
#软件分享
#图像编辑
#Python API文档
#OCR网页应用
#科技爱好者周刊
分享
评论 0
0
小互
1个月前
Google 相册现在可以通过文字或语音直接编辑图像 点击图像可以直接调用Banana对照片进行编辑 拥有自有模型和应用、硬件的优势凸显出来了 Google正在将模型能力整合到自己的各种产品应用和硬件中,让模型能快速的得到广泛的使用,探索各种可能性 这对苹果来说有着很大的压力,苹果封闭的策略是不是要改变了。
#Google 相册
#图像编辑
#模型整合
#苹果压力
#开放生态
分享
评论 0
0
ilovelife
2个月前
#每日推荐 免费在线体验Google最强AI图片模型 网址: Edit images 10x faster with text prompts. Nano Banana AI keeps perfect character consistency, 3-second generation. Free unlimited access, no signup.
#AI图片模型
#Google
#免费在线体验
#图像编辑
#Nano Banana AI
分享
评论 0
0
-Zho-
2个月前
nano-banana 大展宏图!开个我的图像编辑测试大合集贴! 目的: ✅探索模型能力边界 ✅模型各有所长,方便大家根据细分场景找到最合适自己的模型 ✅方便整活/灵感 参与对比模型(当前版本四强/各有所长): 1️⃣nano-banana(Gemini2.5FlashImg 2️⃣GPT-Img 3️⃣Flux-Kontext-Pro 4️⃣Qwen-Img-Edit 1/n
Google Gemini 2.5发布引发AI模型性价比热议· 280 条信息
OpenAI新德里发布会:ChatGPT语音翻译功能引发热议· 655 条信息
#nano-banana
#图像编辑
#模型对比
#Gemini2.5FlashImg
#Qwen-Img-Edit
分享
评论 0
0
Geek
2个月前
Gemini 2.5 Flash Image 生成图像和编辑图像都好快啊
Google Gemini 2.5发布引发AI模型性价比热议· 280 条信息
OpenAI新德里发布会:ChatGPT语音翻译功能引发热议· 655 条信息
#Gemini 2.5
#图像生成
#图像编辑
#快速
#积极
分享
评论 0
0
sitin
2个月前
哪里不对改哪里!全能图像编辑模型Qwen-lmage-Edit来啦 Qwen团队推出全能图像编辑模型Qwen-lmage-Edit。模型基于20B参数的Qwen-lmage模型进一步训练, 具备语义与外观双重编辑能力,支持中英文双语文字精准编辑,可实现原创P创作、视角转换、风格迁移、元素增删改等功能。 不仅能P图换风格,还能直接改图片里的字,而且修得又准又好,旨在让所有人都能轻松成为修图大师。 主要亮点和特性: 1.双重编辑能力: 语义编辑 (High-level):改变图片的整体风格、视角、角色形象(如IP创作),允许整张图片像素变化,但保持核心内容语义一致(例如,把真人变成吉卜力动画风格,或将一个物体旋转180度)。 外观编辑 (Low-level):对图片进行局部、精细的修改,要求图片其他部分完全不变(例如,删除图片里的一根头发丝、给衣服换颜色、添加一个带倒影的路牌)。 2.精准的文字编辑:这是它的一大杀手锏。模型能够直接理解和修改图片中的文字,无论是中文还是英文,并且能尽力保持原有的字体、大小和风格。这对于修改海报、修正错误文字极其有用。 3.强大的性能:文章称,在多项公开测试中,该模型都达到了SOTA(当前最先进)的性能水平,是一个强大的基础模型。 4.链式编辑:文章展示了一个重要应用——可以通过多次、逐步的编辑指令,不断修正图片,直到达到完美效果(例如,逐步修正书法作品中的每一个错别字)。 目的是什么? 降低视觉内容创作(如IP设计、海报修改、照片修复、风格化创作)的技术门槛,让用户能够通过简单的语言指令就能完成复杂的图片编辑任务。
#Qwen-lmage-Edit
#图像编辑
#AI模型
#文字编辑
#SOTA
分享
评论 0
0
WaytoAGI|通往AGI之路
3个月前
Qwen-Image是什么? Qwen-Image是通义千问系列中的最新成员,也是该系列首个图像生成基础模型。它在复杂文本渲染和精确图像编辑方面取 得了显著进展,成为图像生成领域的一颗新星。 亮点功能抢先看
#Qwen-Image
#通义千问
#图像生成
#文本渲染
#图像编辑
分享
评论 0
0
sitin
3个月前
Mistral Al推出升级版Le Chat,全方位对标ChatGPT。 Le Chat新增深度研究模式,可生成结构化研究报告; 语音模式借助新发布的Voxtral模型实现语音输入; 原生多语言推理功能提供更精准回答; 项目管理功能可组织对话内容; 高级图像编辑功能支持复杂图像修改。 卷起来了。
OpenAI新德里发布会:ChatGPT语音翻译功能引发热议· 655 条信息
#Mistral AI
#Le Chat
#ChatGPT
#语音模式
#图像编辑
分享
评论 0
0
EC Elliot
5个月前
字节的多模态模型 - BAGEl - 开源免费 对比优势 • 多模态理解、生成和编辑能力在主流榜单上整体领先,超越 Qwen2.5-VL、InternVL-2.5、SD3 等开源模型 • 图像生成质量高,细节丰富,媲美 SD3 • 图像编辑、风格迁移、自由视觉操作等功能更强 • 支持多轮对话、复杂推理和世界建模,综合能力突出 线上直接体验 官网 Github
#多模态模型
#BAGEl
#字节
#Qwen2.5-VL
#InternVL-2.5
#SD3
#图像生成
#图像编辑
#风格迁移
#自由视觉操作
#多轮对话
#复杂推理
#世界建模
#开源模型
分享
评论 0
0
歸藏(guizang.ai)
5个月前
即梦图片 3.0 的智能参考太猛了,想怎么改图就怎么改
#即梦图片3.0
#智能修改
#AI技术
#图像编辑
分享
评论 0
0
ilovelife
5个月前
#每日推荐 Flux.1 Kontext - 可以实现GPT 4o图像能力 快速在线免费体验新一代多模态图像生成与编辑模型:Flux.1 Kontext;Kontext 同时理解文本与图像输入,能够实现真正的“上下文生成与编辑”。
#多模态图像生成
#图像编辑
#Flux.1 Kontext
#GPT-4
#人工智能
#上下文理解
#免费体验
#新技术推荐
分享
评论 0
0
偶像派作手
7个月前
我的“改成吉卜力风格”
#改成吉卜力风格
#吉卜力
#艺术风格
#图像编辑
分享
评论 0
0
小互
7个月前
OpenAI 发布最新的图像生成模型 直接内置在GPT-4o中 支持进行多轮对话修改编辑图像 📌 精准性提升 可准确渲染文字 精细控制图像结构 支持用户通过对话逐步修改迭代图像内容 📌 上下文理解增强 可记住对话中用户的需求和偏好 比如:用户要求“与上一张保持人物发型相同”,GPT-4o 可自动执行 GPT-4o 的图像生成不仅能提供传统的图像生成,还可以生成更复杂的图像,包括插图、图表、PPT 元素、logo、游戏角色设计等。 对复杂 prompt 的遵循度高,支持 prompt 中描述 10–20 个物体对象及其属性、关系,超越 DALL·E 3 的 ~5–8 个极限 每个物体的属性、关系可被分别控制,图像结构更加精细清晰
#OpenAI
#图像生成
#GPT-4o
#多轮对话
#图像编辑
#精准渲染
#上下文理解
#需求偏好
#复杂图像
#人工智能
分享
评论 0
0
Michael Anti
7个月前
Grok3也开放了图像编辑,我用它和Gemini 2.0的图像编辑做了一个对比,结论是Grok3的不能用,对有人像的照片进行编辑,竟然能让人脸变形。Gemini 2.0有的AI PS图的意思了。
#Grok3
#Gemini 2.0
#图像编辑
#人脸变形
#AI编辑软件
分享
评论 0
0
向阳乔木
7个月前
豆包客户端里的图像编辑厉害,我以为网传段子。 刚截图测试了下还真可以。。。 这个使用场景牛逼!
#豆包
#图像编辑
#网传段子
#使用场景
分享
评论 0
0
个人主页
通知
我的投稿
我的关注
我的拉黑
我的评论
我的点赞