时政
财经
科技
虚拟货币
其他
登录
#图像编辑
关注
小互
6天前
Google 相册现在可以通过文字或语音直接编辑图像 点击图像可以直接调用Banana对照片进行编辑 拥有自有模型和应用、硬件的优势凸显出来了 Google正在将模型能力整合到自己的各种产品应用和硬件中,让模型能快速的得到广泛的使用,探索各种可能性 这对苹果来说有着很大的压力,苹果封闭的策略是不是要改变了。
#Google 相册
#图像编辑
#模型整合
#苹果压力
#开放生态
分享
评论 0
0
ilovelife
1个月前
#每日推荐 免费在线体验Google最强AI图片模型 网址: Edit images 10x faster with text prompts. Nano Banana AI keeps perfect character consistency, 3-second generation. Free unlimited access, no signup.
#AI图片模型
#Google
#免费在线体验
#图像编辑
#Nano Banana AI
分享
评论 0
0
-Zho-
1个月前
nano-banana 大展宏图!开个我的图像编辑测试大合集贴! 目的: ✅探索模型能力边界 ✅模型各有所长,方便大家根据细分场景找到最合适自己的模型 ✅方便整活/灵感 参与对比模型(当前版本四强/各有所长): 1️⃣nano-banana(Gemini2.5FlashImg 2️⃣GPT-Img 3️⃣Flux-Kontext-Pro 4️⃣Qwen-Img-Edit 1/n
Google Gemini 2.5发布引发AI模型性价比热议· 201 条信息
OpenAI新德里发布会:ChatGPT语音翻译功能引发热议· 519 条信息
#nano-banana
#图像编辑
#模型对比
#Gemini2.5FlashImg
#Qwen-Img-Edit
分享
评论 0
0
Geek
1个月前
Gemini 2.5 Flash Image 生成图像和编辑图像都好快啊
Google Gemini 2.5发布引发AI模型性价比热议· 201 条信息
OpenAI新德里发布会:ChatGPT语音翻译功能引发热议· 519 条信息
#Gemini 2.5
#图像生成
#图像编辑
#快速
#积极
分享
评论 0
0
sitin
1个月前
哪里不对改哪里!全能图像编辑模型Qwen-lmage-Edit来啦 Qwen团队推出全能图像编辑模型Qwen-lmage-Edit。模型基于20B参数的Qwen-lmage模型进一步训练, 具备语义与外观双重编辑能力,支持中英文双语文字精准编辑,可实现原创P创作、视角转换、风格迁移、元素增删改等功能。 不仅能P图换风格,还能直接改图片里的字,而且修得又准又好,旨在让所有人都能轻松成为修图大师。 主要亮点和特性: 1.双重编辑能力: 语义编辑 (High-level):改变图片的整体风格、视角、角色形象(如IP创作),允许整张图片像素变化,但保持核心内容语义一致(例如,把真人变成吉卜力动画风格,或将一个物体旋转180度)。 外观编辑 (Low-level):对图片进行局部、精细的修改,要求图片其他部分完全不变(例如,删除图片里的一根头发丝、给衣服换颜色、添加一个带倒影的路牌)。 2.精准的文字编辑:这是它的一大杀手锏。模型能够直接理解和修改图片中的文字,无论是中文还是英文,并且能尽力保持原有的字体、大小和风格。这对于修改海报、修正错误文字极其有用。 3.强大的性能:文章称,在多项公开测试中,该模型都达到了SOTA(当前最先进)的性能水平,是一个强大的基础模型。 4.链式编辑:文章展示了一个重要应用——可以通过多次、逐步的编辑指令,不断修正图片,直到达到完美效果(例如,逐步修正书法作品中的每一个错别字)。 目的是什么? 降低视觉内容创作(如IP设计、海报修改、照片修复、风格化创作)的技术门槛,让用户能够通过简单的语言指令就能完成复杂的图片编辑任务。
#Qwen-lmage-Edit
#图像编辑
#AI模型
#文字编辑
#SOTA
分享
评论 0
0
WaytoAGI|通往AGI之路
1个月前
Qwen-Image是什么? Qwen-Image是通义千问系列中的最新成员,也是该系列首个图像生成基础模型。它在复杂文本渲染和精确图像编辑方面取 得了显著进展,成为图像生成领域的一颗新星。 亮点功能抢先看
#Qwen-Image
#通义千问
#图像生成
#文本渲染
#图像编辑
分享
评论 0
0
sitin
2个月前
Mistral Al推出升级版Le Chat,全方位对标ChatGPT。 Le Chat新增深度研究模式,可生成结构化研究报告; 语音模式借助新发布的Voxtral模型实现语音输入; 原生多语言推理功能提供更精准回答; 项目管理功能可组织对话内容; 高级图像编辑功能支持复杂图像修改。 卷起来了。
OpenAI新德里发布会:ChatGPT语音翻译功能引发热议· 519 条信息
#Mistral AI
#Le Chat
#ChatGPT
#语音模式
#图像编辑
分享
评论 0
0
EC Elliot
3个月前
字节的多模态模型 - BAGEl - 开源免费 对比优势 • 多模态理解、生成和编辑能力在主流榜单上整体领先,超越 Qwen2.5-VL、InternVL-2.5、SD3 等开源模型 • 图像生成质量高,细节丰富,媲美 SD3 • 图像编辑、风格迁移、自由视觉操作等功能更强 • 支持多轮对话、复杂推理和世界建模,综合能力突出 线上直接体验 官网 Github
#多模态模型
#BAGEl
#字节
#Qwen2.5-VL
#InternVL-2.5
#SD3
#图像生成
#图像编辑
#风格迁移
#自由视觉操作
#多轮对话
#复杂推理
#世界建模
#开源模型
分享
评论 0
0
歸藏(guizang.ai)
3个月前
即梦图片 3.0 的智能参考太猛了,想怎么改图就怎么改
#即梦图片3.0
#智能修改
#AI技术
#图像编辑
分享
评论 0
0
ilovelife
4个月前
#每日推荐 Flux.1 Kontext - 可以实现GPT 4o图像能力 快速在线免费体验新一代多模态图像生成与编辑模型:Flux.1 Kontext;Kontext 同时理解文本与图像输入,能够实现真正的“上下文生成与编辑”。
#多模态图像生成
#图像编辑
#Flux.1 Kontext
#GPT-4
#人工智能
#上下文理解
#免费体验
#新技术推荐
分享
评论 0
0
偶像派作手
6个月前
我的“改成吉卜力风格”
#改成吉卜力风格
#吉卜力
#艺术风格
#图像编辑
分享
评论 0
0
小互
6个月前
OpenAI 发布最新的图像生成模型 直接内置在GPT-4o中 支持进行多轮对话修改编辑图像 📌 精准性提升 可准确渲染文字 精细控制图像结构 支持用户通过对话逐步修改迭代图像内容 📌 上下文理解增强 可记住对话中用户的需求和偏好 比如:用户要求“与上一张保持人物发型相同”,GPT-4o 可自动执行 GPT-4o 的图像生成不仅能提供传统的图像生成,还可以生成更复杂的图像,包括插图、图表、PPT 元素、logo、游戏角色设计等。 对复杂 prompt 的遵循度高,支持 prompt 中描述 10–20 个物体对象及其属性、关系,超越 DALL·E 3 的 ~5–8 个极限 每个物体的属性、关系可被分别控制,图像结构更加精细清晰
#OpenAI
#图像生成
#GPT-4o
#多轮对话
#图像编辑
#精准渲染
#上下文理解
#需求偏好
#复杂图像
#人工智能
分享
评论 0
0
Michael Anti
6个月前
Grok3也开放了图像编辑,我用它和Gemini 2.0的图像编辑做了一个对比,结论是Grok3的不能用,对有人像的照片进行编辑,竟然能让人脸变形。Gemini 2.0有的AI PS图的意思了。
#Grok3
#Gemini 2.0
#图像编辑
#人脸变形
#AI编辑软件
分享
评论 0
0
向阳乔木
6个月前
豆包客户端里的图像编辑厉害,我以为网传段子。 刚截图测试了下还真可以。。。 这个使用场景牛逼!
#豆包
#图像编辑
#网传段子
#使用场景
分享
评论 0
0
个人主页
通知
我的投稿
我的关注
我的拉黑
我的评论
我的点赞