时政
财经
科技
虚拟货币
其他
登录
#图像生成
关注
AI Will
2天前
Sora 2来了!
#Sora 2
#人工智能
#科技
#创新
#图像生成
分享
评论 0
0
𝔽𝕣𝕠𝕤𝕥 𝕄𝕚𝕟𝕘
3天前
挺准的,等会,我也没放我头像啊,这画的头像着实不错。 From YouMind
#头像
#YouMind
#绘画
#AI
#图像生成
分享
评论 0
0
ruanyf
1周前
上个月,谷歌发布了 Nano Banana,自称“最先进的图像生成和编辑模型”。 我试用后,感觉确实很强,而且免费使用。 网友发现了这个模型的各种神奇用法,有人甚至收集成了一个 Awesome 仓库。 我从这个仓库里面,挑了几个很实用的例子,分享给大家。
#谷歌
#nano banana
#图像生成
#免费
#Awesome 仓库
分享
评论 0
0
向阳乔木
2周前
Nano Banana厉害之处和潜在问题 速度:平均生成时间2-4秒 ,比如部分基准测试生成一张1024px仅2.3秒。 一致性:多次编辑,角色准确率高达95% 竞争表现:LMArena盲测,胜率达到70%,GenEval分数为0.89。 优于Flux Kontext(45%胜率)和DALL-E 3(0.76 GenEval) 效率:用先进的Token压缩技术,将图像数据压缩至约1300个,这是低价(0.04美元一张)高速的原因。 文本渲染:在图像正确渲染文本,行业领先。 提示词保真与编辑: 多步骤提示词表现卓越,能对现有图像编辑且无需遮罩 。场景完整性、光照和构图等异常出色。 ## 潜在问题 可靠性问题:模型有时会无法执行Prompt,而直接返回原图,某些情况下失败率接近50% 。 伪影与质量下降:模型有时会引入一层“轻微的模糊层”,降低图像的清晰度 。 AI生成的常见问题也都有:手部变形等。 尤其当主体物不处于中心位置或背景复杂时,图像质量可能会下降 。 特定弱点:尽管整体真实感出色,但处理精细面部特征时,与Qwen等竞对比,稍显逊色 。
#nano banana
#图像生成
#AI模型
#潜在问题
#速度快
分享
评论 0
0
Gorden Sun
3周前
SPRO:扩散模型优化 腾讯混元开源的训练方法。能优化扩散模型生成图片的质量和偏好。优点是计算量小、训练速度快、没有过拟合的问题。 项目地址: Github:
#SPRO
#扩散模型
#腾讯混元
#开源
#图像生成
分享
评论 0
0
nicekate
3周前
即梦 4.0 连续生图功能也太好用了吧 提示词最后---生成5张图片,而不是1张图片
AI视频井喷:Midjourney领跑,多模态混战· 207 条信息
#即梦4.0
#连续生图
#AI
#图像生成
#积极
分享
评论 0
0
向阳乔木
3周前
字节新的文生图模型太强了! 复制任意内容,不超过800字就行。 发给即梦或豆包,选图片4.0模型。 提示词很简单,只需要加中横线分割,输入: “用美漫风格生成” “用火柴人风格生成” “用旧报纸风格生成” “用四格漫画风格生成”
#字节
#文生图模型
#AI
#美漫风格
#图像生成
分享
评论 0
0
Geek
3周前
《Nano-banana 精选图片库》 收集了 Nano-banana 在各个任务场景下生成的令人惊艳的图片和提示词,全方位展示 Google 在图像生成与编辑的无限可能
#nano-banana
#图像生成
#Google
#图片库
#任务场景
分享
评论 0
0
虎小象
3周前
你只需上传「服装穿搭图」,模型就会自动把它延展成类似 DHL 插画那样的完整插画。 我用了 Sora 和🍌分别生成 喜欢咸的选咸的,喜欢盐的选盐的。 提示词:ALT
#服装穿搭
#DHL插画
#Sora
#香蕉
#图像生成
分享
评论 0
0
sitin
4周前
Ideogram 推出了名为“Ideogram Styles”的新功能,旨在通过风格化处理,将简单的用户提示词转化为具有高级、一致美学的图像,并特别优化了文字渲染能力,提供了一个由官方精心策划的预设风格库,用户可以直接选用。 核心功能要点 1.风格转化:核心功能是将基础、简单的文本提示(Prompt)自动转化为具有特定高级审美风格的图像。 2.文字渲染强化:该功能显著提升了图像中文字(如标语、字体设计)的生成质量和准确性,使其能轻松融入不同风格中,方便用户进行创意字体和T恤等设计。 3.自定义风格:用户不仅可以选用官方预设风格,还能上传最多3张参考图片来创建并保存属于自己的、可重复使用的自定义风格。 与 Describe、Remix、Color Palette 等功能配合,帮助用户在美学与精准度之间找到平衡。整体而言,这一功能旨在让创作者为作品注入独特个性与一致美学,提升设计的表现力与识别度。
#Ideogram Styles
#风格转化
#文字渲染强化
#自定义风格
#图像生成
分享
评论 0
0
Google Japan
4周前
「自分の写真が、フィギュアに!?✨」 Gemini に写真をアップして、リアルなフィギュアの画像を生成しよう! やり方はリプライから⬇️
#Gemini
#照片
#玩偶
#图像生成
#新奇
分享
评论 0
0
池建强
1个月前
nano banana 的生图质量在迅速提升,上周比 GPT 还差很多,这周已经很难分辨了。
#nano banana
#生图质量提升
#GPT
#AI技术
#图像生成
分享
评论 0
0
sitin
1个月前
USO(Unified Style-Subject Optimized 模型) 是字节跳动提出的一个统一图像生成模型, 融合了风格驱动生成与主体驱动生成两个任务,并通过创新的训练机制将它们整合在一个统一框架中,解决了二者长期以来分离、互相影响的问题。 性能优势 在 USO-Bench 和 DreamBench 评测中全面领先: 主体一致性(CLIP-I, DINO)优于主流模型; 风格相似性(CSD)显著超过 DEADiff、StyleStudio 等; 图文匹配度(CLIP-T)保持高水平。 关键技术 三元组训练数据(Triplets) 使用(内容图 + 风格图 + 结果图)作为训练样本,让模型学会分离风格与主体特征并融合。 风格对齐训练(Style Alignment) 采用视觉语言模型 SigLIP 提取高层次风格特征(如笔触、材质),并通过分层投影注入生成过程。 风格奖励学习(Style Reward Learning, SRL) 引入奖励机制,用预训练模型评估生成图像与目标风格的相似度,强化风格还原能力。 功能 主体驱动生成 保留主体(如人物、宠物)特征,生成新背景或姿态。 风格驱动生成 仅凭风格参考图+文本生成对应风格的图像。 风格+主体联合生成 同时输入风格图和内容图,生成既保真又风格化的图像。 多风格融合生成 支持多张风格图混合生成(如油画+水彩)。 布局保持生成 仅改变风格,不改变原图布局与主体结构。
#USO模型
#图像生成
#风格驱动
#主体驱动
#字节跳动
分享
评论 0
0
Justin3go
1个月前
其实根本不需要什么提示词,看到喜欢的结果图,然后叫Nano Banana仿一下即可
#nano banana
#结果图
#模仿
#AI
#图像生成
分享
评论 0
0
nicekate
1个月前
不需要专门的 AI 图片应用,Roo Code + Nano Banana 能满足你的大部分生图、修图需求 Roo Code 里新增的图像功能非常好用,我用免费的 Grok Code Fast 1 模型调用 Nano Banana 模型生成图片,特别适合角色一致性创作,如果用 GPT 5、Claude 4,提示效果会更好 比调用 Replicate MCP 生成图片更方便(后者优势是模型多)
#AI图片
#Roo Code
#nano banana
#图像生成
#角色一致性
分享
评论 0
0
穆尼
1个月前
今天又练习了许多姿势,会有抽卡现象,符合预期,用(朋友)随便拍的一张自拍照,可以生成任何你想要的场景图片,人物一致性要再优化优化会更好。 #NanobananaAI Prompt1:照片中的人物转化为商业人像,维持脸部长相以及发型,专业摄影 Prompt2:左边的人像穿戴右边的衣服和配件,维持脸部长相以及发型,专业摄影
AI视频井喷:Midjourney领跑,多模态混战· 207 条信息
#AI
#图像生成
#人物一致性
#商业人像
#NanobananaAI
分享
评论 0
0
orange.ai
1个月前
谷歌的 Nano Banana 小香蕉上线以来,立即成为地表最强 P 图模型,大家都彻底玩疯了。 今天出差回来,我也终于有时间玩一下 Nano Banana 了,玩了俩小时,全程被震撼,最后把笔记丢到 Lovart 里让它调用 Nano Banana 生成了这个长图。 一次性生成,一字未改,太TM强了。
#nano banana
#P 图模型
#AI
#图像生成
#积极
分享
评论 0
0
-Zho-
1个月前
🍌你这!!!妈的,这效果还要什么渲染,这材质和光影质感…… ZH25O|创意系列|Gemini 2.5 Flash Image Creation 设计师狂喜!!! nano-banana 用作设计快速验证/效果图太方便了,主要是这质感和真实感太好了! 图是用 Figma 花 2min 画的,渲染是🍌 1min 出的 【Prompt】⬇️
#Gemini 2.5
#图像生成
#材质质感
#设计工具
#快速渲染
分享
评论 0
0
sitin
1个月前
Google 推出 Gemini 2.5 Flash Image 模型,主打原生图像生成与编辑功能,官方称其技术为"state-of-the-art"并排名全球第一,向所有用户免费开放,支持通过 Gemini App 和 Google AI Studio 访问。 核心功能特性 支持上传3张图片并融合创意元素 人像风格转换保持主体特征(如自拍优化) 文本添加、背景替换与主体修改 生成内容需遵守Google内容政策,禁止侵权使用 图像处理的技术优势 高效架构:尽管模型体积更小,但它采用了与 Gemini 2.5 Pro 相同的突破性 混合专家(Mixture-of-Experts, MoE) 架构。 这意味着它只针对特定任务激活神经网络中最相关的部分,使得图像处理速度极快、效率极高。 超长上下文窗口:它支持实验性的 100万token 上下文窗口。虽然单张图片用不到这么多,但这允许您在单个提示中处理数十张图片或长视频,并对整个集合进行提问和分析。 访问方式与配置 Gemini App:选择"2.5 Flash"模型(标注"Fast all-around help") Google AI Studio:选择"Gemini Native Image"功能模块,需科学上网环境,当前因用户量大存在卡顿现象 使用限制 风格转换功能稳定性不足,部分效果需多次尝试 高峰期访问存在服务器拥堵问题 所有生成内容需遵守Google安全政策与版权规定
Google Gemini 2.5发布引发AI模型性价比热议· 204 条信息
OpenAI新德里发布会:ChatGPT语音翻译功能引发热议· 525 条信息
#Google
#Gemini 2.5 Flash Image
#图像生成
#免费开放
#AI Studio
分享
评论 0
0
Gorden Sun
1个月前
PixVerse发布PixVerse V5 动作更自然、画面更清晰、一致性更好。 8月28号到9月1号,完全免费使用。 官网:
AI视频井喷:Midjourney领跑,多模态混战· 207 条信息
#PixVerse V5
#AI模型
#免费使用
#图像生成
#技术更新
分享
评论 0
0
三秋十李 Sergio
1个月前
利好穿搭博主,做这种图基本上不需要拍摄了!
AI视频井喷:Midjourney领跑,多模态混战· 207 条信息
#穿搭博主
#AI
#图像生成
#效率提升
分享
评论 0
0
sitin
1个月前
今天试了 Google 最新的图像生成功能——“Nano-Banana”(又名 Gemini 2.5 Flash Image)。 能把一张普通照片做出很细腻的多步编辑,细节挺惊艳的,干掉PS 的存在。 我刚刚看 replicate 已经有这个模型 api 了,大家可以去接入用到自己的网站去。 访问方式与配置 Gemini App:选择"2.5 Flash"模型(标注"Fast all-around help") Google AI Studio:选择"Gemini Native Image"功能模块,当前因用户量大存在卡顿现象 一些局限性 风格转换功能稳定性不足,部分效果需多次尝试 高峰期访问存在服务器拥堵问题
Google Gemini 2.5发布引发AI模型性价比热议· 204 条信息
OpenAI新德里发布会:ChatGPT语音翻译功能引发热议· 525 条信息
#Google
#Gemini 2.5 Flash Image
#图像生成
#AI Studio
#卡顿
分享
评论 0
0
𝙩𝙮≃𝙛{𝕩}^A𝕀²·ℙarad𝕚g𝕞
1个月前
如果说LLM的元认知和文本生成能力把需要我们的思考解决的NP类问题,变成了P类问题,让我们变成了一个验证者; 那精确的图像生成和视频生成则同样会替代了我们的想象,我们天马行空的空间想象与创造,意味着什么?
AI视频井喷:Midjourney领跑,多模态混战· 207 条信息
#LLM
#元认知
#文本生成
#图像生成
#视频生成
分享
评论 0
0
Geek
1个月前
Gemini 2.5 Flash Image 生成图像和编辑图像都好快啊
Google Gemini 2.5发布引发AI模型性价比热议· 204 条信息
OpenAI新德里发布会:ChatGPT语音翻译功能引发热议· 525 条信息
#Gemini 2.5
#图像生成
#图像编辑
#快速
#积极
分享
评论 0
0
nicekate
1个月前
gemini-2.5-flash-image-preview (也就是香蕉模型) 比 gemini-2.0-flash-image 生成效果好太多了 图1 新模型,图2 旧模型 不过中文渲染还得看 Qwen Image 提示词: 巨型石窟中竖立一块被光纤勾勒的透明碑石,古老经文以激光刻在其上;风格: 东方石窟+高科技装置艺术;光影: 冷蓝体积光+碑内透光;镜头: 70mm中长焦,庄严对称;构图: 中轴对称,参观者为尺度参照;色调: 石灰灰、电子蓝、微金;材质: 岩壁粗糙、玻璃体、光纤;文字要求: 碑文清晰:‘无常即常|光可照心’(竖排)
Google Gemini 2.5发布引发AI模型性价比热议· 204 条信息
OpenAI新德里发布会:ChatGPT语音翻译功能引发热议· 525 条信息
#Gemini-2.5-flash-image
#图像生成
#Qwen Image
#中文渲染
#高科技装置艺术
分享
评论 0
0
个人主页
通知
我的投稿
我的关注
我的拉黑
我的评论
我的点赞