时政
财经
科技
虚拟货币
其他
登录
#图像生成
关注
ilovelife
3天前
Qwen Image出图效果还可以啊
#Qwen Image
#图像生成
#AI模型
#积极
#技术评估
分享
评论 0
0
WaytoAGI|通往AGI之路
1周前
Qwen-Image是什么? Qwen-Image是通义千问系列中的最新成员,也是该系列首个图像生成基础模型。它在复杂文本渲染和精确图像编辑方面取 得了显著进展,成为图像生成领域的一颗新星。 亮点功能抢先看
#Qwen-Image
#通义千问
#图像生成
#文本渲染
#图像编辑
分享
评论 0
0
sitin
1周前
通义千问团队开源了20B参数的文生图模型Qwen-lmage,是通义千问系列一个开源的、具备极强文本渲染与图像编辑能力的图像生成基础模型,适用于广泛创作场景, 核心亮点: • 文字渲染达到业界领先水平,英文效果媲美 GPT-4o,中文表现更是同类最佳 • 原生文字生成技术,文字直接融入像素,无需后期叠加处理 • 支持中英双语,兼容多种字体和复杂版面设计,生成效果清晰、准确、风格一致。 • 支持风格迁移、物体增删改、文字修改、姿态调整等,编辑结果与原图高度一致。 • 支持写实、动漫、极简等多种风格,适用场景广泛。 以后在生成中文字的稳定性和复杂性方面终于有开源可用的方案了!效果比即梦 AI 和 GPT-4o 还强! 阿里巴巴推出 20B 参数的 MMDiT 模型,专门针对带文字的图像生成进行优化,现已完全开源。
#通义千问
#文生图模型
#Qwen-lmage
#开源
#图像生成
分享
评论 0
0
歸藏(guizang.ai)
1周前
通义发布 Qwen-Image 图像生成模型。 擅长图片中的文字生成和海报生成,中英文都可以 试了几张,文字还行,就是这个美学得注意一下,看起来是一个实验性模型 用的前几天测试 Krea 1 模型的提示词,相差有点大
#通义
#Qwen-Image
#图像生成
#文字生成
#海报生成
分享
评论 0
0
蓝点网
1个月前
#ChatGPT 图像生成功能增加预设动漫风格提示词,帮助不会使用提示词的用户轻松生成动漫图像。预设的风格包括赛博朋克、动漫、专业摄影、复古卡通等,只需要选择风格即可看到对应的提示词,该功能向所有用户包括免费版用户提供。查看全文:
OpenAI新德里发布会:ChatGPT语音翻译功能引发热议· 327 条信息
#ChatGPT
#图像生成
#动漫风格
#预设提示词
#免费版
分享
评论 0
0
EC Elliot
2个月前
字节的多模态模型 - BAGEl - 开源免费 对比优势 • 多模态理解、生成和编辑能力在主流榜单上整体领先,超越 Qwen2.5-VL、InternVL-2.5、SD3 等开源模型 • 图像生成质量高,细节丰富,媲美 SD3 • 图像编辑、风格迁移、自由视觉操作等功能更强 • 支持多轮对话、复杂推理和世界建模,综合能力突出 线上直接体验 官网 Github
#多模态模型
#BAGEl
#字节
#Qwen2.5-VL
#InternVL-2.5
#SD3
#图像生成
#图像编辑
#风格迁移
#自由视觉操作
#多轮对话
#复杂推理
#世界建模
#开源模型
分享
评论 0
0
小互
2个月前
Imagen 4 登陆 Gemini 可以在聊天对话中直接通过提示生成图像
#Imagen
#Gemini
#图像生成
#AI
#科技
分享
评论 0
0
Gorden Sun
2个月前
PartCrafter:生成结构化3D模型 输入图片,生成3D模型,基于DiT,特点是生成的3D模型可以拆成小部件。 项目地址:
#3D模型
#图像生成
#人工智能
#DiT技术
#结构化3D
#部件分解
分享
评论 0
0
蓝点网
2个月前
法国 AI 公司 #Mistral 推出 Agents API 接口,内置多种连接器例如 Python 代码执行、图像生成、网络搜索、MCP 等。 Mistral 希望企业和开发者能够利用 API 快速构建相关功能并集成到应用程序中,从而提高企业效率或为用户实现更多高级功能。 查看全文:
#MistralAI
#API接口
#企业效率
#Python
#图像生成
#网络搜索
#MCP
分享
评论 0
0
Steven W.
2个月前
宣布一个好消息,我们 VDraw 小团队完成了一次重大的功能的迭代 —— 增加了AI社媒组图生成功能🚀 这个功能是专门为 小红书 和 Instagram 营销人群打造的,可以一键生成高质量的社媒分享图。 只需登录 VDraw 工作台即可免费使用: 🔰操作步骤: 1⃣ 在工作台中输入想要生成的内容,点击下一步按钮 2⃣调整组图大纲后,进下一步 3⃣ 调整社媒图样式 ✅这一步可以调整社媒图类型(如:纯文本、图片+文本、头像 + 文本等) ✅还可以增加自己喜欢的图片作为配图。 4⃣ 下载组图,分享到 Instagram 或者小红书。 PS. 另外后续的图片编辑 & AI图片模块我们也在开发中了,预计很快就可以和大家见面了😁
#VDraw
#AI
#社交媒体
#功能更新
#小红书
#Instagram
#营销
#图像生成
分享
评论 0
0
Tom Huang
2个月前
这个也太酷了!支持本地部署,字节跳动刚刚宣布发布了一款 7B 的多模态模型⚡️ 支持思维链思考和生成图片,并且支持支持自然语言编辑能力,在开启 CoT 的基础上,性能超越 Gemini-2-exp 的生图能力 开源地址 👉
#字节跳动
#7B多模态模型
#思维链
#图像生成
#CoT
#Gemini-2-exp
#开源
分享
评论 0
0
DynamicWang
2个月前
用Veo3生成的电影感的舞蹈短片,用来测试动作之间的生成连贯性,图像音效完全由veo3生成,相当能打了! A cinematic dance short film generated with Veo3, created to test the coherence of motion transitions. Both the visuals and sound effects are entirely generated by Veo3 — and the results are truly impressive!
#Veo3
#电影感
#舞蹈短片
#动作生成
#连贯性
#图像生成
#音效生成
分享
评论 0
0
挪威小林翠子🐈⬛
3个月前
ChatGPT又改算法了,从追着我,要给我写论文,现在又追着我问,要不要给你画张图?
#ChatGPT
#算法更新
#生成式AI
#图像生成
#人工智能
#AI助手
分享
评论 0
0
喵爸有毒
3个月前
Midjourney发布Omni-reference,完美复现参考图容貌,保持外表统一,不用再折腾换脸了。
#midjourney
#Omni-reference
#换脸
#技术
#图像生成
分享
评论 0
0
向阳乔木
3个月前
豆包灰度中的图像生成真的有点厉害,最多一次生成20张图片。 且可以把上千字的故事丢过去,生成分镜画面。 如果不满意,还能持续对话修改,人物一致性保持的也不错。 写故事推荐Claude3.7 sonnet,用英雄之旅框架。 故事生成简单提示词: “按英雄之旅故事框架,写一个末日世界故事”。 豆包分镜简单提示词: “根据下面的剧情生成分镜头,能体现情节故事,最多20张图” {{故事内容}}
#图像生成
#豆包灰度
#故事写作
#分镜画面
分享
评论 0
0
小互
3个月前
📢好消息,好消息! GPT 4o的图像生成能力现在可以在GPTs中使用了 这意味着你可以通过GPTs构建各种图像生成机器人了! 比如构建一个专门生成海报的机器人或者专门生成某种风格的机器人! 总之方便很多,你的机器人也可以给被人使用!
#GPT4o
#图像生成
#机器人
#生成海报
#AI技术
分享
评论 0
0
宝玉
3个月前
让 AI 用不同风格重画清明上河图 工具:GPT-4o 提示词:用【XXX风格】生成《清明上河图》中的局部图像 可以试试下面这些风格(不限于): - 3D Q版风格 - 3D风格 - 3D微缩风格 - 写实风格 - 迪斯尼动画风格 - 皮克斯动画风格 - 吉卜力工作室风格
#AI艺术
#清明上河图
#风格转换
#图像生成
分享
评论 0
0
勃勃OC
4个月前
OpenAI 正在开发一个新的社交媒体平台,旨在与现有的网络(如 X)展开竞争,重点在于整合 AI 功能,尤其是通过 ChatGPT 实现的图像生成。 该平台不仅旨在提供一个全新的社交互动空间,还计划作为训练 AI 模型的实时数据来源。 该项目目前仍处于早期阶段,已在网络上引发了各种反应,有人认为这是社交媒体领域的一项潜在创新,也有人质疑是否有必要再增加一个新的平台。
#OpenAI
#社交媒体
#AI整合
#ChatGPT
#图像生成
#实时数据
#创新
#平台竞争
分享
评论 0
0
宝玉
4个月前
传一张个人照片,写一句简单提示词:Turn me into a doll 看得到什么
#个人照片
#提示词
#AI
#图像生成
分享
评论 0
0
宝玉
4个月前
请问怎么用 AI 画这样的图呢?
#AI
#图像生成
#绘图工具
分享
评论 0
0
歸藏(guizang.ai)
4个月前
拿即梦3.0用提示词做出这两张图之后我彻底麻了 我一直不愿意说 AI 取代什么职业这种话 但是就这两张图的质量,你把我按在这里三天用传统方法我做不出来
#AI
#AI取代
#即梦3.0
#图像生成
#传统方法
分享
评论 0
0
orange.ai
4个月前
最近AI群里出现最多的图
#AI
#图像生成
#热点
#深度学习
#机器学习
#大模型
分享
评论 0
0
宝玉
4个月前
GPT-4o 的新的图像模型生成原理:自回归模型究竟是什么?为什么它如此惊艳? 你可能听说过OpenAI最新发布的GPT-4o能够流畅生成高质量图片,但与过去大热的Midjourney、DALL·E、Stable Diffusion这些“扩散模型(Diffusion Models)”不同,GPT-4o的图像生成采用了一种看起来简单却充满魔力的方式:自回归模型(autoregressive model)。 那么,自回归到底是什么意思?GPT-4o又如何做到逐像素、逐区域地生成清晰图片? 什么是自回归图像生成? 我们先从“自回归”这个词开始拆解: • “自”(Auto) 意味着自动,模型不需要额外干预; • “回归”(Regressive) 意味着模型会根据之前已经生成的信息去预测后续的信息。 打个简单比方: 你正在手绘一幅画,你不会一下子就画出完整的画面,而是会从一小块区域逐渐向外扩展,每一笔都是基于之前你所画的内容来决定下一笔的走向。 自回归模型的核心思想与这个绘画过程类似。具体到GPT-4o,就是: • 模型从顶部开始,依次往下逐行生成画面; • 在每一步,模型参考之前已生成的像素信息,预测下一个像素(或像素组)的内容; • 如此不断循环,逐步描绘出完整图像。 这与扩散模型完全不同,扩散模型就像是先把纸上泼满了颜料(噪声),再一步一步地擦去不需要的部分,直到剩下一幅清晰的画。 为什么要用自回归而非扩散? 扩散模型虽然出色,但有明显缺点: • 一开始全是噪点,无法在初期看到图像的任何轮廓。 • 在生成过程中很难逐步“引导”,更多的是一次性成像。 • 难以在过程中进行细致的修改与编辑。 而GPT-4o自回归的生成方式有两个明显优势: 1. 更强的连贯性(Coherence) 由于每一步生成时都会参考之前生成的内容,GPT-4o对图像的连贯性控制更精细。就像我们写文章时先列个提纲,再逐段写下来,每句话都与上文紧密相连,自然更加流畅。 举个生活化的例子: 假如你请AI画一只猫,如果用扩散模型,它可能一开始呈现的只是模糊的一团,猫咪的形态在很后期才逐渐明朗;但GPT-4o则会在最开始就勾勒出猫咪的大致轮廓,然后再慢慢细化每个细节,比如眼睛、耳朵、毛发,这种方式让生成过程更“人性化”。 2. 更精准的编辑能力 自回归的另一个巨大优势是可以精准地实现局部修改。因为图像是按顺序生成,用户可以随时介入修改局部的部分,AI随后生成的区域都会根据这个修改的内容自动适应。 比如: 假设AI正从上到下生成一张风景画,你在画到中途突然想让天空中多一些云彩,你只需要在生成天空的阶段做出指示,AI就可以在下一步中立即调整,生成符合你期望的云朵形状,而不必重新从头生成整幅图像。 从实际的生成过程看GPT-4o (图3,来源:Peter Gostev) 透过ChatGPT的网页端,我们可以用浏览器自带的开发者工具,观察到一些很有趣的细节: • 从上到下逐行生成 GPT-4o生成图像的过程就像绘画时从顶部开始逐渐填充内容。 • 初始轮廓迅速显现,随后逐步精细化 这类似于画家先快速勾勒出构图的大致轮廓,随后逐渐增加细节。 • 局部已生成的区域可能会被反复调整 即使局部区域已经生成,后续的生成过程依旧可能对这些区域作出较大调整,这表明模型有明显的全局连贯性优化策略——就像作家写完一段话后,也可能反复修改前面的文字,以使全文更加流畅。 • 生成简单图像明显更快 如果你只是要求生成一颗简单的苹果,模型几乎瞬间就能呈现;但如果你希望生成一幅复杂场景(如喧嚣的城市街景),过程会明显更久,中途还会显示多个“中间图像”,说明GPT-4o内部可能还利用了一种称为“投机解码”(speculative decoding)的技术,提前预测多个步骤的结果并进行修正,从而提升效率。 • 额外的背景移除机制 GPT-4o似乎具备某种外部背景去除能力:最初它会显示“伪透明”的方格背景,而真正的背景移除在生成结束后才完成,这个步骤明显是模型外部追加的后处理程序,而非GPT-4o本身固有的特性。 技术难点与实现的奇迹 OpenAI成功实现这种模型的最大难度,是如何在自回归生成方式中兼顾生成质量和速度。自回归模型通常要求庞大的参数量和计算资源来保持图像质量,而GPT-4o竟然做到既快速又高质,让不少业内人士感叹: “GPT-4o竟然用自回归方式做出了扩散模型一样甚至更好的效果,实在令人难以置信。” 这一实现,背后必然包含了极其高效的模型设计和优化算法。 对于普通人,这意味着什么? GPT-4o的成功代表着AI图像生成技术迈入了一个全新的阶段: • 我们可以更轻松地进行交互式设计,让AI快速而精准地生成想要的内容; • 它将使图片编辑变得更加直观,就像与AI一起逐步绘画,随心所欲地调整每个细节; • 甚至可能引领未来的视觉创意领域,让创作者不再拘泥于一次性的图片生成,而是享受随时交互、随时调整的自由创作。 最终,这种技术的突破既是计算机科学的成就,也是在提示我们: “技术真正的进步,并非为了替代人类,而是为了给每个人手中都放上更好的‘画笔’,以更自由的方式描绘属于自己的世界。” 或许 GPT-4o 告诉我们的,不只是AI能够做到什么,而是我们真正想要如何运用它。
#GPT-4o
#自回归模型
#图像生成
#OpenAI
#扩散模型
分享
评论 0
0
indigo
4个月前
GPT-4o 的图像生成 最有趣的就是能像变魔法一样 实现图像风格任意混合与复制的自由✨
#GPT-4o
#图像生成
#图像风格
#魔法
#图像混合
#人工智能
#视觉效果
分享
评论 0
0
变态辣椒RebelPepper
4个月前
找ChatGPT在没有参考图的情况下,仅用文字生图,探讨了独裁者和冠状病毒结合的图像。最后我上传了我的漫画,ChatGPT表示甘拜下风,但是我得承认,对于要求不高的普通人来说,他们会对结果非常满意,如果ChatGPT对习近平解禁,可以随意输出辱包的图形,或者如果能通过转换风格和替换人脸的方式绕过审查输出类似我漫画造型的辱包图,那么还真是对我的创作造成了一定的威胁😅
#ChatGPT
#独裁者
#冠状病毒
#漫画
#图像生成
#习近平
#审查制度
#人工智能艺术
分享
评论 0
0
个人主页
通知
我的投稿
我的关注
我的拉黑
我的评论
我的点赞