#文生图

歸藏(guizang.ai)

4个月前

Black Forest Labs 发布 FLUX.2，依旧开源！支持文生图、多图参考以及图像编辑，文本生成和提示词遵循能力大幅提高。具体的模型能力有： - 最多同时参考 10 张图片，提供最佳一致性。 - 更丰富的细节、更清晰的纹理和更稳定的光线。 - 复杂排版、信息图、表情包和用户界面的文字渲染 - 在遵循复杂、结构化指令方面得到改进 - 现实世界知识、光照和空间逻辑方面显著更有根据 - 支持高达 4MP 分辨率的图像编辑这次发布了四个模型版本： FLUX.2 [pro]：与最优秀的封闭模型相媲美的最先进图像质量，在提示遵从性和视觉逼真度方面与其他模型相当，同时生成图像更快且成本更低。速度与质量两者兼得。 FLUX.2 [flex]：可控制模型参数，例如步数和引导强度，让开发者对质量、提示遵从性与速度拥有完全控制。该模型在渲染文本和细节方面表现出色。 FLUX.2 [dev]：32B 开放权重模型，源自 FLUX.2 基础模型。当前最强大的开源图像生成与编辑模型，将文本到图像合成与多输入图像的图像编辑结合在单一模型中。 FLUX.2 [klein]（即将推出）：开源，Apache 2.0 许可证模型，从 FLUX.2 基础模型通过蒸馏得到的同尺寸模型。比同等尺寸且从头训练的可比模型更强大且更利于开发者使用。 FLUX.2 - VAE：一种新的变分自编码器，用于潜在表示，在可学习性、质量和压缩率之间提供优化的权衡。

#FLUX.2 #开源 #文生图 #图像编辑 #Black Forest Labs

4个月前

HTML 绘制 PPT 和文生图 PPT 哪个好？目前看还是文生图赢了美学无敌

#文生图 #PPT #美学 #HTML #对比

Jesse Lau 遁一子

4个月前

才发现meta ai也弄了个生成image+video，跟grok的比较一下先文生图，在图变视频 prompt：Cinematic film still of a beautiful young woman from the Tang Dynasty, her expression a mix of quiet sorrow and stoic grace. She wears an intricately embroidered, dark crimson silk hanfu with flowing sleeves, her jet-black hair held up by a delicate, ornate jade and gold hairpin. She stands alone in the vast, empty courtyard of an imperial palace at twilight, a single wisp of hair escaping across her cheek. The atmosphere is heavy and melancholic, with volumetric rays of moonlight breaking through ominous clouds, casting long, dramatic shadows across the polished stone floor. Shot on an Arri Alexa, shallow depth of field, sharp focus on her face, subtle film grain, 8K, hyper-realistic textures.

AI视频井喷：Midjourney领跑，多模态混战· 337 条信息

#meta AI #文生图 #唐朝女子 #宫廷 #悲伤

6个月前

本来对“文生图”完全不感兴趣（国内大部分文生图模型及应用，都在努力生产空洞的感官视频，做 ai 版抖音内容）但是，如果把 sora 2定义为“imagination engine”（想象引擎），作为想象力和创造力的训练、学习和发展，那我就觉得有点意思了。尤其适合小孩子。家里小学生以前对 sora 非常感兴趣，想把自己的脑子故事（有宏大的世界观和百十号人物）做成动画视频。sora 1 的效果太差，没法做这件事。sora 2 看起来可以。但是，sora 2 目前只限美国和加拿大用户。暂时还用不了🤣

AI视频井喷：Midjourney领跑，多模态混战· 337 条信息

#文生图 #Sora 2 #想象力引擎 #儿童 #动画视频

6个月前

懒猫AI算力舱文生图和文生视频的效果 4秒生成一张图，省流进度条：9分50秒开始展示文生图和文生视频

AI视频井喷：Midjourney领跑，多模态混战· 337 条信息

#懒猫AI #算力舱 #文生图 #文生视频 #AI

6个月前

又又又用 nano banana 做了一个开源的捏脸神器：BananaFace 选择永远比填空更适合人类！点点鼠标轻松捏脸/美容，出色的人物一致性保持，呈现大师造型/肖像！ 🍌 BananaFace｜香蕉造型师｜ZHO 2 种模式：文生图、图生图 4 大类 44 项专业参数可选【在线免费/开源直达】⬇️

#BananaFace #捏脸神器 #开源 #文生图 #图生图

6个月前

我现在面临的是在一场已经进入“深水区”的AIGC著作权争论里，再次被追问一个最基本的问题：谁在创作？谁是作者？哪怕北互的“文生图第一案”已经给出了清晰的司法路径，现实中依然争论不休。作为创作者，我需要把自己的创作事实说清楚，也需要请法院延续并适用那套已被证明可操作的标准。在文生图第一案里，法院明确确认了两件事：其一，文生图并非天然排除在著作权之外；其二，只要能体现创作者在提示词—参数—迭代选择中的实质性智力投入，就可以认定作品具备“独创性”。判词写得很具体：创作者“输入提示词、设置参数”，在拿到第一张图后“继续增加提示词、修改参数，不断调整修正”，最终获得定稿；这一过程“体现了审美选择和个性判断”。同时，法院强调生成式模型“并不具有自由意志”，创作“本质上仍是利用工具进行创作”，因此投入智力劳动的人而非模型才是作品作者。在类型上，涉案图像被归入“美术作品”，并再次确认“作者应为自然人”。我的创作过程与文生图第一案同构，并且多出一个关键环节：我在模型训练层面即已投入巨大的独创性劳动。我使用自训练的AWPortrait模型，这本身就是将我多年摄影经验与美学理解转化为数字化规则的过程。从我输入第一个提示词的那一刻起，作品就在一条连续的路径上生长：观察输出、修正语言、微调采样与权重、对比版本、取舍细节……每一步都是我基于审美与经验作出的决定。与第一案相比，我们在文生图的操作路径上一致且多出了使用adetailer的inpainting技术，并为inpainting过程专门设计了针对性的描述词，实现对局部细节的反复修改和精准修补且在模型层投入了额外且更深的创作性劳动。也正因此，我的作品不仅满足第一案认定“独创性”的标准，增加了针对原图的inpainting过程，而且还叠加了“模型训练—风格塑形”的前置创作环节——这应当得到更明确的保护。如果这样线性的创作路径都不能获得保护，将对行业造成极大的负面影响：一、侵权零成本化，他人可以无限制复制、篡改创作者的作品，完全不需承担法律责任；二、原创动力被摧毁，创作者将不再有动力去深耕模型训练和艺术探索，AIGC生态将沦为“速成抄袭”的温床；三、创新空间被压缩，中小创作者将在平台与大厂的资源挤压下彻底失去表达空间，行业审美和技术发展会被全面拉低。法律的本质应是平衡与保护。如果规则的实际效果是让投入最多劳动的一方付出更多维权成本，却让侵权的一方逃避责任，那么这不仅对个人创作者不公，也会让整个行业陷入逆向淘汰。著作权的本意是承认并保护创造性劳动，理应为每一次真实的创作行为划定边界与秩序。基于上述，我的结论很朴素也很明确：本案应当依第一案之标准审理与认定——承认文生图在存在实质性智力投入时的作品地位，确认在创作链条中进行选择与判断的自然人为作者；在此基础上，结合我在模型自训练层面的前置投入，进一步确认我的作者身份与作品独创性。只有沿着这条已被验证的司法路径前进，创作者的劳动才会被看见，行业的创新动力才会被保护。

#AIGC著作权 #文生图 #独创性 #模型训练 #法律保护

6个月前

重新研读文生图第一案，法院在最终判决中写到：这整个过程来看，原告进行了一定的智力投入，比如设计人物的呈现方式、选择提示词、安排提示词的顺序、设置相关的参数、选定哪个图片符合预期等等。涉案图片体现了原告的智力投入，故涉案图片具备了“智力成果”要件。所以是不是法律认可如符合上述条件的aigc生成物即符合了“体现智力投入”的事实。

#文生图 #AIGC #智力投入 #法律认可 #积极

7个月前

谷歌本周公开了两个 AI 新产品，都非常不错。 1、 Imagen 4（图一）：谷歌最新的“文生图”模型，可以免费用，效果很好。 2、Learning About（图二）：谷歌的新型学习平台，使用 AI 生成学习教程。

#谷歌 #AI #文生图 #Imagen 4 #Learning About

7个月前

一个不需要注册就可以使用的AI文生图，图生视频网站。

AI视频井喷：Midjourney领跑，多模态混战· 337 条信息

#AI #文生图 #图生视频 #免费 #在线工具

7个月前

发现Human in the Loop是个很好的概念最近用Seko 发现整个产品设计的理念非常好第一步输入想法，第二步检查策划，第三步生成视频里面每一步都可以人工干预 Agent也能自动生成一整套Agent很适合做短片生成文生图、图生视频、首尾帧、参考生图、对口型等等，都有听说后面还会有局部重绘、一键换脸、音效生成等黑科技上线！

AI视频井喷：Midjourney领跑，多模态混战· 337 条信息

#Human in the loop #Seko产品设计 #短片生成 #agent #文生图

9个月前

一个开源的统一多模态模型 BAGEL，基于图片的聊天对话、编辑、改写、文生图、风格转换、图片变换方向等 AI 能力，说是和 GPT-4o、Gemini 2.0 的能力相当。 🤖

#开源模型 #多模态模型 #BAGEl #AI能力 #GPT-4o #Gemini 2.0 #图片编辑 #文生图

11个月前

Chatbox AI 已支持最新 GPT文生图无需进行应用更新，即可使用。使用步骤： 1. 点击“新图片”； 2. 发送生图需求，等待返回；

#Chatbox AI #文生图 #应用更新 #步骤 #新功能

新浪新闻-第一财经网

1年前

对OpenAI发起直接挑战，DeepSeek“杀入”文生图领域

特朗普称DeepSeek“给美国相关产业敲响了警钟”。在用V3和R1模型横扫硅谷、引爆全球科技圈后，DeepSeek在除..._新浪网

#OpenAI #DeepSeek #文生图 #技术挑战

karminski-牙医

1年前

来了嗷！全网首测！DeepSeek 4 小时之前又发布了一个多模态模型——Janus-pro！这个模型的特点是将文生图和图生文合二为一了！我觉得这个模型更多是方向上的验证，如果验证靠谱就会推出可以投入生产的模型了。 [1/?]

#DeepSeek #Janus-Pro #多模态模型 #文生图 #图生文 #模型验证 #新技术 #人工智能

网易新闻-新京报

1年前

进军文生图 DeepSeek发布多模态模型Janus-Pro

进军文生图 DeepSeek发布多模态模型Janus-Pro,文生,文年生,janus,多模态模型,deepseek

#进军 #文生图 #DeepSeek #多模态模型 #Janus-Pro

新浪新闻-新京报

1年前

进军文生图 DeepSeek发布多模态模型Janus-Pro

新京报贝壳财经讯（记者罗亦丹）北京时间1月28日凌晨，近期爆红的国产大模型DeepSeek在GitHub平台发布了Jan..._新浪网

#文生图 #DeepSeek #多模态模型 #Janus-Pro #人工智能

AI进化论-花生

1年前

下一个目标，试试用Cursor、Windsurf加AI文生图、生视频等工具上架个steam游戏，并且获得100个付费用户😉

#Cursor #windsurf #AI #文生图 #生视频 #Steam游戏 #付费用户