howie.serious

howie.serious

0 关注者

15小时前

为什么 nano banana pro 的文字渲染和指令跟随,有如此大的进步? 以配图为例,分别是大量汉字的 PPT 和知识漫画,这种级别的文字生成,背后的 why,是真正有趣的地方。 === 对于扩散模型(diffusion model),生成图片的本质是去噪(denoising)。模型学习的是图像在潜空间(latent space)里的概率分布,通过预测逐渐减去噪声,逐步让图像“显形”,