Gorden Sun
0 关注者
howie.serious
4周前
为什么 nano banana pro 的文字渲染和指令跟随,有如此大的进步? 以配图为例,分别是大量汉字的 PPT 和知识漫画,这种级别的文字生成,背后的 why,是真正有趣的地方。 === 对于扩散模型(diffusion model),生成图片的本质是去噪(denoising)。模型学习的是图像在潜空间(latent space)里的概率分布,通过预测逐渐减去噪声,逐步让图像“显形”,
Andy Stewart
女儿画完画,回家了 😘
-Zho-
1个月前
在 8 个月后,Nano Banana Pro 终于也能像当初 GPT-4o 一样玩转各种可爱风格了! Nano Banana Pro = 可爱 3D emoji! 🛁🛁🛁 ZHNO|创意系列|Nano Banana Pro 【Prompt】⬇️
小弟调调
真是意外,都画了半个小时了
我真的没有拼多多
下班后,用v0两小时不到快速糊了一款表情识别器demo 百度最近新开源了一个多模态的模型,我测试了一下它的图像识别能力,非常强大,甚至对于面部表情都能很好的识别。 基于此模型,开发了一个表情识别特效网站,看看你能做出多少种表情来吧,欢迎大家试玩! 网址在评论区第一条 (使用的具体模型:ERNIE 4.5-VL-28B-A3B-Thinking)