Gorden Sun

Gorden Sun

0 关注者

7个月前

还是多模态的模型好,GPT-4o可以同时兼顾绘画和语义。

#多模态模型 #GPT-4o #绘画 #语义能力

相关新闻

placeholder

howie.serious

4周前

为什么 nano banana pro 的文字渲染和指令跟随,有如此大的进步? 以配图为例,分别是大量汉字的 PPT 和知识漫画,这种级别的文字生成,背后的 why,是真正有趣的地方。 === 对于扩散模型(diffusion model),生成图片的本质是去噪(denoising)。模型学习的是图像在潜空间(latent space)里的概率分布,通过预测逐渐减去噪声,逐步让图像“显形”,

placeholder

Andy Stewart

4周前

女儿画完画,回家了 😘

placeholder

-Zho-

1个月前

在 8 个月后,Nano Banana Pro 终于也能像当初 GPT-4o 一样玩转各种可爱风格了! Nano Banana Pro = 可爱 3D emoji! 🛁🛁🛁 ZHNO|创意系列|Nano Banana Pro 【Prompt】⬇️

placeholder

小弟调调

1个月前

真是意外,都画了半个小时了

placeholder

我真的没有拼多多

1个月前

下班后,用v0两小时不到快速糊了一款表情识别器demo 百度最近新开源了一个多模态的模型,我测试了一下它的图像识别能力,非常强大,甚至对于面部表情都能很好的识别。 基于此模型,开发了一个表情识别特效网站,看看你能做出多少种表情来吧,欢迎大家试玩! 网址在评论区第一条 (使用的具体模型:ERNIE 4.5-VL-28B-A3B-Thinking)

© 2025 news.news. All rights reserved. 0.04637 秒. v1.0.46
我的评论