Jixian Wang

Jixian Wang

0 关注者

2周前

最近看了很多的图像相关模型的源代码和架构,其实这一代模型的架构都是类似DiT (Transformer+Diffusion) 架构,架构上整体比上一代的Unet+Diffusion 有明确又是,但是同一代模型大家关注的输出画质和细节,更多就在于有标注的训练集了, 我最近的时间精力也都是花在这方面。 也这套“低熵”的训练集,基本上是同一代模型都会有不错的训练微调效果。

热门新闻