OmniConsistency:DiT绘画模型通用插件 适用于Flux等DiT绘画模型,能在保持主体一致性的同时,实现风格泛化,且与现有的LoRA兼容。效果非常好,风格化接近GPT-4o的水平,人物一致性的保持比GPT-4o好。 在线使用: 模型:
OmniConsistency:DiT绘画模型通用插件 适用于Flux等DiT绘画模型,能在保持主体一致性的同时,实现风格泛化,且与现有的LoRA兼容。效果非常好,风格化接近GPT-4o的水平,人物一致性的保持比GPT-4o好。 在线使用: 模型:
Gorden Sun
4周前
Stream-Omni:多模态聊天框架 实现的效果类似GPT-4o,支持文本、图片、语音输入,同时输出文本和语音,不是原生多模态模型,而是把视觉和语音跟文本对齐,成本更低,适合自研多模态交互时使用。 Github:
Gorden Sun
1个月前
Ming-Omni:首个开源版多模态GPT-4o 蚂蚁集团和inclusionAI开源,支持输入文本、语音、图片、视频,输出文本、语音、图片(跟GPT-4o一样),应该是对标GPT-4o的第一个开源模型。 项目地址: Github:
向阳乔木
1个月前
蝗虫群友用Deepseek和Flux做的有1万个结局的AI游戏。 游戏背后思考: