一个开源的统一多模态模型 BAGEL,基于图片的聊天对话、编辑、改写、文生图、风格转换、图片变换方向等 AI 能力,说是和 GPT-4o、Gemini 2.0 的能力相当。 🤖
DeBill
7小时前
Edge浏览器可以用Copilot来生成图片,目测是使用的gpt-4o,似乎每天有一定的使用额度,注意梯子要把连接微软的服务的规则从direct改成proxy(很多梯子的微软的规则是直连)
Gorden Sun
1天前
Cohere发布Command A Vision 视觉多模态模型,评分超过GPT 4.1,开源但不可商用。 模型:
Gorden Sun
3天前
--sref 864764428 Midjourney的这个风格参考,可以生成一只手在画铅笔画,然后用Flux Kontext编辑图片去掉主体只保留手,然后把这两张图用作首尾帧,即可生成一只手画铅笔画的全过程。
virushuo
4天前
glm4.5不错,比我近期用过的任何一个开源模型都更接近于行业顶级几家闭源。