Tw93

Tw93

0 关注者

1个月前

一个开源的统一多模态模型 BAGEL,基于图片的聊天对话、编辑、改写、文生图、风格转换、图片变换方向等 AI 能力,说是和 GPT-4o、Gemini 2.0 的能力相当。 🤖

#开源模型 #多模态模型 #BAGEl #AI能力 #GPT-4o #Gemini 2.0 #图片编辑 #文生图

相关新闻

placeholder

DeBill

7小时前

Edge浏览器可以用Copilot来生成图片,目测是使用的gpt-4o,似乎每天有一定的使用额度,注意梯子要把连接微软的服务的规则从direct改成proxy(很多梯子的微软的规则是直连)

placeholder

Gorden Sun

1天前

Cohere发布Command A Vision 视觉多模态模型,评分超过GPT 4.1,开源但不可商用。 模型:

placeholder

Gorden Sun

3天前

--sref 864764428 Midjourney的这个风格参考,可以生成一只手在画铅笔画,然后用Flux Kontext编辑图片去掉主体只保留手,然后把这两张图用作首尾帧,即可生成一只手画铅笔画的全过程。

placeholder

virushuo

4天前

glm4.5不错,比我近期用过的任何一个开源模型都更接近于行业顶级几家闭源。

placeholder

宝玉

4天前

最近我也在思考 Workflow 和 Agent 到底什么关系,我的一个初步想法: Workflow 本质上是工具,只是工具中用到了 AI 能力,所有能被定义成 Work Flow 的就应该能被做成工具。 Agent 更像是 AI,它能主动规划、去调用工具,Workflow 应该是 Agent 的一个可以被调用的工具。 你怎么看?

© 2025 news.news. All rights reserved. 0.22231 秒. v1.0.38
我的评论