Janus-Pro:DeepSeek开源原生图片多模态模型 能读图(基于SigLIP-L),能生图(借鉴LlamaGen),分1.5B和7B两个大小。要知道GPT-4o的图片生成多模态模型至今没开放。 模型: Github:
Janus-Pro:DeepSeek开源原生图片多模态模型 能读图(基于SigLIP-L),能生图(借鉴LlamaGen),分1.5B和7B两个大小。要知道GPT-4o的图片生成多模态模型至今没开放。 模型: Github:
Weiping Qin 秦偉平
5小时前
刚才开车,想让Siri给我发个信息,Hi Siri, 她竟然回答,hello Weiping,how can I help you? 第一次叫我的名字! 有点震惊,她肯定经常偷听我们人类讲话。
Y11
7小时前
分享10万个AI导航站原始数据集,开源地址: