时政
财经
科技

#计算机视觉

Jeff Li
Jeff Li
2025-02-17 12:03:05

根据我开发的『后脑壳识别模型』判断: 右1 曾毓群 右2 马云 右 5 马化腾 右 6 刘永好 右 7 任正非 右 8 王传福 右 10 雷军 后排左二 王兴

#后脑壳识别#科技人物#人工智能
Gorden Sun
Gorden Sun
2025-01-28 01:02:27

Janus-Pro:DeepSeek开源原生图片多模态模型 能读图(基于SigLIP-L),能生图(借鉴LlamaGen),分1.5B和7B两个大小。要知道GPT-4o的图片生成多模态模型至今没开放。 模型: Github:

#DeepSeek#图片多模态模型#GPT-4o
Janus-Pro:DeepSeek开源原生图片多模态模型
能读图(基于SigLIP-L),能生图(借鉴LlamaGen),分1.5B和7B两个大小。要知道GPT-4o的图片生成多模态模型至今没开放。
模型:
Github:
宝玉
宝玉
2025-01-23 10:59:04

字节的可以直接操作图形界面的原生 GUI 智能体模型UI-TARS,类似于 Claude 的 Computer Use,可以只靠截取的界面图片就能理解并操作软件。 就像我们人类直接看手机或电脑屏幕一样,利用眼睛去“认”,再动手指去“点”。UI-TARS学会了从图片中辨别按钮、输入框、下拉菜单等各种元素,也能知道“这个图标大概率是搜索按钮”“这个区域是文本框”等信息。 UI-TARS具备四个

#字节#GUI智能体#UI-TARS
 
字节的可以直接操作图形界面的原生 GUI 智能体模型UI-TARS,类似于 Claude 的 Computer Use,可以只靠截取的界面图片就能理解并操作软件。

就像我们人类直接看手机或电脑屏幕一样,利用眼睛去“认”,再动手指去“点”。UI-TARS学会了从图片中辨别按钮、输入框、下拉菜单等各种元素,也能知道“这个图标大概率是搜索按钮”“这个区域是文本框”等信息。

UI-TARS具备四个
Dexter Yang ᯅノ🌐🔗🧙🏻‍♂️👾🦋
Dexter Yang ᯅノ🌐🔗🧙🏻‍♂️👾🦋
2025-01-11 07:14:57

其实从来没有过「什么都没有」的时代,从来没有「从无到有」、「凭空出世」的科技产品和科技创新,所有新技术都是旧技术的新组合加上「小创新」,都是建立在旧技术之上的(所以会垒加抽象层、会导致前沿和创新总是在更靠近顶层的地方) 比如黄仁勋CES演讲中这两张图就是很具象化的例子 第一层: 用已有的通用GPU技术 (GUGPU 和CUDA编程)和已有的深度学习技术(CNN)组合出革命性的计算机视觉技术成果

#科技创新#黄仁勋#计算机视觉
其实从来没有过「什么都没有」的时代,从来没有「从无到有」、「凭空出世」的科技产品和科技创新,所有新技术都是旧技术的新组合加上「小创新」,都是建立在旧技术之上的(所以会垒加抽象层、会导致前沿和创新总是在更靠近顶层的地方)

比如黄仁勋CES演讲中这两张图就是很具象化的例子

第一层: 用已有的通用GPU技术 (GUGPU 和CUDA编程)和已有的深度学习技术(CNN)组合出革命性的计算机视觉技术成果
Massimo
Massimo
2024-12-30 09:37:58

Famous painting reimagined by AI [🎞️ a.i.image_video]

#AI艺术#著名画作#人工智能
Famous painting reimagined by AI

[🎞️ a.i.image_video]
没有更多了 🤐