Jeff Li2025-02-17 12:03:05根据我开发的『后脑壳识别模型』判断: 右1 曾毓群 右2 马云 右 5 马化腾 右 6 刘永好 右 7 任正非 右 8 王传福 右 10 雷军 后排左二 王兴 #后脑壳识别#科技人物#人工智能
Gorden Sun2025-01-28 01:02:27Janus-Pro:DeepSeek开源原生图片多模态模型 能读图(基于SigLIP-L),能生图(借鉴LlamaGen),分1.5B和7B两个大小。要知道GPT-4o的图片生成多模态模型至今没开放。 模型: Github: #DeepSeek#图片多模态模型#GPT-4o
宝玉2025-01-23 10:59:04 字节的可以直接操作图形界面的原生 GUI 智能体模型UI-TARS,类似于 Claude 的 Computer Use,可以只靠截取的界面图片就能理解并操作软件。 就像我们人类直接看手机或电脑屏幕一样,利用眼睛去“认”,再动手指去“点”。UI-TARS学会了从图片中辨别按钮、输入框、下拉菜单等各种元素,也能知道“这个图标大概率是搜索按钮”“这个区域是文本框”等信息。 UI-TARS具备四个#字节#GUI智能体#UI-TARS
Dexter Yang ᯅノ🌐🔗🧙🏻♂️👾🦋2025-01-11 07:14:57其实从来没有过「什么都没有」的时代,从来没有「从无到有」、「凭空出世」的科技产品和科技创新,所有新技术都是旧技术的新组合加上「小创新」,都是建立在旧技术之上的(所以会垒加抽象层、会导致前沿和创新总是在更靠近顶层的地方) 比如黄仁勋CES演讲中这两张图就是很具象化的例子 第一层: 用已有的通用GPU技术 (GUGPU 和CUDA编程)和已有的深度学习技术(CNN)组合出革命性的计算机视觉技术成果#科技创新#黄仁勋#计算机视觉