时政
财经
科技
虚拟货币
其他
登录
#视觉模型
关注
Gorden Sun
8小时前
GLM-4.5V:智谱开源视觉模型 106B总参数,12B激活参数,开源最佳视觉模型。 模型:
#GLM-4.5V
#智谱
#视觉模型
#开源
#106B参数
分享
评论 0
0
Limbo
2周前
传统OCR 像拆解剧本:OCR、版面检测、分块、嵌入……每一步都可能出错,表格、图例、空间关系全都丢失,信息碎片化严重。 基于视觉模型新范式:直接把每页文档当作图片输入大模型,利用视觉模型和多模态语言模型,保留全部空间和视觉细节,像人一样理解文档。
#OCR
#视觉模型
#大模型
#文档理解
#信息提取
分享
评论 0
0
Gorden Sun
1个月前
V-JEPA 2:Meta开源的世界模型 杨立昆带队的视觉模型,不仅能理解视频,而且能预测视频。在视觉评测的所有项目上都获得了最高分,在指挥机器人行动方面遥遥领先。 官方介绍: Github: 模型:
#Meta
#世界模型
#V-JEPA 2
#视觉模型
#视频预测
分享
评论 0
0
个人主页
通知
我的投稿
我的关注
我的拉黑
我的评论
我的点赞