Gorden Sun 0 关注者 关注 4个月前 olmOCR:可能是目前最好的开源OCR模型 基于微调后的7B视觉语言模型,微调数据为260000页PDF页面,完全开源,包括模型权重、数据和训练代码、推理代码,4090可以本地运行。 Github: 模型: 在线使用: #开源 #OCR #视觉语言模型 #模型权重 #微调 #PDF #GitHub #4090 前往原网页查看