Limbo 0 关注者 关注 2周前 今天使用 MinerU 作为本地的文档解析器,发现使用 VLM 模式,对于图片 OCR 的处理效果特别好,文本、图片、布局都处理的比较 OK。MinerU Backend 两大类:传统 Pipeline 模式 和 VLM(视觉语言模型)模式, VLM 是OpenDataLab 自研的端到端大模型效果很能打。 #MinerU #文档解析器 #VLM模式 #图片OCR #OpenDataLab 前往原网页查看