Limbo

Limbo

0 关注者

2周前

今天使用 MinerU 作为本地的文档解析器,发现使用 VLM 模式,对于图片 OCR 的处理效果特别好,文本、图片、布局都处理的比较 OK。MinerU Backend 两大类:传统 Pipeline 模式 和 VLM(视觉语言模型)模式, VLM 是OpenDataLab 自研的端到端大模型效果很能打。