九原客 0 关注者 关注 3个月前 目前个人测试中文效果最好的 端到端文档识别小模型 是腾讯的 POINTS-Reader(比小红书的dots.ocr 还要好一些)。 做了如下小小的工作: 1. 合并了官方的PR到sglang 0.5.3 版本,可以高效推理。 2. 基于TRL的模型训练代码,可以进行训练。训练只需要图片和对应的markdown文本。 #腾讯 #POINTS-Reader #文档识别 #小模型 #sglang 前往原网页查看