时政
财经
科技
虚拟货币
其他
登录
#PaddleOCR
关注
Cell 细胞
2天前
最近在做「小某书」里播客分享和种草笔记的相关分析,因为大部分是图片为主,所以绕不开 OCR。横评一圈后,发现最能打的还是 PaddleOCR,下面第二张,是找的手写笔记识别测试效果。 PaddleOCR 算是开源深耕多年、生态完整、工程部署友好。看了他们最新 PaddleOCR-VL 的跟DeepseekOCR的对比指标,居然在权威 OmniBenchDoc V1.5 上做到: - 综合 92.56(+6.1 相比 DeepSeek-OCR-Gundam-M,模型仅 0.9B) - 表格结构 TEDS 93.52(+15.5) - 表格语义 TEDS-S 91.43(+9.9) - 阅读顺序误差 0.043 - 公式 CDM 89.76(略胜) 这对实战意味着:多表格页、混排公式/手写、阅读顺序恢复更准、更省清洗成本。顺带点赞 DeepSeek 的“上下文光学压缩”思路,学术上很有启发,但落地层面我会优先上 PaddleOCR-VL 做生产线基座。
#PaddleOCR
#OCR技术
#DeepseekOCR
#性能对比
#开源
分享
评论 0
0
个人主页
通知
我的投稿
我的关注
我的拉黑
我的评论
我的点赞