时政
财经
科技
虚拟货币
其他
登录
#DeepseekOCR
关注
铁锤人
2天前
这两天看到好多人在关心DeepseekOCR和百度PaddleOCR-VL的对比,我有些技术见解 我之前公司开发过文档翻译,选型PaddleOCR-VL 现在结论依然不变, 因为在OmniBenchDoc V1.5 权威榜单中: 1. 表格结构理解:Table TEDS 得分,领先 15.5 分 2. 表格语义理解:91.43分,领先 9.9 分 3. 综合得分 92.56 vs 86.46,领先 6.1 分 从选型角度来说: 1. 做OCR文档解析工作流(文本+表格+公式+阅读顺序)时,相比后者更好 2. 模型比较小,方便用户端侧推理下载webgpu推理。 但若你关注长上下文压缩等新思路,后者值得在相关场景中探索。
#DeepseekOCR
#PaddleOCR-VL
#文档解析
#表格识别
#性能领先
分享
评论 0
0
Cell 细胞
2天前
最近在做「小某书」里播客分享和种草笔记的相关分析,因为大部分是图片为主,所以绕不开 OCR。横评一圈后,发现最能打的还是 PaddleOCR,下面第二张,是找的手写笔记识别测试效果。 PaddleOCR 算是开源深耕多年、生态完整、工程部署友好。看了他们最新 PaddleOCR-VL 的跟DeepseekOCR的对比指标,居然在权威 OmniBenchDoc V1.5 上做到: - 综合 92.56(+6.1 相比 DeepSeek-OCR-Gundam-M,模型仅 0.9B) - 表格结构 TEDS 93.52(+15.5) - 表格语义 TEDS-S 91.43(+9.9) - 阅读顺序误差 0.043 - 公式 CDM 89.76(略胜) 这对实战意味着:多表格页、混排公式/手写、阅读顺序恢复更准、更省清洗成本。顺带点赞 DeepSeek 的“上下文光学压缩”思路,学术上很有启发,但落地层面我会优先上 PaddleOCR-VL 做生产线基座。
#PaddleOCR
#OCR技术
#DeepseekOCR
#性能对比
#开源
分享
评论 0
0
个人主页
通知
我的投稿
我的关注
我的拉黑
我的评论
我的点赞