biantaishabi5
1天前
看了这个deepseek的ocr,感觉就是卧槽,还能这样?让我想到了一个英文单词叫Photographic memory,以前的ocr是把图片上的东西转成文本,然后让程序或者大模型就直接读了,现在等于读图就读出了文字的意思,把文档当成一个完整的视觉对象来理解,他已经不是一目10行了,不是一目就一页,牛逼!
nicekate
3天前
PaddleOCR-VL 依赖下了,模型下了,突然发现 Mac 上还用不了
Mr Panda
3天前
y=f(x), f 就是模型, x 就是上下文, y 就是你要的结果。 是不是很简单。 模型差距不大的时候, 那么主要的差异就是x。 上下文x 中, 最重要的就是专有数据。 所以,拥有专有领域数据积累的公司, 也会是一家好公司。
dontbesilent
5天前
做一个自动化脚本 去每一条黄推下面评论:怎么做的,用的哪个模型,提示词可以分享吗