biantaishabi5

biantaishabi5

0 关注者

19小时前

看了这个deepseek的ocr,感觉就是卧槽,还能这样?让我想到了一个英文单词叫Photographic memory,以前的ocr是把图片上的东西转成文本,然后让程序或者大模型就直接读了,现在等于读图就读出了文字的意思,把文档当成一个完整的视觉对象来理解,他已经不是一目10行了,不是一目就一页,牛逼!