𝙩𝙮≃𝙛{𝕩}^A𝕀²·ℙarad𝕚g𝕞

𝙩𝙮≃𝙛{𝕩}^A𝕀²·ℙarad𝕚g𝕞

0 关注者

1天前

interesting 我还以为是个OCR光学字符识别模型,结果貌似打通了多模态vLLM。

#OCR #多模态vLLM #模型

相关新闻

placeholder

biantaishabi5

1天前

看了这个deepseek的ocr,感觉就是卧槽,还能这样?让我想到了一个英文单词叫Photographic memory,以前的ocr是把图片上的东西转成文本,然后让程序或者大模型就直接读了,现在等于读图就读出了文字的意思,把文档当成一个完整的视觉对象来理解,他已经不是一目10行了,不是一目就一页,牛逼!

placeholder

nicekate

3天前

PaddleOCR-VL 依赖下了,模型下了,突然发现 Mac 上还用不了

placeholder

Mr Panda

3天前

y=f(x), f 就是模型, x 就是上下文, y 就是你要的结果。 是不是很简单。 模型差距不大的时候, 那么主要的差异就是x。 上下文x 中, 最重要的就是专有数据。 所以,拥有专有领域数据积累的公司, 也会是一家好公司。

placeholder

dontbesilent

5天前

做一个自动化脚本 去每一条黄推下面评论:怎么做的,用的哪个模型,提示词可以分享吗

placeholder

池建强

1周前

我的朋友二爷邱岳,对 AI 的一些洞察: 我比较喜欢的一句:做模型和用模型的是两种人,但最后是一种人。

© 2025 news.news. All rights reserved. 0.052 秒. v1.0.46
我的评论