nicekate

nicekate

0 关注者

6小时前

等不及 MLX 版的 DeepSeek-OCR了,折腾了会,把它在 Mac 上跑起来 DeepSeek-OCR 不仅是 OCR 模型,还有视觉理解能力 我试了 resize 512、640、padding 1024,Mac 走 CPU 还是 640 分辨率效果速度均衡些

#DeepSeek-OCR #Mac #CPU #视觉理解 #OCR模型

相关新闻

placeholder

meng shao

4小时前

[开源模型] DeepSeek-OCR: DeepSeek 最新开源的 VLM,参数规模 3B,核心目标是从 LLM 的视角探索视觉编码器的作用,并推动视觉-文本压缩技术的边界。该模型被命名为“Contexts Optical Compression”,目的是高效处理图像中的文本提取和文档结构化任务,适用于 OCR 和文档数字化场景。 关键创新与架构 DeepSeek-OCR 的设计强调 LLM

placeholder

小互

6小时前

DeepSeek 发布了一个新型 OCR文档理解模型:DeepSeek-OCR 它不仅解析图像文档达到了一流水平 还探索出了一个大胆的想法👇🏻 大语言模型(比如 GPT)在处理长文章时,消耗的计算量会爆炸性增长。 但如果把文字“画成图片”,模型只需要很少的“视觉 token”就能理解同样内容。 这样做相当于给AI一个**“视觉记忆压缩”机制**。 也就是: 他们先把长文本压缩生成一

placeholder

Gorden Sun

11小时前

DeepSeek开源DeepSeek-OCR OCR模型,效果比minerU 2.0略好(但是minerU已经有2.5版本了) 模型:

placeholder

Lex Tang

1天前

Anki 的 Mac 版更新起来也太 geek 了

placeholder

nicekate

2天前

PaddleOCR-VL 依赖下了,模型下了,突然发现 Mac 上还用不了

© 2025 news.news. All rights reserved. 0.05901 秒. v1.0.46
我的评论