0 关注者

2个月前

DeepSeek开源DeepSeek-OCR-2 AI像人类一样阅读图片。不再是传统的“从左到右、从上到下”的阅读顺序，而是先整体分析布局结构，拆分出要详细阅读的块，然后再开始详细阅读。这样做可以保持语义关联，上下文更连贯，而且性能更高。更重要的是，DeepSeek-OCR-2弃用了CLIP，改用Qwen2-0.5B，验证了使用LLM架构作为统一多模态编码器的可行性，为后续的多模态模型做好了技

热门新闻