Gorden Sun 0 关注者 关注 3周前 DeepSeek开源DeepSeek-OCR-2 AI像人类一样阅读图片。不再是传统的“从左到右、从上到下”的阅读顺序,而是先整体分析布局结构,拆分出要详细阅读的块,然后再开始详细阅读。这样做可以保持语义关联,上下文更连贯,而且性能更高。 更重要的是,DeepSeek-OCR-2弃用了CLIP,改用Qwen2-0.5B,验证了使用LLM架构作为统一多模态编码器的可行性,为后续的多模态模型做好了技 前往原网页查看