DeepSeek刚发的OCR模型有点小火，一方面是突出的性能，号称压缩10倍还有97%准确率，另一方面关于用分辨率来模拟遗忘机制的假想，恰巧AK在最近的访谈中说人的遗忘是一个feature而不是bug。 DeepSeek OCR模型很有意思的一点是提供了好多个“分辨率”选项，并且看起来用的token很少。最低的512 x 512一张图只需要64个token，稍大一点的1024 x 1024是25

#DeepSeek OCR #分辨率模拟遗忘 #多尺度预测 #字节跳动VAR #工程化产品化

相关新闻

Andy Stewart

3个月前

这玩意小型化以后配合DeepSeek OCR或者Paddle OCR 就可以把自己喜欢的书电子化保存 🤓

Michael Anti

4个月前

Deepseek OCR终于上硅基流动了，还没上Openrouter。我试一试爽一爽。

Andy Stewart

4个月前

DeepSeek OCR已上架懒猫微服应用商店 😀

orange.ai

4个月前

DeepSeek OCR 论文里的想法太有意思了。用光学压缩模拟人类记忆遗忘机制，还有点 callback AK 的会遗忘的智能了。。。人类记忆有个特点：一小时前的事，清清楚楚一周前的事，开始模糊一年前的事，几乎忘光视觉感知也一样： 10cm的东西看得清楚 20m的东西几乎看不清 DeepSeek想到一个绝妙类比：用分辨率来模拟这种衰减他们设计了对应关系：近期对话

关联事件

深度学习模型升级引发AI能力大跃进，行业迎新变革

143

深Seek R1模型完成“小版本”升级，显著增强代码能力、语义理解和复杂逻辑推理，带来性能提升。此次升级由官方宣布，用户可在官网和APP体验，模型在训练基础上基于V3-0324版本，效果明显优于之前版本。尽管期待大版本更新，但此次小升级已引发行业关注，显示出深度学习技术不断突破的趋势。未来，模型升级或将推动AI在编程、文本理解等领域的广泛应用，影响行业发展方向。