九原客

九原客

0 关注者

2个月前

Paddle OCR 确实很久以来都是中文OCR的头把交椅。新的VLM模型也出来了,可以试试。

#Paddle OCR #中文OCR #VLM模型 #技术 #测评

相关新闻

placeholder

Ken Wong

2周前

0.00068毫米,马斯克看完都得掉眼泪。

placeholder

Cell 细胞

2周前

挖到一本好书,强烈推荐! 媒介是人类器官与意识的延伸, 长久以来与人互相塑造、共同进化。 我们如何获取知识、协同工作、 连接彼此,无不被媒介深刻影响。 技术、人类与社会如何彼此塑造? 追问这个问题,其实就是在追问: 我们将成为什么样的人, 将生活在怎样的社会?

placeholder

陈少举 (🦣 @[email protected] )

2周前

看了LTT和Linus Torvalds的这期节目,后面聊天聊得非常有意思: 。👀 想到几天前看到的一张图片😂: ref:

placeholder

元否

2周前

AIGC 生产力工具的付费点,痛点命中率很高

placeholder

Mr Panda

2周前

所有的solo vibe coders 都要学会使用 docker 和 postgres ,为什么可以自己去问问 ai

关联事件

智谱直播发布全球最佳视觉模型GLM-4.5V,挑战AI视觉领域极限

21

智谱直播近日开源了其最新视觉模型GLM-4.5V,该模型基于其旗舰文本基础模型GLM-4.5-Air,拥有106B总参数和12B激活参数。GLM-4.5V在42个公开的视觉语言基准测试中表现出色,达到了同规模模型中的SOTA性能,支持图像、视频和文档理解等多种任务。该模型的推出标志着智谱在视觉推理领域的进一步突破,具备全场景视觉推理能力,能够处理复杂的图像推理和视频理解任务,预计将对AI视觉技术的发展产生深远影响。

© 2025 news.news. All rights reserved. 0.05311 秒. v1.0.46
我的评论