九原客

九原客

0 关注者

1周前

Paddle OCR 确实很久以来都是中文OCR的头把交椅。新的VLM模型也出来了,可以试试。

#Paddle OCR #中文OCR #VLM模型 #技术 #测评

相关新闻

placeholder

RamenPanda

5小时前

中美AI基础设施建设的军备竞赛,谁停下来谁认输

placeholder

kevinzhow

14小时前

现在能明显感觉出来 ChatGPT 又卡又慢了

placeholder

狂奔滴小马

1天前

什么向量数据库,如何对接 vercel ai sdk?

placeholder

SleepyZone

1天前

Cline CLI 竟然用 go 写的😭

placeholder

MapleShaw

1天前

阿里的 Wan2.2 有点东西!使用方法见评论👇 一段你在说话的视频,一张相同分辨率的其他人物的图片,就能让你不露脸出镜,i 人主播福音! 理论上直接开直播问题不大,再把音色换一换,死肥宅摇身一变性感美女,也可以去收割其他死肥宅了🤪

关联事件

智谱直播发布全球最佳视觉模型GLM-4.5V,挑战AI视觉领域极限

16

智谱直播近日开源了其最新视觉模型GLM-4.5V,该模型基于其旗舰文本基础模型GLM-4.5-Air,拥有106B总参数和12B激活参数。GLM-4.5V在42个公开的视觉语言基准测试中表现出色,达到了同规模模型中的SOTA性能,支持图像、视频和文档理解等多种任务。该模型的推出标志着智谱在视觉推理领域的进一步突破,具备全场景视觉推理能力,能够处理复杂的图像推理和视频理解任务,预计将对AI视觉技术的发展产生深远影响。

© 2025 news.news. All rights reserved. 0.09589 秒. v1.0.46
我的评论