智谱直播发布全球最佳视觉模型GLM-4.5V,挑战AI视觉领域极限

智谱直播近日开源了其最新视觉模型GLM-4.5V,该模型基于其旗舰文本基础模型GLM-4.5-Air,拥有106B总参数和12B激活参数。GLM-4.5V在42个公开的视觉语言基准测试中表现出色,达到了同规模模型中的SOTA性能,支持图像、视频和文档理解等多种任务。该模型的推出标志着智谱在视觉推理领域的进一步突破,具备全场景视觉推理能力,能够处理复杂的图像推理和视频理解任务,预计将对AI视觉技术的发展产生深远影响。
21
 ·  1个月前 · 通义开源的Z-Image-Turbo图片模型太强了 仅6B大小,1秒出图,但是质量却非常非常高,人物真实、美学在线,天然认识各种名人,没有审核,绝对是本地AI绘画的首选模型。 模型: 在线使用:
© 2025 news.news. All rights reserved. 0.01469 秒. v1.0.46
我的评论