关键人物/组织

智谱 AI

文本基础模型

智谱直播

开源视觉模型

智谱

视觉推理突破

智谱直播发布全球最佳视觉模型GLM-4.5V,挑战AI视觉领域极限

2025-08-14
7 次查看
0 次互动

智谱直播近日开源了其最新视觉模型GLM-4.5V,该模型基于其旗舰文本基础模型GLM-4.5-Air,拥有106B总参数和12B激活参数。GLM-4.5V在42个公开的视觉语言基准测试中表现出色,达到了同规模模型中的SOTA性能,支持图像、视频和文档理解等多种任务。该模型的推出标志着智谱在视觉推理领域的进一步突破,具备全场景视觉推理能力,能够处理复杂的图像推理和视频理解任务,预计将对AI视觉技术的发展产生深远影响。

AI 智能分析

基于多源数据的智能分析与洞察

智谱直播发布了其最新的视觉模型GLM-4.5V,标志着在多模态视觉推理领域的重要进展。该模型基于GLM-4.5-Air,具有强大的参数配置和出色的性能表现,能够处理多种视觉内容,满足不同应用需求。

事件发展趋势

  • 多模态模型的开源趋势
  • 视觉推理技术的快速发展

关键洞察

  • 新模型在多个视觉基准测试中表现优异
  • 开源将促进技术的广泛应用和进一步研究

政策建议

  • 关注模型的实际应用案例
  • 探索与其他AI技术的结合
AI 分析基于公开数据,仅供参考,不构成任何建议

事件时间线

2025-09-28
2025-09-23
2025-08-14
2025-08-11