关键人物/组织

谷歌

发布Veo3

智谱

升级到 4.6,视觉推理突破

智谱AI

推出AI模型,文本基础模型

智谱直播

开源视觉模型

360

开源FG-CLIP 2

硅谷

公司

智谱清言

支持GLM-4.6

智谱MaaS平台

支持GLM-4.6

Qwen3-VL

发布模型

Cursor

魔改

glm4.6

编程能力

智谱直播发布全球最佳视觉模型GLM-4.5V,挑战AI视觉领域极限

2025-08-14
29 次查看
0 次互动

智谱直播近日开源了其最新视觉模型GLM-4.5V,该模型基于其旗舰文本基础模型GLM-4.5-Air,拥有106B总参数和12B激活参数。GLM-4.5V在42个公开的视觉语言基准测试中表现出色,达到了同规模模型中的SOTA性能,支持图像、视频和文档理解等多种任务。该模型的推出标志着智谱在视觉推理领域的进一步突破,具备全场景视觉推理能力,能够处理复杂的图像推理和视频理解任务,预计将对AI视觉技术的发展产生深远影响。

AI 智能分析

基于多源数据的智能分析与洞察

此次事件主要围绕智谱AI及其他公司在视觉模型领域的进展与竞争,展示了多模态模型的快速发展与应用场景的扩展。智谱AI的GLM-4.5V和GLM-4.6模型在视觉理解和编程能力上取得了显著提升,标志着视觉语言模型的技术进步。同时,其他公司如Google、阿里巴巴等也在推出各自的视觉模型,推动了整个行业的创新与发展。

事件发展趋势

  • 视觉模型技术快速迭代与升级
  • 多模态模型的应用场景不断扩展
  • 行业内竞争加剧,各大公司积极开源与发布新模型

关键洞察

  • 视觉理解能力的提升将推动AI在更多实际应用中的落地
  • 开源策略有助于技术的快速传播与社区的共同发展
  • 未来的模型将更加注重多模态融合,提升智能体的综合能力

政策建议

  • 关注行业内各大公司的技术动态与开源项目
  • 探索多模态模型在特定行业中的应用潜力
  • 加强对新模型的测试与评估,以推动技术的持续进步
AI 分析基于公开数据,仅供参考,不构成任何建议

事件时间线

2025-11-27
2025-11-25
2025-11-06
2025-11-05
2025-10-25
2025-10-24
2025-10-22
2025-10-21
2025-10-20
2025-10-16
2025-10-02
2025-09-30
2025-09-28
2025-09-23
2025-08-14
2025-08-11