𝙩𝙮≃𝙛{𝕩}^A𝕀²·ℙarad𝕚g𝕞

𝙩𝙮≃𝙛{𝕩}^A𝕀²·ℙarad𝕚g𝕞

0 关注者

2个月前

interesting 我还以为是个OCR光学字符识别模型,结果貌似打通了多模态vLLM。

#OCR #多模态vLLM #模型

相关新闻

placeholder

sundyme

1个月前

舌尖上的AI第二弹:高端的模型,往往只需要最朴素的Prompt。🍌

placeholder

ilovelife

1个月前

这届网友太有才了,后面的几个模型是啥?

placeholder

Orange AI

1个月前

卧槽,banana2 这世界知识和排版都太牛逼了... 虽然中文字多了还是有问题 发了半天了,发现好像大家还是没什么动静 😂 ListenHub 真的成全网首发这个模型的了 尴尬。。。

placeholder

yihong0618

1个月前

以前的模型顶多是 AI guys 团建,今天相当于开年会了。

placeholder

Jason Young

1个月前

Gemini3 已经在 cursor 中可用,使用方法:设置 - models - add custom model,填写“gemini-3-pro-preview”并勾选启用即可使用

关联事件

智谱直播发布全球最佳视觉模型GLM-4.5V,挑战AI视觉领域极限

21

智谱直播近日开源了其最新视觉模型GLM-4.5V,该模型基于其旗舰文本基础模型GLM-4.5-Air,拥有106B总参数和12B激活参数。GLM-4.5V在42个公开的视觉语言基准测试中表现出色,达到了同规模模型中的SOTA性能,支持图像、视频和文档理解等多种任务。该模型的推出标志着智谱在视觉推理领域的进一步突破,具备全场景视觉推理能力,能够处理复杂的图像推理和视频理解任务,预计将对AI视觉技术的发展产生深远影响。

© 2025 news.news. All rights reserved. 0.07513 秒. v1.0.46
我的评论