时政
财经
科技
虚拟货币
其他
登录
#视觉多模态模型
关注
Gorden Sun
3周前
Thyme:像o3一样分析图片 视觉多模态模型,会分析用户需求,针对复杂问题写代码来辅助解决。例如识别非常小的区域内的文字,会写代码执行放大+裁剪的操作,然后再识别图像解决问题。跟OpenAI o3的操作类似。 项目地址: Github:
#Thyme
#o3
#视觉多模态模型
#代码辅助
#图像识别
分享
评论 0
0
Gorden Sun
8个月前
Moondream 2B:性价比极佳的视觉多模态模型 2B大小,性能接近QWen2-VL 2B,但是需要的VRAM只有4G多(QWen2-VL 2B需要13G),个人电脑即可运行。同时还发布了0.5B的版本。 Github: 在线使用:
#视觉多模态模型
#VRAM
#个人电脑
#Moondream 2B
#QWen2-VL 2B
分享
评论 0
0
个人主页
通知
我的投稿
我的关注
我的拉黑
我的评论
我的点赞