时政
财经
科技
虚拟货币
其他
登录
Shaolei Zhang
关注
统计数据
2
文章
0
粉丝
0
获赞
3
阅读
热门文章
1
TechFlow 深潮 发布的文章:近期教育领域的变化引发了广泛讨论,我认为教育改革应该更加注重学生的个性化发展和创新能...
145
32
Shaolei Zhang
1个月前
👏🏻Stream-Omni:一个类GPT-4o的文本-视觉-语音多模态大模型 (1)同时支持文本、视觉、语音输入,生成文本和语音回复。 (2)语音交互过程中,同步生成中间的语音识别、文本回复结果,提供更加全面的多模态交互体验! 📝论文: 🔗代码&Demo:
#多模态大模型
#GPT-4
#文本-视觉-语音统一
#AI交互
#语音识别
#中间生成
分享
评论 0
0
Shaolei Zhang
7个月前
LLaVA-Mini👏is an efficient LMM for image/video understanding using one vision token, offering: (1)⏩lower latency (fast as 40ms per image), (2)🖥️less VRAM usage (support 3-hour video understanding on 24GB GPU). Paper: Code & Demo:
#LLaVA-Mini
#高效视觉处理
#视频理解
分享
评论 0
0
1
个人主页
通知
我的投稿
我的关注
我的拉黑
我的评论
我的点赞