Shaolei Zhang

Shaolei Zhang

0 关注者

7个月前

LLaVA-Mini👏is an efficient LMM for image/video understanding using one vision token, offering: (1)⏩lower latency (fast as 40ms per image), (2)🖥️less VRAM usage (support 3-hour video understanding on 24GB GPU). Paper: Code & Demo:

#LLaVA-Mini #高效视觉处理 #视频理解

相关新闻

placeholder

勃勃OC

2年前

未来5年,谁不做AGI,不做视频理解,不做机器人 谁就被淘汰,就得死 这个世界最诡谲,最美妙的地方就是 他发展的速度是几何级数的增长的,而且不以人的意志为转移的 种田10000年,挖矿300年,造计算机100年,写代码30年 我们的下一代 被淘汰的速度, 是我们的10,100倍。 他们比我们失败的快

© 2025 news.news. All rights reserved. 0.07698 秒. v1.0.42
我的评论