歸藏(guizang.ai) 0 关注者 关注 2个月前 试了一下阶跃的智能视频通话的多模态能力,真的超强。 响应很迅速(为了观看效果有剪辑),识别效果相当准确,常见的画面内容都能识别还能进行一定的推理。 看了一下这个视频理解又快又准确的原因,可能涉及他们刚发布的 Step-3 背后多项多模态积累,这个视频通话属于多模合一能力。 今晚阶跃发布的Step3核心创新点在于,通过模型-系统协同设计,实现了极高的解码效率和成本效益。 在Hopper GP #阶跃 #Step-3 #多模态 #视频通话 #AI 前往原网页查看