试了一下阶跃的智能视频通话的多模态能力，真的超强。响应很迅速（为了观看效果有剪辑），识别效果相当准确，常见的画面内容都能识别还能进行一定的推理。看了一下这个视频理解又快又准确的原因，可能涉及他们刚发布的 Step-3 背后多项多模态积累，这个视频通话属于多模合一能力。今晚阶跃发布的Step3核心创新点在于，通过模型-系统协同设计，实现了极高的解码效率和成本效益。在Hopper GP

#阶跃 #Step-3 #多模态 #视频通话 #AI

相关新闻

Gorden Sun

1小时前

AI资讯日报，10月1日：

indigo

2小时前

Sora 2 这么火🔥 第一反应是什么？加仓Nvidia 😜

Lex Tang

4小时前

每次老婆刷短视频刷到 AI 解说的声音，尤其是那个叫“云稀”的 AI 男，我就对着她叫“划特划特划特…”，问我为什么，我说对这个 AI 声音过敏。多来了好几次，现在老婆已经养成了条件反射，一刷到 AI 声音不用我叫就划走

Y11

7小时前

分享文章《如何通过研究故事来学习如何创作故事？》，希望对想做AI + 小说/剧本创作的朋友有启发。

歸藏(guizang.ai)

8小时前

再开一个帖子记录一下我发现的一些 Sora 2 的玩法感觉这次抽卡属性更重，需要少写点，让 AI 去发挥更能整出抽象活来比如让 Sora 2 整一个最近很火的《力工梭哈定律》小剧场。提示词：用16bit 像素画风的故事表现这个定义：

关联事件

深度学习模型升级引发AI能力大跃进，行业迎新变革

深Seek R1模型完成“小版本”升级，显著增强代码能力、语义理解和复杂逻辑推理，带来性能提升。此次升级由官方宣布，用户可在官网和APP体验，模型在训练基础上基于V3-0324版本，效果明显优于之前版本。尽管期待大版本更新，但此次小升级已引发行业关注，显示出深度学习技术不断突破的趋势。未来，模型升级或将推动AI在编程、文本理解等领域的广泛应用，影响行业发展方向。