VITA-1.5：开源版视频+语音模型效果类似ChatGPT APP的视频交互，能看能听能说，但不是原生多模态。视觉多模态LLM使用的是QWen2.5，语音延迟只有1.5秒，且支持打断。 Github：

#VITA-1.5 #开源 #视频模型 #语音模型 #ChatGPT #视频交互 #视觉多模态 #QWen2.5 #语音延迟 #GitHub

Gorden Sun

20分钟前

Code wiki：谷歌的Github Wiki 类似DeepWiki和智谱的Zread，AI整理了Github仓库的内容，可以快速上手、了解架构，支持提问。特色是有类似NotebookLM生成的视频介绍。在线使用：

左手墨迹

21小时前

每天坚持阅读的这几年，我对信息密度和精度的要求越来越高，视频形式可能更生动形象，但它远远达不到我对信息密度和精度的期待，尤其是那些爆款。反而Chatgpt能给我的有效反馈远比我期待的要多很多，无论是密度还是精度，抑或是条理性和逻辑性。在这个信息视频化的时代，我好像成了文字时代的遗孤

sitin

22小时前

从 stripe 收款到水星银行，水星银行开卡订阅 ChatGPT，Claude，supabase 这些海外赚钱海外花！

小互

22小时前

ChatGPT 群聊推送到了嘿嘿我这几天一直挂的日本IP... 我来先玩一玩！随时更新测试进度↓...

Larry & Leo Bro - Eagle of Full Stack

1天前

周末了终于可以好好写开源了，欢迎使用我的分支 🎯 专注于 AI 计算和决策的正确性，以提高胜率为第一目标。第一步就是确保传递给 ai 的所有数据准确无误。

VITA-1.5：开源版视频+语音模型 效果类似ChatGPT APP的视频交互，能看能听能说，但不是原生多模态。视觉多模态LLM使用的是QWen2.5，语音延迟只有1.5秒，且支持打断。 Github：