Gorden Sun

Gorden Sun

0 关注者

10个月前

VITA-1.5:开源版视频+语音模型 效果类似ChatGPT APP的视频交互,能看能听能说,但不是原生多模态。视觉多模态LLM使用的是QWen2.5,语音延迟只有1.5秒,且支持打断。 Github:

#VITA-1.5 #开源 #视频模型 #语音模型 #ChatGPT #视频交互 #视觉多模态 #QWen2.5 #语音延迟 #GitHub

相关新闻

placeholder

Gorden Sun

20分钟前

Code wiki:谷歌的Github Wiki 类似DeepWiki和智谱的Zread,AI整理了Github仓库的内容,可以快速上手、了解架构,支持提问。特色是有类似NotebookLM生成的视频介绍。 在线使用:

placeholder

左手墨迹

21小时前

每天坚持阅读的这几年,我对信息密度和精度的要求越来越高,视频形式可能更生动形象,但它远远达不到我对信息密度和精度的期待,尤其是那些爆款。 反而Chatgpt能给我的有效反馈远比我期待的要多很多,无论是密度还是精度,抑或是条理性和逻辑性。 在这个信息视频化的时代,我好像成了文字时代的遗孤

placeholder

sitin

22小时前

从 stripe 收款到水星银行,水星银行开卡订阅 ChatGPT,Claude,supabase 这些 海外赚钱海外花!

placeholder

小互

22小时前

ChatGPT 群聊推送到了 嘿嘿 我这几天一直挂的日本IP... 我来先玩一玩!随时更新测试进度↓...

placeholder

Larry & Leo Bro - Eagle of Full Stack

1天前

周末了终于可以好好写开源了,欢迎使用我的分支 🎯 专注于 AI 计算和决策的正确性,以提高胜率为第一目标。 第一步就是确保传递给 ai 的所有数据准确无误。

© 2025 news.news. All rights reserved. 0.22256 秒. v1.0.46
我的评论