时政
财经
科技
登录
#视觉
关注
Gorden Sun
1周前
Stream-Omni:多模态聊天框架 实现的效果类似GPT-4o,支持文本、图片、语音输入,同时输出文本和语音,不是原生多模态模型,而是把视觉和语音跟文本对齐,成本更低,适合自研多模态交互时使用。 Github:
#多模态
#GPT-4o
#文本
#图片
#语音
#视觉
#自研
#交互
分享
评论 0
0
只配抬杠
3个月前
视觉有痛感
#视觉
#痛感
分享
评论 0
0
The Figen
5个月前
Optical illusion 😅
#optical
#Illusion
#错觉
#视觉
分享
评论 0
0
NO CONTEXT HUMANS
5个月前
60fps vs 120fps
#60fps
#120fps
#视频帧率
#流畅性
#游戏体验
#视觉
分享
评论 0
0
Figen
6个月前
Incredible art.
#艺术
#惊人
#视觉
#创意
#现代
#作品
分享
评论 0
0
个人主页
通知
我的投稿
我的关注
我的拉黑
我的评论
我的点赞