时政
财经
科技
登录
#多模态大模型
关注
Shaolei Zhang
2周前
👏🏻Stream-Omni:一个类GPT-4o的文本-视觉-语音多模态大模型 (1)同时支持文本、视觉、语音输入,生成文本和语音回复。 (2)语音交互过程中,同步生成中间的语音识别、文本回复结果,提供更加全面的多模态交互体验! 📝论文: 🔗代码&Demo:
#多模态大模型
#GPT-4
#文本-视觉-语音统一
#AI交互
#语音识别
#中间生成
分享
评论 0
0
央视网-新华社
3周前
我国科学家研究揭示多模态大模型概念表征机制
记者6月9日从中国科学院自动化研究所获悉,该所与中国科学院脑科学与智能技术卓越创新中心的联合团队在《自然·机器智能》发表相关研究,首次证实多模态大语言模型能够自发形成与人类高度相似的物体概念表征系统,为人工智能认知科学提供了新路径,也为构建类人认知结构的人工智能系统提供了理论框架。
#多模态大模型
#概念表征机制
#科学研究
#中国科学家
分享
评论 0
0
九原客
7个月前
2025年LLM趋势个人预测: 1. Test-time compute 使Agent生产可用。GPT-4o能力级别模型可普遍做到 500 tokens/s 的推理速度从而解决推理耗时问题。 2. 多模态大模型生产可用,端到端和大小模型组合两种架构并驾齐驱。 3. 更多领域级的小模型(不仅是数学、代码)从通用模型分化并提升效果。
#LLM趋势
#Test-time compute
#多模态大模型
#模型推理速度
#领域级小模型
分享
评论 0
0
个人主页
通知
我的投稿
我的关注
我的拉黑
我的评论
我的点赞