Audio Flamingo 3：英伟达开源的音频多模态模型支持音频输入、音频输出，有思考模型，能基于语音、音效、音乐问答，最大支持10分钟音频。同时开源了数据集。模型：

#音频多模态模型 #英伟达开源 #Audio Flamingo 3 #音频输入输出 #10分钟音频

Guangzheng Li

5个月前

elevenlabs 刚刚开源了兼容 shadcn ui 的前端组件，有大量和音频输入输出相关的组件看了一下质量都挺高的，不只是样式，有的交互逻辑都完全生产可用，有音频组件相关需求的小伙伴不要错过

Feiteng

9个月前

Gemini 2.5 技术报告：原生的 Audio Input Output Streaming 能力

Audio Flamingo 3：英伟达开源的音频多模态模型 支持音频输入、音频输出，有思考模型，能基于语音、音效、音乐问答，最大支持10分钟音频。同时开源了数据集。 模型：