Gorden Sun

Gorden Sun

0 关注者

2天前

Audio Flamingo 3:英伟达开源的音频多模态模型 支持音频输入、音频输出,有思考模型,能基于语音、音效、音乐问答,最大支持10分钟音频。同时开源了数据集。 模型:

#音频多模态模型 #英伟达开源 #Audio Flamingo 3 #音频输入输出 #10分钟音频

相关新闻

placeholder

Guangzheng Li

1个月前

elevenlabs 刚刚开源了兼容 shadcn ui 的前端组件,有大量和音频输入输出相关的组件 看了一下质量都挺高的,不只是样式,有的交互逻辑都完全生产可用,有音频组件相关需求的小伙伴不要错过

placeholder

Feiteng

5个月前

Gemini 2.5 技术报告:原生的 Audio Input Output Streaming 能力

© 2025 news.news. All rights reserved. 0.06338 秒. v1.0.46
我的评论