时政
财经
科技

#语音交互

GitHubDaily
GitHubDaily
2025-05-25 18:00:32

在 GitHub 上发现一个 100% 本地替代 Manus AI 的开源解决方案:AgenticSeek。 基于本地推理模型和智能代理系统,能够自主浏览网页、编写代码、规划任务,还支持语音交互,就像钢铁侠电影里的 Jarvis(贾维斯)一样酷炫。 GitHub: 主要功能: - 完全本地化运行,所有数据保留在设备上零云端依赖 - 智能网页浏览,可自动搜索信息和填写表单 - 自主编程助手,

#GitHub#开源#AI技术
小互
小互
2025-05-21 10:31:45

Google 展示 Android XR 智能眼镜原型机 长时间记忆、实时语音交互、根据用户行为自动提供帮助 Android XR 智能眼镜功能: 上下文理解:通过摄像头和麦克风获取用户视角,结合地理位置信息理解当前场景和任务。 语音交互:随时启动语音助手,无需手动唤醒、无需使用手机。 实时辅助:根据用户行为自动推荐动作,如导航、查资料、拍照、翻译等。 记忆与个性化:具备长时间任务记

#Google#Android#XR
央广网-央广网
央广网-央广网
2025-04-08 16:05:00

智能家电语音交互技术通用要求国家标准发布

从结构设计、安全性、功能性、标注标识等方面提出技术要求。

#智能家电#语音交互#国家标准
中新网-中国新闻网
中新网-中国新闻网
2025-04-08 15:14:00

以后家电这样“听话”!智能家电语音交互国家标准发布

#智能家电#语音交互#国家标准发布
小互
小互
2025-01-27 12:50:20

兄弟们,这个强啊,效果真的挺棒 复旦大学OpenMOSS人工智能开放实验室 推出首个端到端实时语音交互模型 中文语音能力感觉和GPT 4o 的高级语音很接近 - 低于 200 毫秒,支持语音打断和自然互动 - 可根据指令生成多情感、多风格的语音,包括模仿特定角色的情绪。 - 丰富的情感控制:支持生成多种情感语音,如欢快、严肃、悲伤等。 语音风格多样化:可以模拟不同的角色语调、情绪和

#复旦大学#OpenMOSS#人工智能
兄弟们,这个强啊,效果真的挺棒

复旦大学OpenMOSS人工智能开放实验室

推出首个端到端实时语音交互模型 

中文语音能力感觉和GPT 4o 的高级语音很接近

- 低于 200 毫秒,支持语音打断和自然互动

- 可根据指令生成多情感、多风格的语音,包括模仿特定角色的情绪。

- 丰富的情感控制:支持生成多种情感语音,如欢快、严肃、悲伤等。

语音风格多样化:可以模拟不同的角色语调、情绪和
没有更多了 🤐