时政
财经
科技
登录
#语音交互
关注
Leo Xiang
2周前
想清楚 OpenAI Realtime API 以及 Gemini Live API是什么了: Realtime API = ASR + TTS + 意图识别小模型。 更多的是作为语音交互Agent的接入层。
AI编程:Gemini免费用,Claude手机玩· 194 条信息
#OpenAI
#Realtime API
#Gemini Live API
#ASR
#TTS
#语音交互
#意图识别
#AI
分享
评论 0
0
GitHubDaily
1个月前
在 GitHub 上发现一个 100% 本地替代 Manus AI 的开源解决方案:AgenticSeek。 基于本地推理模型和智能代理系统,能够自主浏览网页、编写代码、规划任务,还支持语音交互,就像钢铁侠电影里的 Jarvis(贾维斯)一样酷炫。 GitHub: 主要功能: - 完全本地化运行,所有数据保留在设备上零云端依赖 - 智能网页浏览,可自动搜索信息和填写表单 - 自主编程助手,支持 Python、C、Go、Java 等多种语言 - 智能代理选择系统,自动匹配最适合的任务处理方式 - 语音交互功能,支持语音输入和文本转语音输出 - 复杂任务规划执行,能将大型任务分解为步骤完成 提供详细的安装配置教程,建议至少使用 DeepSeek 14B 以上参数的模型,对电脑性能配置有一定要求。
#GitHub
#开源
#AI技术
#AgenticSeek
#本地化
#智能代理
#语音交互
#自主编程
#网页浏览
#安全隐私
#开源项目
分享
评论 0
0
小互
1个月前
Google 展示 Android XR 智能眼镜原型机 长时间记忆、实时语音交互、根据用户行为自动提供帮助 Android XR 智能眼镜功能: 上下文理解:通过摄像头和麦克风获取用户视角,结合地理位置信息理解当前场景和任务。 语音交互:随时启动语音助手,无需手动唤醒、无需使用手机。 实时辅助:根据用户行为自动推荐动作,如导航、查资料、拍照、翻译等。 记忆与个性化:具备长时间任务记忆功能,理解用户偏好、事务上下文。 与 Gemini 整合,实现真正的视觉助手
#Google
#Android
#XR
#智能眼镜
#语音交互
#实时辅助
分享
评论 0
0
央广网-央广网
2个月前
智能家电语音交互技术通用要求国家标准发布
从结构设计、安全性、功能性、标注标识等方面提出技术要求。
#智能家电
#语音交互
#国家标准
分享
评论 0
0
中新网-中国新闻网
2个月前
以后家电这样“听话”!智能家电语音交互国家标准发布
#智能家电
#语音交互
#国家标准发布
分享
评论 0
0
小互
5个月前
兄弟们,这个强啊,效果真的挺棒 复旦大学OpenMOSS人工智能开放实验室 推出首个端到端实时语音交互模型 中文语音能力感觉和GPT 4o 的高级语音很接近 - 低于 200 毫秒,支持语音打断和自然互动 - 可根据指令生成多情感、多风格的语音,包括模仿特定角色的情绪。 - 丰富的情感控制:支持生成多种情感语音,如欢快、严肃、悲伤等。 语音风格多样化:可以模拟不同的角色语调、情绪和语气。支持生成说唱、戏剧化台词、机器人声效、低语耳语、方言等风格
#复旦大学
#OpenMOSS
#人工智能
#语音交互
#实时语音
#情感控制
#语音风格
#GPT-4
#中文语音
分享
评论 0
0
个人主页
通知
我的投稿
我的关注
我的拉黑
我的评论
我的点赞