时政
财经
科技
虚拟货币
其他
登录
#语音交互
关注
Frank Wang 玉伯
2周前
用户视角下,电脑有三要素:显示器、鼠标、键盘。 iPhone 干掉了鼠标,隐藏了键盘,放大了显示器,成为了 Super Hardware. Wispr Flow 借助 AI 终于干掉了键盘。只需 Voice 就能自然交互的某个应用,会有大机会成为 AI 时代的 Super App. 只需 Voice,不需要鼠标、键盘、显示屏,同时又能完成绝大部分需求的某个硬件,大概率就是新一代 iPhone,长得将会完全不像 iPhone. 不光下一代抖音已经在路上,下一代 iPhone 也可能已经在路上。
#iPhone
#AI
#语音交互
#未来硬件
#Super App
分享
评论 0
0
Frank Wang 玉伯
2周前
用户视角,电脑有三要素:显示器、鼠标、键盘。 iPhone 干掉了鼠标,隐藏了键盘,放大了显示器,成为了 Super Hardware. Wispr Flow 借助 AI 终于干掉了键盘。某个只需 Voice 就能自然交互的应用,有大机会成为 AI 时代的 Super App. 某个只需 Voice,不需要鼠标、键盘、显示屏,同时又能完成绝大部分需求的硬件,大概率就是新一代 iPhone,长得将会完全不像 iPhone. 不光下一代抖音已经在路上,下一代 iPhone 也可能已经在路上。
苹果Liquid Glass:开发者适配陷两难,AI助力AR或成未来· 68 条信息
#iPhone
#AI
#语音交互
#未来硬件
#Super App
分享
评论 0
0
Leo Xiang
3个月前
想清楚 OpenAI Realtime API 以及 Gemini Live API是什么了: Realtime API = ASR + TTS + 意图识别小模型。 更多的是作为语音交互Agent的接入层。
OpenAI新德里发布会:ChatGPT语音翻译功能引发热议· 522 条信息
#OpenAI
#Realtime API
#Gemini Live API
#ASR
#TTS
#语音交互
#意图识别
#AI
分享
评论 0
0
GitHubDaily
4个月前
在 GitHub 上发现一个 100% 本地替代 Manus AI 的开源解决方案:AgenticSeek。 基于本地推理模型和智能代理系统,能够自主浏览网页、编写代码、规划任务,还支持语音交互,就像钢铁侠电影里的 Jarvis(贾维斯)一样酷炫。 GitHub: 主要功能: - 完全本地化运行,所有数据保留在设备上零云端依赖 - 智能网页浏览,可自动搜索信息和填写表单 - 自主编程助手,支持 Python、C、Go、Java 等多种语言 - 智能代理选择系统,自动匹配最适合的任务处理方式 - 语音交互功能,支持语音输入和文本转语音输出 - 复杂任务规划执行,能将大型任务分解为步骤完成 提供详细的安装配置教程,建议至少使用 DeepSeek 14B 以上参数的模型,对电脑性能配置有一定要求。
#GitHub
#开源
#AI技术
#AgenticSeek
#本地化
#智能代理
#语音交互
#自主编程
#网页浏览
#安全隐私
#开源项目
分享
评论 0
0
小互
4个月前
Google 展示 Android XR 智能眼镜原型机 长时间记忆、实时语音交互、根据用户行为自动提供帮助 Android XR 智能眼镜功能: 上下文理解:通过摄像头和麦克风获取用户视角,结合地理位置信息理解当前场景和任务。 语音交互:随时启动语音助手,无需手动唤醒、无需使用手机。 实时辅助:根据用户行为自动推荐动作,如导航、查资料、拍照、翻译等。 记忆与个性化:具备长时间任务记忆功能,理解用户偏好、事务上下文。 与 Gemini 整合,实现真正的视觉助手
#Google
#Android
#XR
#智能眼镜
#语音交互
#实时辅助
分享
评论 0
0
央广网-央广网
5个月前
智能家电语音交互技术通用要求国家标准发布
从结构设计、安全性、功能性、标注标识等方面提出技术要求。
#智能家电
#语音交互
#国家标准
分享
评论 0
0
中新网-中国新闻网
5个月前
以后家电这样“听话”!智能家电语音交互国家标准发布
#智能家电
#语音交互
#国家标准发布
分享
评论 0
0
小互
8个月前
兄弟们,这个强啊,效果真的挺棒 复旦大学OpenMOSS人工智能开放实验室 推出首个端到端实时语音交互模型 中文语音能力感觉和GPT 4o 的高级语音很接近 - 低于 200 毫秒,支持语音打断和自然互动 - 可根据指令生成多情感、多风格的语音,包括模仿特定角色的情绪。 - 丰富的情感控制:支持生成多种情感语音,如欢快、严肃、悲伤等。 语音风格多样化:可以模拟不同的角色语调、情绪和语气。支持生成说唱、戏剧化台词、机器人声效、低语耳语、方言等风格
#复旦大学
#OpenMOSS
#人工智能
#语音交互
#实时语音
#情感控制
#语音风格
#GPT-4
#中文语音
分享
评论 0
0
个人主页
通知
我的投稿
我的关注
我的拉黑
我的评论
我的点赞