中新网-中国新闻网
0 关注者
sitin
1个月前
Google 宣布正在将Gemini 深度整合进 Google Maps,为导航、地标识别、语音交互与视觉探索带来全新体验。 感觉 Google 这波是把 Maps 升级成「懂你的 AI 副驾驶」了 🚗 Gemini 深度接入 Google Maps,几个我觉得很爽的点: 直接语音聊:一路问吃的、找充电桩、报路况、顺手让它帮你加日历,都用说的就行 地标导航:不再是“500 米右转”,而是“
Y11
2个月前
过去七个月,AI领域的变化像潮水般涌来,有些我们已经能感受到,有些还在酝酿。先说说那些让我们能更轻松对话的工具,像N8N这样能自动生成节点的智能助手,已经悄悄出现在我们身边了。它就像一个贴心的小管家,能帮我们处理对话中的各种细节,让交流变得更顺畅。 再看视频创作,现在AI做视频的工具多到数不清,就像天上的星星一样。而且它们不再是千篇一律的,开始有了自己的专长,有的擅长做动画,有的特别会剪辑,满足
Frank Wang 玉伯
3个月前
用户视角下,电脑有三要素:显示器、鼠标、键盘。 iPhone 干掉了鼠标,隐藏了键盘,放大了显示器,成为了 Super Hardware. Wispr Flow 借助 AI 终于干掉了键盘。只需 Voice 就能自然交互的某个应用,会有大机会成为 AI 时代的 Super App. 只需 Voice,不需要鼠标、键盘、显示屏,同时又能完成绝大部分需求的某个硬件,大概率就是新一代 iPhone
用户视角,电脑有三要素:显示器、鼠标、键盘。 iPhone 干掉了鼠标,隐藏了键盘,放大了显示器,成为了 Super Hardware. Wispr Flow 借助 AI 终于干掉了键盘。某个只需 Voice 就能自然交互的应用,有大机会成为 AI 时代的 Super App. 某个只需 Voice,不需要鼠标、键盘、显示屏,同时又能完成绝大部分需求的硬件,大概率就是新一代 iPhone,长
Leo Xiang
6个月前
想清楚 OpenAI Realtime API 以及 Gemini Live API是什么了: Realtime API = ASR + TTS + 意图识别小模型。 更多的是作为语音交互Agent的接入层。