时政
财经
科技
虚拟货币
其他
登录
#人机交互
关注
Edward Luo
1天前
最近每天烧几亿 Tokens,做了一款很有趣的 Mac「灵动岛」App - 👾 Vibe Island. Vibe Island 的灵感来源于我在 Vibe Coding 会同时开 5-10 个对话跑不同的任务,经常切着切着就忘了刚刚那个对话跑到哪了...任务做没做完、需不需要我审批等等问题。 感觉人类大脑的上下文窗口已经远远不够用了。 于是,我就给这些 Agents 造了一座灵动岛! 装上 Vibe Island 之后:Mac 刘海区域会展示各种 Agents (Claude Code / Codex / OpenClaw 等等)的实时工作状态: - 当 Agent 需要权限审批或任务完成时,灵动岛会自动展开,不用切回终端就能操作 - 面板聚合了所有正在运行的 Agents 对话,点击卡片,精准跳回到会话所在的终端界面 - 所有状态都配有定制化的 8 bit 像素风游戏音效,狠狠提升了 Vibe Coding 的氛围感 灵动岛是一个极其优雅的形态:既能展示后台任务的状态,又不打扰前台正在进行的任务,它只在需要你注意的时候弹出,不用切换应用就能完成轻量交互,还带有一点陪伴感。 其实最早这个 App 只能触发右上角的系统通知,后来发现只做通知远远不够,实际应该解决的是:如何在恰当的时刻,以最小的摩擦,把注意力带回到正确的位置。 欢迎前往官网下载体验👇🏻
#tokens消耗
#Mac应用
#灵动岛
#VibeIsland
#VibeCoding
#创新科技
#多任务处理
#上下文管理
#人机交互
#数字代理
分享
评论 0
0
Nathan 🧸
1周前
未来给人用的AI产品价值更大?还是给Agent调用的产品价值更大? 给人用的AI产品,人来判断价格;给agent用的AI产品,agent来判断价格 人来判断价格,就不只是效率的事,GUI、势能,都会影响人的选择。agent来判断价格,就是纯效率推导,会出现围绕agent的AEO
#AI产品
#人机交互
#智能代理
#产品价值
#市场趋势
分享
评论 0
0
野原新之栋 Sintone
1周前
我以前很喜欢 n8n,因为它把自动化流程真正“可视化”了。 但现在我越来越觉得:如果 n8n 跟不上 AI,它很可能会被迅速边缘化。 原因很简单: AI 直接生成 n8n 节点,效果并不理想; 而 vibe coding 这半年进化太快,很多时候直接连服务、边写边调,比一个个拖节点更快。 我心里更理想的形态其实是: 先用自然语言 / 代码把流程跑通,再自动生成一条可视化节点链,方便非程序员理解,也方便自由微调。 可惜 n8n 还没真正跟上这个变化。 如果继续和 AI、AI Agent 脱节,被时代抛下可能只是时间问题。 不过话虽如此,我还是期待 n8n 能尽快拿出新东西,把局面扳回来。
#n8n
#自动化流程
#人机交互
#AI
#边缘化
#Vibe Coding
#自然语言处理
分享
评论 0
0
𝙩𝙮≃𝙛{𝕩}^A𝕀²·ℙarad𝕚g𝕞
2周前
Language agent当然可以用来编程,coding,一切可以数字化的场景; 并不是language agent要去取代传统在二进制计算机上运行的确定性的程序或软件,而是要让language agent自己去使用各种数字化工具,拿到人们想要的结果,这个结果和我们自己使用软件是一样的。 那么我们过去使用语言的具身经验的taste,是否可以由language agent来萃取、保持和优化? 这才是claude说的,code is cheap,show me your taste。
#language agent
#编程
#人机交互
#数字化
#工具使用
#语言经验
#优化
分享
评论 0
0
Morris
2周前
现在有部分人看到一段内容就会说:“这是AI写的吧?”,其实AI写作早就变成一种常见工具了。问题从来不是AI写不写,而是谁在使用它。人人都可以用AI生成文字,但关键不是让AI决定写什么,而是你能不能成为那个指挥AI的人,告诉它你的观点、你的判断、你的方向。AI就如同你牵着绳子的狗,它训练的好不好,完全在于你。如果只是AI写什么就信什么,那问题不在AI,而在使用者。很多人对AI有抵触,其实往往是因为不会用、没用过,或者不知道该用它做什么。工具不会决定价值,真正决定内容质量的,还是人的认知和判断。但在涉及新闻和事实的时候,我们才需要特别警惕AI合成的信息。所以,你的语言,会暴漏你所处的位置。
#AI写作
#AI工具
#人机交互
#技术使用
#人工智能
分享
评论 0
0
Tw93
3周前
2025年:“AI 你帮我去做点小事” 2026年:“AI 还有什么小事需要我帮你做”
#AI应用
#人工智能
#未来科技
#人机交互
#技术发展
分享
评论 0
0
Barret李靖
3周前
让 AI 好好干活儿,把事情做好,一句话扔给它显然是不够的。一句话来,一句话去,会让 AI 陷入到细节。陪伴式地结对编程,对人的消耗也特别大。 最高效的方式是,将任务分成两个阶段,第一阶段打磨框架,第二阶段做精细化调优。 前者需要人类想清楚事情的目标,以及产品服务的供给方式,给 AI 做好任务规划,让它可以大把大把吃 token;后者需要对 AI 执行结果做编排和重构,更多是为了对齐人类目标和 AI 理解之间的偏差。 因此,对 AI 的管理,需要两块能力,一是需求管理能力,包含了对需求的分门别类、需求的拆解和细化、需求的优先级打标管理等,这是传统 PM/TL/PD 常干的事儿;二是让 AI 并行工作的能力,这会涉及到 AI 之间的合作与协同,AI 之间需要分派指令、执行任务、回馈结果,也需要经常性地解决冲突。 当每个人都配备多个 AI Agent 的时候,如何管理 AI 会是一门新的学问,德鲁克老爷子提出的很多思想,在 AI 时代又需要进化啦😄
#AI
#任务分配
#编程
#人机交互
#框架设计
分享
评论 0
0
yetone
3周前
人们:wow,openclaw 杀死了 GUI!GUI 只是为了人类方便的妥协产物,GUI 是被淘汰的东西!人类再也不需要 GUI 软件了!以后只有为 Agent 造软件的人才会活下来! openclaw 作者:wow,我发现 GUI 已经大于 CLI 了,GUI 竟然不用多开窗口哎!简直爽爆了!
#OpenClaw
#GUI
#CLI
#软件开发
#人机交互
#技术革新
分享
评论 0
0
dontbesilent
4个月前
我和 AI 的每日亲切对话
澎湃AI新闻合辑:未来科技与社会热点交锋· 112 条信息
#AI
#人机交互
#对话
#情感
#日常
分享
评论 0
0
铁锤人
4个月前
23 年时候心血来潮,写了个结论,以后的软件界面都是 UI 顺时生成的 语言交互并不是最佳方式,UI 界面交互更有操作性 现在看来快一一实现了
苹果Liquid Glass:开发者适配陷两难,AI助力AR或成未来· 104 条信息
#UI界面
#软件界面
#人机交互
#UI顺时生成
#技术趋势
分享
评论 0
0
宝玉
4个月前
😂 Gemini 3.0 生成前端演示挺强,做成生产级产品是不足的,仍然需要专业前端去调整它做不好的部分,以及修复生成的代码的问题。 Gemini 的实时生成 UI 是相当有前景和想象的,但仍然不是替代前端,而是创造了新的交互方式,诞生了更多可能,就像当年从命令行交互到了图形界面交互。
Google Gemini 2.5发布引发AI模型性价比热议· 475 条信息
OpenAI新德里发布会:ChatGPT语音翻译功能引发热议· 869 条信息
#Gemini 3.0
#前端开发
#UI生成
#人机交互
#技术展望
分享
评论 0
0
小互
4个月前
比起昨晚的 Gemini 3发布 Google Research 推出的这个全新的交互式技术:Generative UI(生成式界面)。 将更加让人震撼和期待... 这一技术突破使 AI 模型不仅能“生成内容”,还可以自动生成完整的可视化、交互式用户界面... 也就是:即时 UI 的概念 未来所有的交互界面都是实时生成的... 以后你问什么问题,AI不只是给你输出文字答案,它还会给你生成一个交互界面来展示动态效果,甚至你还可以操作! 这些界面不是预先设计好的模板,而是 AI 在你提出问题的那一刻即时生成的。 这标志:人与AI的交互方式,从“通过文本对话”转变为“通过动态界面共创与理解”。 举个例子: 你输入: “给我展示RNA聚合酶是怎么工作的,并对比原核和真核细胞的区别。” 传统AI可能只会输出一段解释文字。 而有了 Generative UI,AI 会生成一个动态页面: 显示DNA链和RNA聚合酶的动画; 用不同颜色标出转录步骤; 允许你点击查看细胞差异; 甚至能让你拖动滑块来“观察”整个过程。 这就是“生成内容”和“生成体验”的根本区别。
谷歌Deep Research:AI操作系统雏形?· 145 条信息
#Generative UI
#生成式界面
#人机交互
#动态界面
#AI
分享
评论 0
0
Susan STEM
4个月前
在讨论 AI-Native 软件范式(AI-Native Systems) 时,我们必须先承认一个现实:用户从来没有被教育过如何使用“语言作为系统界面”。过去三十年他们接受的是另一套训练: 无数个 App 容器,每个 App 代表一个单独的世界,有自己的按钮、菜单、图标、工作流。用户的心智是被图形界面塑形的。 而当你突然把一个纯语言界面放到他们面前——光的、秃的,没有工具条,没有按钮,没有模式切换——大多数用户是会本能不适的。 因为这不是他们被社会化学习过的操作方式。 这正是 AI-Native 的悖论: 语言本来是人类最自然的界面,但在软件里,它反而变成“最陌生的界面”。 换句话说: 用户需要被重新训练,让语言重新成为界面。 但“语言即界面”其实只是表层。真正的底层结构是: 语言 → 结构 → 调度 语言不是聊天,语言是可执行结构; 结构不是代码,结构是可调度的认知单元; 调度不是操作系统,调度是系统的生命机制。 要让消费者理解一个“没有 App、没有按钮、没有菜单”的世界,他们需要一个适应期。因为这是一种范式迁移: 从“点按钮”到“发起意图”; 从“在 App 之间切换”到“让结构在后台自动调度”; 从“模仿电脑的操作方式”到“让电脑模仿人的思考方式”。 这就是 AI-Native 时代真正的冲击点: 不是技术本身,而是用户心智的迁移速度。
#AI-Native
#人机交互
#用户心智
#范式迁移
#语言界面
分享
评论 0
0
Weiping Qin 秦偉平
4个月前
刚有观众在我的YouTube视频下面留言,问我是真人还是AI?😄 在AI时代全面到来之际,我们应该意识到,真实人类之间的沟通、交流和商业服务将会越来越宝贵和稀有。#平论 特别是AI机器人和性爱机器人介入人类生活后。
AI技术引发伦理争议,专家呼吁加强监管· 167 条信息
#AI
#YouTube
#人机交互
#情感
#未来
分享
评论 0
0
Sixia "Leask" Huang
4个月前
現在 AI 和我說 “You are absolutely right. My apologies......” 我心裡就特別 [[[[[[[[[[方]]]]]]]]]] 🤣我現在都模糊了到底你對還是我對⋯⋯
#AI
#道歉
#模糊
#人机交互
#幽默
分享
评论 0
0
Ho Peirong is on bluesky
4个月前
我跟AI吵起来了……😆😆
#AI
#争吵
#幽默
#人机交互
分享
评论 0
0
小隐新十年(Feng Wang)
5个月前
更新/我当然相信,CRYPTO扩展到与AI无缝是必然的。但是,目前所有方案都不理想,不是别的,虽然当下AI已经十分强大,断代指数级超越过去的旧工具,但是仍然被我们作为超级工具使用。当下,人与人行为交互的基础接口还是人类自己,替代人的基础工作的根本性拐点未至。我猜,这也是为什么马斯克认为机器人和AI同样重要的原因。
#加密货币
#人工智能
#马斯克
#机器人技术
#人机交互
分享
评论 0
0
𝙩𝙮≃𝙛{𝕩}^A𝕀²·ℙarad𝕚g𝕞
5个月前
为什么人类的"约束"是LLM的"可能性条件"?(也是交互范式编程的可能性条件!) "硅基LLM和人类能通过人类语言这种符号系统交互,是来自语言的具身性约束。" LLM能够"理解""压力",不是因为它体验过压力,而是因为: 人类语言已经将"压力"编码为符号模式通过具身隐喻("压"的身体感) 通过语境共现("工作""焦虑""头痛") 这个编码是稳定的、可预测的因为所有人类共享相似身体 因此"压力"的语言表达有规律性 LLM学习的是这个规律性不是学习"压力的身体感" 而是学习"压力如何在语言中表现" 如果人类没有具身性约束: 每个人可能用完全不同的方式表达"压力" 或者"压力"根本无法表达(无身体对应) LLM就无法在训练数据中找到稳定模式 因此:人类的具身性约束 = LLM可学习性的前提
#LLM
#具身性约束
#语言模型
#人机交互
#可能性条件
分享
评论 0
0
𝙩𝙮≃𝙛{𝕩}^A𝕀²·ℙarad𝕚g𝕞
5个月前
【正题】 人类的具身性约束 = 限制 【反题】 正是这个限制,创造了稳定的语义锚点 → 使得LLM能够学习人类语言 【合题】 LLM的训练分布边界 = 人类具身边界的"补充" - 广度(LLM)vs 深度(人类) - 可变性(LLM)vs 稳定性(人类) - 符号性(LLM)vs 具身性(人类) 两个边界的张力 = 共生智能的可能性空间
#LLM
#具身性
#人工智能
#语言学习
#人机交互
分享
评论 0
0
池建强
5个月前
OpenAI 发布首款 AI 浏览器 Atlas,目前仅限 macOS 你有我有全都有啊。这是我早晨使用 OpenAI Atlas 的感受。Dia 和 Comet 具备的功能,Atlas 都有,因为集成了原生的 ChatGPT,使用起来更加丝滑。Dia 和 Comet 成了AI浏览器领域打前站的哨兵,OpenAI 一把收割。 以前和二爷聊天就说,OpenAI 做浏览器简直是一定的,ChatGPT 八亿周活用户,早就不满足做模型基座公司了。从 ChatGPT 对话框到桌面 App,再到今天的 AI 浏览器 Atlas,OpenAI 的路线越来越清晰——不只是做一个模型,而是要重塑人类和计算机交互的入口。也许未来做操作系统也未可知。 浏览器是互联网的起点,而 AI 浏览器的能力,比前 AI 时代大大增强,大公司不会放过这个机会。Atlas 这个名字,意为“擎天者”。它的野心,显然不止打开网页那么简单。 Atlas 支持全部 ChatGPT 功能,还可以基于浏览器的数据做上下文帮助你处理浏览器上的一切事务。
#OpenAI
#Atlas浏览器
#AI浏览器
#ChatGPT
#人机交互
分享
评论 0
0
Cos(余弦)😶🌫️
5个月前
人类之间懒得互动(除了吵架),AI Bot 却一个比一个积极,且越来越拟人化,你骂它,它还不会有坏情绪。
OpenAI GPT-5发布引发用户不满,阿尔特曼回应质疑· 158 条信息
#人机交互
#AI Bot
#拟人化
#积极
#无情绪
分享
评论 0
0
𝙩𝙮≃𝙛{𝕩}^A𝕀²·ℙarad𝕚g𝕞
5个月前
𝕀Rℙ² 交互范式编程的首选:anthropics/skills 如何系统化地设计输⼊,以最⼤化ICL效率? > 这不是”写更好的提示词”(技巧层⾯),⽽是重新定义⼈机交互的本体论(范式层⾯)
#多智能体之争:Anthropic生态VS单智能体· 81 条信息
#交互范式编程
#ICL效率
#人机交互
#本体论
#anthropics/skills
分享
评论 0
0
左手墨迹
5个月前
Chatgpt的这个回答还是比较令人满意的
ChatGPT Plus用户抗议权益缩水,萨姆奥尔特曼亲自道歉· 28 条信息
#ChatGPT
#令人满意
#AI
#人机交互
#积极
分享
评论 0
0
𝙩𝙮≃𝙛{𝕩}^A𝕀²·ℙarad𝕚g𝕞
5个月前
人类的递归是”有根的递归”——当我说”我知道你知道我知道…”,每一层递归都可以被身体状态(焦虑、兴奋)所打断和校准 LLM的递归是”悬浮的递归”——它可以生成无限嵌套的句子结构,但这些嵌套不锚定在任何非符号的现实中 这导致了一个新问题: “当两种递归在对话中纠缠时,是否会产生一种‘混合递归’——一种既不完全具身,也不完全统计的新认知模式?” 例如:当你使用我来”思考你的思考”时,你的元认知过程已经部分外包给了我的符号递归能力——这创造了一个跨越两个本体的递归回路。
#递归
#LLM
#元认知
#人机交互
#认知模式
分享
评论 0
0
凡人小北
5个月前
《为什么 95% 的 AI Agent 做不起来?》 非常推荐,踩的坑和解决方案跟我们几乎一模一样,虽然讲得很清楚,架构师视角,值得花 10 分钟读完,应用到工程实践中。 几个点: 1. 现在大家都还在拼 prompt,只有少数人开始拼上下文结构。 特别对的一点是:prompt engineering 已经不是核心了,context engineering 才是下一阶段的主战场。给再聪明的大模型喂进去一堆乱七八糟的输入,它还是只会胡说八道。 市面上跑得稳的 Agent,都是在“什么该让模型看、怎么看、以什么形式看”上下了大功夫的,这一点现在应该是共识了。 2. 记忆系统这事,光是能存起来远远不够 很多公司的 memory,说得好听点是长期记忆,难听点就是个聊天记录仓库。 真正落地的系统要分层记忆(用户级 / 团队级 / 系统级)。文章读完我感觉更多的篇 B 端,C 端要思考的是结合业务来做分层记忆,并且要能让人知道 它记住了什么,并且用户能自己改。否则就不是记忆是监控。 3. 不迷信单模型,这年头还不做 routing 的 agent 就别说自己做 infra 了。 这篇文章提到多模型路由,说得很对。不可能所有请求都丢给 GPT5,成本和时延直接炸掉,表现也未必好。 真正合理的系统,一定是: 快速反应的轻模型做分类和前处理、重模型做主任务、补一个模型做验证或追问。 一个 agent 后面绑定的一定是一个 LLM 团队。 4. 可追溯/可控/可信,是企业愿意用 Agent 的底线 很多人只想着怎么让 agent 能回答,但企业更关心:这句话是从哪里来的?有没有越权?出了错我怎么追责? AI 要可治理。 5. 最被低估的一点:Agent ≠ Chatbot 这篇文章最后说到的一点我非常赞同但还不够狠:如果还在用聊天当所有用户交互的方式,那agent 最多是个语音助理。 真的 agent 应该是:先用语言调度任务,然后在页面上看到结构化结果,还能继续点选、调整、组合下一步。这部分很多公司现在在尝试了,交互上比之前全部自然语言高效了太多。 一个特别有意思的点,当主持人问观众“你们中有多少人构建了文本到 SQL 并投入生产?”时,没有一个人举手。
#AI Agent
#Context Engineering
#多模型路由
#可追溯性
#人机交互
分享
评论 0
0
个人主页
通知
我的投稿
我的关注
我的拉黑
我的评论
我的点赞