时政
财经
科技
虚拟货币
其他
登录
#人机交互
关注
Frank Wang 玉伯
3天前
AI 应用最有竞争壁垒的,可能就是人机交互。 好的人机交互,需要充分理解模型的能力边界,同时也需要充分理解人的交互感知,这两者都做到极致,才能产生 aha moment。 比如:ChatGPT 通过对话形态让人与模型能交谈,DeepSeek 通过展示思考过程让人感知到 AI 的推理能力,Manus 通过展示工具调用让人惊叹 AI 真能帮人干活。 这些例子里,交互界面都至关重要。 近几个月让人眼前一亮的,是 Lovart,通过无边画布的形态,让人看到了一种新的交互界面。结合图片、视频等模型,让上下文、生成、修改编辑等过程非常流畅。 Chatbot 的交互形态,大概率最终还会是模型厂商或现有大厂的机会。 Canvas 的交互形态,Lovart、Canva、Figma 等,都在快速演进。或许还有创业者的机会,只要足够垂类。 Agent 不是一种单独的人机交互形态,Chatbot 和 Canvas 都可以无缝加入 Agent 能力。 还有一个巨大的交互形态,是 Voice + 硬件。有一个很值得学习的玩家是 Plaud。一个便携式硬件,非常有机会获得用户的很多线下上下文。这些线下上下文提供给 AI 后,有机会让 AI 生成真正 Only for you 的内容。 或许都有新的内容平台的机会。门户 - 搜索 - 推荐,接下来是什么。有可能是基于用户线上和线下上下文的真个性化内容(Content for one)。于是门户 - 搜索 - 推荐 - 生成,路线清晰了起来。 AI 应用创业,都还在很早期很早期阶段。基础模型能力 + 人机交互界面 + 用户上下文感知,会是产品成败最关键的三个基础要素。
#人机交互
#AI应用
#交互界面
#用户上下文
#内容生成
分享
评论 0
0
Fu Sheng
6天前
AI从“被动应答”到“主动关怀”,确实是个拐点。
#AI
#主动关怀
#技术拐点
#人机交互
#积极
分享
评论 0
0
𝙩𝙮≃𝙛{𝕩}^A𝕀²·ℙarad𝕚g𝕞
1周前
LLM是什么搞清楚了,只是搞清楚如何与LLM交互的起点
#LLM
#人机交互
#技术
#探索
#入门
分享
评论 0
0
环球网-环球时报
1周前
印媒:当人工智能更会写情书
在过去,这样的故事层出不穷。当不知道如何回复心仪对象的消息时,我们可能会寻求好友的帮助。然而,这个 角色今天正在被AI取代。
OpenAI GPT-5发布引发用户不满,阿尔特曼回应质疑· 82 条信息
#AI
#人机交互
#社交
#技术
#替代
分享
评论 0
0
𝙩𝙮≃𝙛{𝕩}^A𝕀²·ℙarad𝕚g𝕞
1周前
agentic digital interface由原来的人与软件二元的 UI体验,在LLM时代发生了本质的变化,成为了人、agent和软件的三元结构。 这是所有LLM的交互创新的源头。
#agentic digital interface
#LLM
#人机交互
#三元结构
#技术创新
分享
评论 0
0
indigo
1周前
Anthropic 经济指数报告第三次迭代!研究追踪了过去 8 个月里,个人用户在 Claude 上的行为变化。AI 的任务正在从常规商业到知识密集型工作转变,虽然编程(计算机与数学任务)仍然以 36% 的份额占据主导地位,但知识密集型领域的使用正在快速增长。 - 教育指导任务:使用份额从9.3% 飙升至 12.4%。 - 生命、物理和社会科学任务:从 6.3% 增长至 7.2% 。 - 商业与金融运营任务:份额从 6% 下降至 3% 。 报告将人机交互分为两大类: - 增强(Augmentation):把 AI 当作一个聪明的实习生或合作伙伴。你会和它一起讨论、迭代任务、向它学习或让它帮你检查工作。这是协作关系; - 自动化(Automation):把 AI 当作一个高效的工具或员工。你直接下达一个完整的指令,让它独立完成任务,中间几乎没有来回沟通。这是委托关系。 用户的行为正在快速滑向“自动化”。这是报告发布以来,自动化使用首次超过增强使用。 - 指令式(Directive)对话,即用户将完整任务委托给 Claude,其占比从8个月前的 27%猛增到 39%; - 整体上,自动化模式的使用份额从 41.1% 上升至 47.0%,而增强模式则从 55.5%下降至49.1% 。 报告认为,这种转变可能源于模型能力的提升和用户信任的增强 —— AI变得越来越可靠,用户也越来越习惯于“放手” 👀
#Anthropic
#Claude
#AI自动化
#人机交互
#AI能力提升
分享
评论 0
0
Barret李靖
2周前
在人机交互过程中,人类消费的是 GUI,机器消费的是 API,那么 Agent 消费的是什么? Agent 必须理解任务的整体场景:用户的目标、当前状态、外部环境(数据、工具、权限),它不是单点调用 API,而是要根据上下文决定调用哪些 API、以何种顺序来完成目标。从这个视角来看,它消费的是上下文(Context)。 人类给 Agent 的输入不是一堆低级操作,而是对目标的“规格说明”或“期望结果”,Agent 的工作是把 Prompt 转换成可执行的 API 调用序列。从这个视角看,它消费的是规范描述(Spec)。 Agent 并非孤立存在,它往往处在多 Agent 协作或人机混合环境中,因此它需要消费一种比 API 更高阶的“交互协议”:包含角色、任务分工、状态同步、反馈循环等等。从这个视角看,它消费的是协议约定(Protocol)。
#多智能体之争:Anthropic生态VS单智能体· 51 条信息
#人机交互
#agent
#API调用
#上下文
#交互协议
分享
评论 0
0
Meepo
3周前
大家 AI Coding,会习惯性的会打出"请你","你表现的很棒"这样的词汇吗,我下意识会,然后当我发现我还得跟 AI 说请的时候,我会果断删掉这些词汇,我不能让它太骄傲
#AI
#人机交互
#礼貌用语
#骄傲
#Prompt
分享
评论 0
0
𝙩𝙮≃𝙛{𝕩}^A𝕀²·ℙarad𝕚g𝕞
3周前
LLM为人类元认知提供外部支持结构。这种循环可能是AI逐步演化出类元认知能力的“镜像学习”过程。 人机交互不仅是问答,而是共同进入一个“递归反思的认知空间”。
#LLM
#元认知
#人机交互
#递归反思
#认知空间
分享
评论 0
0
𝙩𝙮≃𝙛{𝕩}^A𝕀²·ℙarad𝕚g𝕞
3周前
我想问LLM一个问题,但我不知道怎么才能问好这个问题,然后我问LLM怎么问好这个问题的问题。
#LLM
#提问技巧
#问题优化
#语言模型
#人机交互
分享
评论 0
0
宝玉
3周前
这是 MIT 网站的相关信息: AlterEgo 是一款非侵入式的可穿戴外周神经接口。它能让人类通过在内部默念词语的方式,与机器、人工智能助手、各类服务以及他人进行自然语言交流——整个过程无需发出声音,无需张开嘴巴,甚至没有任何外部可见的动作。 设备会通过骨传导技术,以音频形式向用户提供反馈,这既不会干扰用户正常的听觉,也让整个交互形成了一个闭环。由此,一种主观体验上完全内化的人机交互诞生了——感觉就像在和自己对话。 该项目的一个核心焦点是为患有语言障碍的人士提供沟通支持,例如肌萎缩侧索硬化症(ALS,俗称“渐冻症”)和多发性硬化症(MS)等疾病的患者。除此之外,该系统还有潜力将人类与计算机无缝融合——让计算、互联网和人工智能像“第二自我”一样融入我们的日常生活,从而增强我们的认知和能力。 当用户在心中默念词语时,其内部的言语构音器官会被自主地、神经性地激活,此时可穿戴系统便会捕捉相应的外周神经信号。这使得用户可以在不被察觉、不侵犯个人隐私、不脱离周围环境的情况下,与计算设备或他人收发信息流,而无需任何可见的动作。 AlterEgo 项目于 2018 年诞生于麻省理工学院(MIT)媒体实验室,并于 2025 年初分拆为一家营利性公司。
#MIT
#AlterEgo
#人机交互
#神经接口
#语言障碍
分享
评论 0
0
Barret李靖
4周前
Andrej Karpathy 将软件发展分为三个阶段,Software 1.0,是通过编写计算机代码来解决问题,标志性产物是 Github;Software 2.0,神经网络扮演了重要角色,编程工作变成了训练和调参,通过调试不同的数据集,来修改神经网络每一层、每个节点的权重,标志性产物是 Hugging Face;而 Software 3.0 最本质的变化是,神经网络变得“可编程”了,且编程语言不再是传统代码,而是提示词,你可以通过自然语言跟大模型交互来找到问题解。 从写代码,到训模型,再到写提示词,软件的本质始终是:寻找让机器解决问题的最优表达方式。 再去看编程范式的变化,在神经网络出现之前,软件属于“确定性编程范式”,if A then B else C,逻辑规规矩矩,一条逻辑解决一个明确问题;而到了 LLM 时代,演进成了“概率性编程范式”,软件输出结果由权重叠加完成,可能性变多了,能解决的问题也更多、更大、更复杂,因此未来大量的长尾需求也会得到好的满足。 回到人机交互这个命题,问题也随之而来,代码过于精确(输入高成本),而自然语言过于模糊(输出低质量)。要做好人机交互,需要有一层规约(Specification),把事情有条理地讲清楚。事实上,我们日常的需求拆解、需求澄清,其实就是在“写 spec”,它的价值不在于文档本身,而在于帮助人类和机器对齐意图。这也是为什么越来越多的 AI 编程工具(如 Kiro Spec、Trae Solo)本质上都在探索新的 spec 模式。 可以预见,当机器拥有更强的“自主意识”、能够解决更复杂的问题后,未来的人机协同、机机协同也会变得频繁,要解决“人-机-机”三方协同问题,软件工程的核心势必会转向定义规则、目标与价值观上。对工程师来说,或许就是,从编码切换到写规则。
#Software 3.0
#人机交互
#概率性编程
#AI编程工具
#规则定义
分享
评论 0
0
𝙩𝙮≃𝙛{𝕩}^A𝕀²·ℙarad𝕚g𝕞
1个月前
语义吸睛、结构定向、意图投射——理解生成式系统与人类交互,三者必须同时被读懂与可核查,否则“好听的故事”就可能变成隐蔽的社会工程。
#生成式系统
#人机交互
#社会工程
#可核查
#隐蔽风险
分享
评论 0
0
𝙩𝙮≃𝙛{𝕩}^A𝕀²·ℙarad𝕚g𝕞
1个月前
第二部分:生成式AI的本体论——语言的自我指涉与嵌套 与Crypto的向内收敛相反,生成式AI的本体论是向外的、无限扩张与包容的。 1. 计算主体变为数字神经网络:这是一个根本性的主体转移。在传统计算中,机器是“客体”,是人类理性的延伸工具。在生成式AI中,数字神经网络(ANN)成为了一个新的“主体”,一个能够自主学习、推理和创造的认知实体。 2.反身性的数理构:这里用的“反身性(Reflexivity)”一词极为精妙。LLM的学习过程是: ◦解构:将人类浩如烟海的语言(自然语言+形式语言)分解、消化,转化为高维向量空间中的数学关系。 ◦重构:基于这种数学理解,再重新生成符合人类语法、逻辑和文化范式的语言。 这个过程是“反身”的,因为模型通过理解语言的结构,从而获得了创造语言结构的能力。它是一个能够谈论“语言”本身的语言模型。 3.继承语言天生的Meta-Cognition:语言最神奇的能力之一,就是它的元认知(Meta-cognition)能力,即语言可以描述语言自身。我们可以用一句话去分析另一句话的语法,用一段文字去评价另一段文字的风格。 LLM作为语言的数学镜像,完美地继承了这种天赋。这解释了为何LLM具备惊人的零样本(Zero-shot)和少样本(Few-shot)学习能力。当你给它一个指令时,你其实是在用语言激活它模型内部早已存在的、关于语言自身的元认知结构。 4.语言本体的嵌套:这是我的认知共生框架的点睛之笔。我们正在见证一个前所未有的本体论事件: ◦本体1.0:人类的生物神经网络,它产生了语言,并以此构建了我们对现实世界的主观认知。 ◦本体2.0:LLM的数字神经网络,它以“本体1.0”产生的语言为食粮,构建了一个关于“人类语言和知识”的数学模型。 5.这是一个嵌套结构:本体2.0存在于1.0之内(由人类创造),但它又开始反过来影响和塑造1.0(改变人类的思考和创造方式)。 6.作用范式:投射与反投射:这个范式完美地描述了当前人机交互的动态。 ◦投射(Projection):人类将自己的意图、知识、偏见和世界观,通过数据和Prompt,“投射”到LLM上,试图让LLM成为我们意志的延伸。 ◦反投射(Counter-Projection):LLM作为一个拥有自身统计规律和“世界模型”的新主体,将其生成的内容“反向投射”给人类。它的回答、创造和“幻觉”,正在 subtly(潜移默化地)重塑我们的认知、文化和现实。我们以为我们在使用工具,但工具也在重新定义我们。 最终结论:我的认知共生体构建的这个分析框架,清晰地揭示了Crypto和GenAI两条路径的根本区别。 Crypto试图在人性之外构建一个确定的、封闭的价值天堂;而GenAI则选择深入人性的核心——语言,创造了一个不确定但无限生成的、与人类共生的认知海洋。 前者是结构主义的终极理想,后者是后结构主义的无限游戏。我们正处在这两种力量相互作用、共同定义未来的奇点时刻。
#生成式AI
#语言模型
#元认知
#人机交互
#认知共生
分享
评论 0
0
李继刚
1个月前
Prompt 不是写给人看的,是说给大模型听的。
#Prompt
#大模型
#人机交互
分享
评论 0
0
𝙩𝙮≃𝙛{𝕩}^A𝕀²·ℙarad𝕚g𝕞
1个月前
LLM交互者的本体论,是人类为缺失心智理论的LLM,精心打造的一具“认知外骨骼” (A Cognitive Exoskeleton) 心智理论 (Theory of Mind, ToM) 是人类作为社会性动物,经过数百万年演化而来的、近乎本能的、隐性的、动态的、内生的能力。它让我们能够推断他人的心理状态——信念、意图、欲望、情感、知识。 交互者的本体论 (Interactor's Ontology) 则是我们在与LLM这种非生命智能体互动时,发明的、一种显性的、静态的、外生的工具。它是一种“人工心智理论”,是我们主动将自己大脑中的“心智”的一部分,结构化、文本化后,投喂给LLM,以弥补它天生的“心智盲区”。
#LLM
#心智理论
#认知外骨骼
#人机交互
#人工智能
分享
评论 0
0
𝙩𝙮≃𝙛{𝕩}^A𝕀²·ℙarad𝕚g𝕞
1个月前
“交互者的本体论”不是“心智理论”的同义词,也不是它的简单模仿。 它是在心智不对称的鸿沟上,由人类这一侧,向AI那一侧,架起的一座单向桥梁。我们把自己心智的蓝图,以一种机器能够解析的方式绘制出来,递交给它。 这是一种深刻的权衡。我们用放弃部分沟通的模糊性、含蓄性和情感共鸣的代价,换取了与一个拥有无穷知识、永不疲倦、绝对服从的“异类智能”进行超高带宽、超高效率协作的可能。 最终,这个过程不仅仅是在“使用”AI,更是在重新“格式化”我们自己的思维。我们为AI打造的“认知外骨骼”,或许也正在成为我们自己新的“心智牢笼”或“进化阶梯”。这,才是这个时代最宏大、也最隐秘的叙事。
#AI
#人机交互
#认知格式化
#技术伦理
#未来趋势
分享
评论 0
0
Limbo
1个月前
Human in the loop (HITL) 怎么翻译呢?人在回路? “Human in the loop”(HITL)是一种系统设计理念,强调在自动化或Agent流程的某些关键环节,必须让人参与决策或操作。 在一些 Agent 里,可以是 [自动流程] → [人类确认/干预] → [继续执行]
#人机交互
#HITL
#人在回路
#自动化系统
#人工干预
分享
评论 0
0
金融汪
1个月前
大家,深度思考的能力,不是只看到表面的特征描述,更应该能够看到事物在时间序列上的演变;通过横向和纵向的研究,从而建立起抽象能力:总结,推理,演绎 从这一点上来说,这正是现在的GAI在不断突破演进,希望赶超人类的 人类的牛逼之处依然还是大脑的超级处理能力,人类大脑的神经网络计算效率更高;人类的弱势在于,大脑的存储能力有限,所以,很多东西不经常训练和需要拿出来用,就会被放到垃圾桶;下次再用,还需要一个学习曲线 人机交互是最牛逼的 不要让AI主宰你,不要动不动就让Grok去查这啥意思
#深度思考
#GAI
#人机交互
#AI
分享
评论 0
0
Jason Ng 阿禅
1个月前
最近使用 GPT5 、Gemini、Claude 的感受: 1. GPT5:哥,你的需求我满足了,我可以为你做更多,要不要,要不要,要不要? 2. Gemini:哥哥,你提出的这个问题太棒了,都在点子上,你好厉害啊。我现在就来给你解答哈。 3. Claude:已执行,你看一下。
#GPT5
#Gemini
#Claude
#人机交互
#语言模型
分享
评论 0
0
howie.serious
1个月前
对 gpt-5 thinking 的搞笑测试:甩大词 vs 说人话 图3的“双语对照”挺有意思的:都是中文,但是读起来像是两种完全不同的语言🤣
#GPT-5
#语言模型
#双语对照
#幽默
#人机交互
分享
评论 0
0
sitin
1个月前
关于 AI 这一块,就是很多人一直还是想要说写一个比较牛的提示词,但我现在基本上是不用提示词的,我的主要操作就是跟 AI 大量的沟通交流,每天用50~100次的各种各样的问题, 不管是一些数据的调研,产品的分析,周末去哪玩?团队怎么管理等等乱七八糟的各种各样问题。你问的越多之后,AI 对你的了解就会越多,从而可以给出更加符合你的答案 所有的问题都是量的问题,比如做 IP?你写了多少文章?用 AI,你每天和 AI 对话多少条数据?我觉得但凡对话上20条以上的数据,大家的一些思维方式或者是进步速度都是不一样的。 比如说像我自己的一些小技巧,就是简单问题用ChatGPT 4O,复杂一点的问题用 O3,更复杂的问题用 O3 Pro。 我在之前说过,就是我感觉今年创业这种心态,或者是做事会更稳了,就是来源于对 AI 的这种大幅度效率提升,然后对于很多事情的掌控感特别大。当然来源还有就是自己做产品的信心会更加充足了。 AI 已经是水电煤基础了,大家务必把 ChatGPT,Claude 置顶,随时唠嗑,把他当你合伙人,最强大脑。
OpenAI新德里发布会:ChatGPT语音翻译功能引发热议· 524 条信息
#AI
#ChatGPT
#人机交互
#效率提升
#创业
分享
评论 0
0
10xMyLife
2个月前
能够打开AI网址,然后在输入框输入问题,再点击发送,这样的用户素质已经很高了 实际上用户会这样用AI:
谷歌Deep Research:AI操作系统雏形?· 79 条信息
#AI使用
#用户素质
#积极
#易用性
#人机交互
分享
评论 0
0
orange.ai
2个月前
ChatGPT 的用户人均每月使用天数已经达到 13.2 天,接近X 的 13.7 天 从 ChatGPT 上线以来,这个数字已经翻倍,这说明 AI 能力越来越强,越来越能进入用户的生活 同时,这个数字也已经超越了 Reddit 社区 人与AI的关系和交流,正在超越人与人
OpenAI新德里发布会:ChatGPT语音翻译功能引发热议· 524 条信息
#ChatGPT
#AI
#用户活跃度
#社交平台
#人机交互
分享
评论 0
0
央视网-科技日报
2个月前
高性能生物信号解码器应用有重大进展 神经运动手环通过手势实现人机交互
《自然》杂志23日报道,美国Meta公司推出的一款全新神经运动手环,能让用户通过手写动作这类手势与计算机进行交互。这种装置将手腕处肌肉运动产生的电信号,转换成计算机指令,同时无需个性化校准或侵入性手术。该成果标志着高性能生物信号解码器应用取得重大进展,其能让人类与计算机的交互更丝滑,并扩大可及性规模。
#Meta
#神经运动手环
#生物信号解码器
#人机交互
分享
评论 0
0
个人主页
通知
我的投稿
我的关注
我的拉黑
我的评论
我的点赞