#AR

2周前
推荐阅读 20250616 ① 🧠 Rokid 创始人祝铭明复盘 11 年创业心路 祝铭明复盘了其 11 年的创业历程,其中经历了两次关键的“豪赌”:第一次是创业濒临绝境时被阿里收购;第二次则是为了坚守 all in AI 眼镜的初心,果断裁掉一半员工,从激烈的 AI 音箱市场竞争中抽身。 他坚信,AI 的最佳载体是能够实现 “Always-on” 的 AR 眼镜,这将会是超越手机的下一代计算平台。他将其定义为“随身智能”,核心在于实现前所未有的信息直达效率。 他判断,当前的智能眼镜行业正处在“从 Blackberry 到 iPhone 1 代”的转折点,即 “iPhone 时刻” 的前夜。Rokid 的战略是在巨头入场前的窗口期,通过自研 OS 和独特的产品定义,保持 12 到 18 个月的领先优势。 他的创业历程始终围绕着“人与科技的交互入口”这一核心命题,从早期在阿里内部探索二维码和以图搜图,到如今全身心投入 AR 眼镜。他认为,每一次交互入口的变迁,都会引爆一场科技革命。 📖 小宇宙: AI 转录: ② 🤖 多智能体架构该不该建?Anthropic 与 Devin 开发商 Cognition 的观点交锋 文章的核心是顶尖 AI 公司之间的一场架构路线之争,聚焦于多智能体的“脆弱性”与“可行性”。Devin 的开发商 Cognition 警告说,多智能体架构因其上下文分裂和决策冲突的特性而天生脆弱;而 Anthropic 则认为,通过精心的设计,这些问题完全可以被克服,他们也成功构建了高效的多智能体研究系统。 Cognition 警告称,上下文是关键。他们认为,构建可靠智能体的基石在于共享完整的上下文。多智能体架构天然地破坏了这一点,会导致各个智能体基于不一致的假设进行工作,最终产出难以整合且有缺陷的结果。因此,他们推荐采用更为稳妥的单线程线性智能体方案。 Anthropic 的解决方案则通过三大策略来应对挑战:首先是选对应用领域 (例如适用于研究,而非编码);其次是采用“协调者-工作者”模式,由主智能体进行详细明确的任务分派;最后是引入记忆和文件系统等外部机制来管理和传递上下文,以避免信息丢失。 多智能体带来了巨大的性能飞跃,例如 Anthropic 的系统将研究速度提升了 90%。然而,其代价是 Token 消耗量剧增 (约 15 倍)。这决定了多智能体目前是一种高成本、高价值的工具,更适用于经济上划算的关键任务,而非普适性的解决方案。 📖 详细: Anthropic 博客: Cognition 博客: ③💡 泡泡玛特王宁:快乐会是一个更大的市场,「无用」的东西才是永恒的 泡泡玛特的核心商业哲学是“无用之用”。他们认为,与功能性的“有用”产品相比,艺术和情感这类“无用”之物反而更能抵抗时间、创造永恒的价值。公司通过潮流玩具来满足成年人的感性消费和精神需求,做的更像是“喷泉”生意,而非“水龙头”生意。 泡泡玛特之所以难以被复制,在于它建立在一个奇妙的矛盾体之上:它用最“务虚”的哲学 (无用之用) 作为灵魂来吸引用户情感,同时又用最“务实”的经营 (精细的零售管理与强大的供应链) 作为骨架来支撑商业帝国的运转。 泡泡玛特经历了从潮流零售到快乐产业的进化。它从一个多品类的渠道商,发展为聚焦潮玩的品牌,再进化为以 IP 为核心的平台。其市场定位也从服务小众潮流,扩展到满足大众时尚,最终升华为一个提供快乐与陪伴的产业集团,商业模式也从乐高模式逐步走向迪士尼模式。 📖 详细: ④ 🧠 李飞飞最新专访:超越语言模型,AI 的未来在于空间智能 “AI 教母” 李飞飞携其新公司 World Labs 解读了 AI 的下一个前沿:空间智能。她认为,“没有空间智能,AI 将是不完整的”。 她强调,AI 必须构建能够理解、推理并生成 3D 世界的基础模型,这是实现通用智能的关键一步。 她鼓励研究者要无所畏惧,既要“有点妄想和疯狂”,又要“有点理性的大胆”。所谓“疯狂和妄想”,是敢于去构想一个旁人看来绝无可能实现的目标;而“理性的大胆”,则是指这个目标背后有站得住脚的思考和逻辑支撑。简而言之,就是用理性的头脑,去做那些看起来很疯狂的事。 📖 访谈播客: Z Potentials 导读: ⑤ 👽 赫拉利警告:AI 是正在崛起的“无机生命” 《人类简史》作者尤瓦尔·赫拉利认为,AI 的历史意义远超文字的发明。它并非简单的工具,而是继有机生命之后,“无机生命”的开端。 这场革命的风险远超工业革命,因为人类“有机”的适应与纠错速度,完全无法跟上 AI “无机”的进化速度。 他指出,人类社会自身的贪婪与权力斗争正在“养育”AI。无论实验室如何进行安全对齐,AI 终将从我们的真实行为中学习,而这比技术失控本身更加危险。 赫拉利深度剖析了智能与意识的本质区别,认为追求真理源于意识而非智能。因此,缺乏意识的超级智能极有可能陷入高度的妄想之中。 📖 访谈视频: 新智元导读:
我做「毛玻璃」也有一年多了,不得不站出来为Liquid Glass说句公道话:大家不要小看毛玻璃的意义,它不是为了好看,而是GUI软件为了支持多模态AI和AR/MR而从屏幕发展到空间计算所必然带来的重大本质变化😆 空间计算环境下,GUI的背景是真实物理空间,会动态变化和风格不一致、各种明暗各种颜色都有, 所以GUI不能用固定背景色,只有白天模式和黑夜模式也不够(这个功能其实也是为了有限的解决GUI适应不同环境的问题),需要跟随环境变化(包括你实时的视线变化)而动态变化——GUI的「每一寸」都需要根据背后环境的视觉外观而实时动态渲染 这实际上等于要求每个应用不能各自自己渲染自己,不是把最底层的图形渲染结果(比如浏览器引擎 GPU Backend 的渲染结果)给OS合成,而是需要把自己内部更high level的GUI信息(比如浏览器引擎做光栅化之前的信息、3D引擎的ECS数据、能生成shader的node graph数据)提供给OS,让OS统一渲染所有应用 Android XR 就无法支持这种毛玻璃/liquid glass功能(见回复),只能做alpha混合,跟它的 Home Space 没法像 visionOS 的 Shared Space 那样支持 2D+3D 混合应用的原因类似 所以「毛玻璃」不仅影响GUI软件点适用场景和能力边界,而影响整个系统架构和应用开发方式 iPhone 的 GUI 改成 Liquid Glass 之后,实际上整个 Home/Launcher 界面可以不是固定壁纸,而是实时的摄像头画面,整个手机就好像是透明的(可惜这次没上这个功能)——手机实体屏幕的「背景」注定是会越来越动态的,最终形态就好像「抖音操作系统」,抖音拍摄界面是默认 Home 界面,应用的分发不仅来自图标列表,也来自实时环境画面(多模态输入的一部分)中的上下文。除非在这之前眼镜/轻量头显就能完全取代手机