Orange AI
1个月前
最近有一些可能扎心的话不吐不快。 写 MarsWave 的那篇文章阅读突破了三万。 写 MiniMax 这篇文章的阅读数突破了一万。 很多投资人都说,看完之后,对 AI Native 公司增加了很多新的理解,这代 AI 公司已经是完全不同的新时代组织。 很多大公司的老板说,看完之后,感觉自己的组织已经严重落伍了,想邀请我们来分享经验。 生产力带来的组织形态变化是足以影响一个新时代的大变革,我很高兴大家也认为这件事同样重要。 无独有偶,前几天 Karpathy (AK) 也发文感叹自己严重落伍了。他认为编程职业正在经历一场剧烈“重构”,程序员亲手写的代码正变得稀疏且零散。 在他看来,如果能整合过去一年涌现的 AI 工具,生产力本可以提升 10 倍,没能抓住这波红利显然是“能力问题”。 现在,除了传统工程,程序员还必须掌握一个由智能体(Agents)、提示词、MCP、工作流等构成的新抽象层。 面对这些本质上随机、易错且难以捉摸的 AI 实体,开发者必须在没有说明书的情况下,强行上手这件“外星神器”。 在这场撼动行业的“九级大地震”中,如果不想掉队,就只能撸起袖子,投身其中。 时代的变化,往往都是是从工具和组织开始的,然后需要几年的时间,创建产品、触达大众、逐步影响GDP。 这周 Notion 的 CEO Ivan Zhao 写了一篇文章《蒸汽、钢铁与无限心智》,他从宏观历史的视角来看待 AI。 他认为,正如钢铁不仅让建筑变高、更重构了城市形态一样,AI 作为一种“无限心智”,正在从根本上改变我们组织和经济的运作逻辑。 目前的我们,正处于将 AI 这个“新蒸汽机”简单安装在“旧水车”上的过渡期,而真正的变革才刚刚开始。 今年年末和 MiniMax 和智谱的老同事们聚餐,聊到了一些同事的职业选择。 为了更高的薪资去做与 AI 无关的事,令人难以理解。 就像特别有钱的投资人,钱很多,却没有投到 AI 里。 在满是怀疑的泡沫论中,抱着满屋子的钱,成为了被时代抛弃的人。 这世界如此精彩,你却完美错过。 非常可惜。
Orange AI
1个月前
AK 写了一篇播客回顾 2025 年的 AI 发展,它评价 nano banana 是 2025 年最具革命性的模型。 它的意义不止是个卓越的绘图模型,而是一种以图像为媒介的沟通方式。 🍌是图像版的 LLM。 未来还会有的视频版的 LLM。它会是什么? 🍅🥔🌶🍋? AK 原文的翻译: Google Gemini Nano Banana 是 2025 年最令人惊叹、具有范式转移意义的模型之一。 在我的世界观里,大语言模型(LLM)是继 20 世纪 70、80 年代个人电脑之后的又一个重大计算范式。因此,基于本质上相似的逻辑,我们将会见证类似的创新浪潮: 我们将看到个人计算的重生、看到微控制器的等价物(认知核心)、看到互联网的进化(智能体网络)等等。 特别是在用户界面与体验(UI/UX)方面,目前与 LLM 的“对话”模式,其实有点像 80 年代向计算机控制台输入命令行。 文本虽然是计算机(以及 LLM)最原始、最偏好的数据表现形式,但它并不是人类偏好的格式,尤其是在输入端。 事实上,人类并不喜欢阅读长篇累牍的文字——这既缓慢又费神。 相反,人类天生喜欢以视觉和空间的方式来摄取信息,这也是为什么传统计算领域会发明图形用户界面(GUI)。 同理,LLM 也应当以我们偏好的方式与我们交流 通过图像、信息图、幻灯片、白板、动画/视频以及 Web 应用等。 这种趋势的早期雏形当然就是表情符号(emoji)和 Markdown,它们通过标题、加粗、列表和表格等方式对文本进行“装饰”和排版,使其更易于阅读。 但究竟谁能真正构建出 LLM 时代的 GUI? 在这种视角下,Nano Banana 为我们展示了这种未来形态的初步端倪。 更重要的一点是,这种能力的显著之处不在于单纯的图像生成,而在于模型权重中将文本生成、图像生成和世界知识深度交织在一起所产生的“共生能力”。
Orange AI
1个月前
2025 年末,我在阳朔出差的时候,收到了知乎科技的年度盘点邀请。在我坐飞机从桂林回北京的时候,对着窗外的云层,我拿起 iPad 把我的2025年的创业故事记录了下来。 这一年过得太惊心动魄了。前三个季度,我们被传统世界的“慢”拖得几乎窒息,融资流程的繁琐、团队协作的内耗,让我一度看不到希望。后来我们决定孤注一掷,彻底拥抱 AI Native。 以前觉得不可能的事,现在变成了日常。用 AI Coding 让全员全栈,5分钟上线 Nano Banana 2 的新功能……当速度提上来的时候,焦虑反而消失了。 在知乎的「AI 中场时刻」里,我看到了子羽歌的万字长文。他说 AI 眼镜正在成为新的器官。从 Ray-Ban Meta 到国内的雷鸟、魅族,AI 找到了最好的容器。甚至豆包手机的出现,让系统级 Agent 开始接管我们的生活。软件变硬了,体验变实了。 我也看到了许华哲 Harry 对具身智能的回望。他提到的那个焦虑让我感同身受:我们是不是太忙着做量产、做应用,而错过了通用智能那个最大的“西瓜”? 中美在机器人赛道上的分野,软件在 Vibe Coding 下的狂奔,硬件在眼镜和手机上的博弈……这就是 2025 年的众生相。 大家都在这场风暴里,有人迷茫,有人狂奔,但都在用力地活着。 如果你也身处这个行业,或者对 AI 的未来感到好奇,推荐去知乎搜一下「AI 中场时刻」。那里没有宏大叙事的公关稿,只有我们这些从业者最真实的2025年。