池建强
1个月前
池建强
1个月前
今天阿里 Qwen 系列大模型的 C 端产品 千问 App 上线了,我参与了产品内测,写了一篇评测笔记: 对它的第一感受是:简洁、克制、All‑in‑one,阿里终于把产品做简单了。复杂能力收进一个主对话窗口,核心在主 Chat:结构化回答、长文档理解更加稳健,图片、音视频、深度思考和深度研究能力都装一起了。在我看这不是一次升级,应该是重做了一款新产品,并做了品牌升级。 产品简介,有些设计非常精巧: 比如底部这个「+」,用户可以一键录音/录像/拍照/传文件,现场捕捉直接纳入对话链路;比如我想现场录音现场分析转译,并不需要专门的录音软件和设备,录完后导出文件,再把文件喂给大模型,在千问里,这些操作是一步到位的。 「实时记录」这个功能不仅能够录现场,还能直接录制手机系统里的音频,我看了下采用的直播屏幕的技术,比如我想录制一段视频号里的话,并转文字,非常方便。 看英文书,拍张照片给千问,我可以拿到翻译好的文字,也可以得到一个中文图片,拍的书页里的图片都能保留。 多模态真正放到手边了,还贼方便,图、文、音、PDF 在一个窗口里连续处理,体验像瑞士军刀:偏工具属性,面向效率而非陪聊。 显然,千问这个产品阿里是很重视的,他们开始从 B 端基座走向 C 端入口,发力很明显。还有一点是,现阶段全功能免费,额度基本够用。非常值得试一试的产品。
池建强
2个月前
昨天晚上突然发现,貌似谷歌的这个 AI 服务已经对几乎所有地区免费开放了,注意是几乎,意思是得能访问 google//非常严谨的说法。 为了信息的准确性,我问了一些不同地区的朋友,确实,无论是在 Google App,还是在各种浏览器——Chrome、Safari、豆包、Atlas、Dia、Comet——上打开谷歌的搜索框,都能使用 AI Mode 了。如果你的页面是中文,AI Mode 会被翻译成“AI 模式”。 看一下这个产品的发布历史,时间线大概是这样子: Google 的 AI 模式(AI Mode)在 2025 年 3 月首次推出,最初是 Google Search Labs 中的一项实验性功能。 2025 年 5 月 20 日:在 Google I/O 2025 大会上宣布向本国用户推出。 2025 年 6 月:开始在少数国家/地区推出。 2025 年 10 月:该服务扩展到全球 200 多个国家和地区,并支持超过 35 种新语言(包括简体和繁体中文),成为一项全球性的功能。 到了 11 月,能用 Google 搜索的差不多都能用 AI Mode 了。 为什么 AI Mode 这个产品值得拿出来聊呢? 1、搜索这件事,Google 做了二十多年。从最初的蓝色链接,PageRank,到后来的知识卡片,再到现在的 AI Mode,搜索的形态正在发生剧烈的变化。我们可以观察一个现金流和巨无霸产品自身的变革。毕竟 Google 的搜索实在是太赚钱了,而 AI Mode 是无广告形式的对话框,谷歌在革自己的命吗? 2、从全球视角看,这是一件 AI 普惠的事情。根据 2025 年的最新数据,谷歌的搜索用户大概在 50 亿的量级,每天处理约 85 亿 次搜索请求,而 AI Mode 目前是免费提供给所有谷歌搜索用户的,让世界各个角落的用户,都可以体验和使用 AI 的能力。 在我来看,这很了不起。
池建强
2个月前
成为一套独立的系统 周末研究了一下中国的芯片发展,写了一篇墨问,并且发了公众号。 现在这篇公众号文章已经超过五万阅读了。我看了下上个月的的数据,公众号推荐引擎带来的阅读量比我自己的订阅用户带来的还多了。 这说明我在公众号的阅读量,逐渐被推荐引擎接管了。订阅多少、文字性好不好、是不是真情实感,也越来越不重要了。获得算法的青睐才是最重要的。 如果说未来生产内容也被 AI 接管了,谁能看到这些内容也被 AI 接管了,那么,作为人类,是不是就只剩下“看”这么一种选择了呢?文字视频,似乎都是如此。 这让我想起贾樟柯写的这段话: “在北京,相对来说我自己是一个独立的系统,虽然多少有些封闭,但我在其中可以焦点集中地专注于自己的工作。从一开始我就对自己的创作有一个比较完整的规划,希望能够逐渐在电影中建立自己的精神世界。这是一个非常有吸引力的工作方法,让我能不太在意创作之外的事情,包括影展的得失和票房的好坏。因为这两者都不是我的终极目标,让我焦灼的永远是艺术上的问题,而艺术问题是你自己的事情,与圈子无关,与他人无关。” 多好的状态啊,羡慕贾导。也许墨问可以成为这样一种独立的系统?maybe 推特更差,即便这篇笔记曝光是 1 万,打开阅读的能有一百人不错了。
池建强
2个月前
AI Mode 让我把 Google App 放在了首屏 有了大模型,事实上我们还是会使用搜索。Google 的 AI Mode 确实是对搜索很好的补充,幻觉也少,精确谨慎,还是很受用的。 自从 Google App 里在登录态里出现了 AI Mode 之后,我就把这个 App 放在了首页,使用频率还不错。 不过 AI Mode 出现过的场景很怪。 比如 iPhone 上的 Google App 在登录态可以使用 AI 模式,移动版 Safari 在登录态也可以使用 AI 模式。Mac 上的 Dia 只能在非登录态使用 AI 模式。其他浏览器,不管你是否登录 Google 账户,都没有 AI 模式。非常迷。 不知道这么随机,Google 在搞啥呢。这服务目前是免费的,能用上就用着吧。 一周飞一样过去了,现在我们开始双线研发,进展还可以。在不久的将来第一个墨问知识库和 Web 端笔记管理应该就能发布了,敬请期待。 这周依然写了很多东西,但写作和做产品不一样,做产品我大概率知道最近能呈现出来的形态是什么,但写作?我上一周都不知道这周会生产点什么东西出来,但每次打开墨问都能写出一大堆东西,颇为奇怪。 我想这可能是一种“场”在起作用,如果我就此退休,断然不会生产这么多东西,但每天节奏感和使命感双重加持——设计产品、测试、验收,创作,批阅墨问,和用户沟通交流,登山摄影,一周又过去了。又前进了一点点。就这么回事。 我喜欢退休旅居的生活吗?长期看,自身行动已经给出了答案:还是创造点好东西,世界已经这么拥挤了,也不在乎多我这点东西,也许有用呢? 2025年10月24日
池建强
2个月前
昨天 OpenAI 发布了自己的浏览器 Atlas,我写了一篇文章,很多人参与了讨论,其中有两个声音很有趣。 一个观点是 Atlas 很拉胯,存在明显技术缺陷和体验问题,甚至断言这个产品会失败,因为 OpenAI 的 C 端产品能力不行。 昨天的 Atlas 首发确实有不少问题,比如丢上下文,在当前网页对话时有时候会拿上一个网页的内容说事;比如一个英文网页已经完全展示在浏览器了,让 ChatGPT 去翻译,它会告诉你无法读取内容等等。 这些显然是 bug 和工程问题,今天再用时我发现 Atlas 已经提示我更新了,新版本基本解决了我说的上述问题,比如全文翻译: OpenAI 是一家拥有大模型能力和 C 端产品 8 亿周活的公司,这些工程能力不可能对他们有什么挑战。我的预测是,Atlas 会快速迭代,并成为 ChatGPT 的重要入口,甚至是战略入口。 第二个观点是:像 Dia 和 Comet 这样的 AI 浏览器都是打前站给巨头攒经验值的,差不多了巨头一把收割。初创公司和产品没什么机会。 这个观点我在昨天的公众号里也调侃了一句,担心会有误导,今天重点聊聊这个事。 昨天我在文章的最后写了一句:浏览器这个词,也许已经过时了。为什么这么说呢? 以前浏览器主要是浏览网页,同时进行一些动态信息的交互。无论你用的是 Chrome 还是 Safari,基本操作就这些。所以这些浏览器之间是强竞争关系。 AI 时代的浏览器,更像一个个形态各异的 App,它们是同时具备浏览器能力的新型互联网 AI 工具。豆包在这方面走得很超前,移动端豆包和桌面端豆包,完全是不同的形态,但都有豆包大模型加持。巨头战略眼光不可谓不长远。 这些形态各异的 AI 浏览器从传统的强竞争,变成了弱竞争。我以前用了 Chrome 基本不会再用 Safari,反之亦然。现在呢,如同我会同时使用多个大模型一样,我会使用 Dia、Comet、豆包、Atlas……哪个能更好的满足我在某个场景的需求,我就用哪一个。每次打开它们,并不是都要浏览网页啊。