howie.serious

统计数据

471

文章

0

粉丝

0

获赞

2934

阅读

1天前

余华是一个典型的低产作家，但是在书店里随便数了一下，最近一年多里，读客文化（华楠创办的、成功到上市的出版公司）就在余华没有新内容的情况下操刀出版了 8 本余华新书。全部都是同一种封面风格，卖场风封面和文案。内容都是余华早期杂文、练笔、访谈等老内容的排列组合。或许，华与华这种玩法，坑的不只是西贝一家🤣 连我这种余华死忠粉都看不下去啊

2天前

openai 现在有点慌，他们确实也应该慌🥹 gpt-5 预训练撞墙，于是全力转 RL scaling。而这牺牲了普通用户的体验，对话和日常使用体感下降。尤其是 4o 用户严重不满。 gpt-5 版本不说人话，也是预训练不行+后训练过度的结果，虽然 gpt-5.1 修了 bug，但也比不过新的 gemini 啊。 gpt 预训练撞墙，而 gemini 3.0 pro 在预训练上实现了突破，带来了更好的对话和日常使用体验。gemini 现在的优势，可能会继续保持。下面就看 openai 后面会怎么发力了。下周会发新模型，圣诞节期间好像也要连续发布。

2天前

愚民即养蛊，而 ai 可以作为这种蛊的解药。理想情况下，ai 可以让理性的光重新照耀大脑，穿透愚民乌云，让人性发光发亮。（有了 ai 的助力，任何人只要保存基本人性，不被极端情绪和极端立场绑架，就能做出不违背人性的判断，而不用被大脑极其有限的处理信息理性分析能力制约，从这一点上，善莫大焉）（家庭晚餐时聊社会新闻杂感）

2天前

听到父母教育孩子“做完试卷要检查”我就来气。大家都是应试过来的人，哪个做题家不知道检查基本没用，全靠做题时的准确率？（我的观点是，学霸不“检查”，学渣才检查。学霸一定在试卷上验算+做标记，不做标记的肯定100%做对）以前我只是反对，在观点层面反驳但通常无效，最近我总结提炼出了一个新概念和落地实践。🤣 context：和家里小学生用 notion 合作搭建“学习os”，包括路线图、概念库、资料库和错题库等。都是 database，相当趁手。每次考试前都会做一些真题。和小学生讨论错题时有感，随手记录。最近总结了一个做题的目标：（解题时的）元认知准确率（图 1）。方法：解题元认知所有解题，结果分为 4 类：确定+✅，确定 but ❌，不确定+❌，不确定 but ✅；好的、体现学习者具备元认知的情况：确定+✅，不确定+❌；前者完全不用管，后者加入错题库；不确定 but ✅：本质就是蒙的，靠解题技巧或运气可以得分，但本质上是不会，下次遇到还会错。所以，即使孩子做对，我也作为错题处理，加入错题库；最需要重要的、体现学习者不具备元认知的情况：确定 but ❌。这是最需要重视的！孩子需要和 ChatGPT 讨论完错题，然后在错题库中书面总结原因。所以，除了卷面得分，更重要的是学习者做题的“元认知准确率”（图 2）。以小学生昨天做的一套真题为例（图 3），虽然得分是36/50，但是按照元认知层面准确率是 40/50。应该给出大大的 positive reward。👏

2天前

folo 是一个少数的、那种我每天都会用的产品。如果你需要获取高质量信息，从多个信息源中快速筛选适合你的、值得读的信息，用 folo 就可以做到，每天 5 分钟左右一天的信息筛选就完成了。但是，非要强行“➕ai”，每个月付出 10 美金来订阅，对于一个信息筛选工具就偏贵的。作为一个单纯的工具，像 surge 那样，一次性几百块买断，然后针对新的足够牛的功能搞功能订阅，那样似乎会很适合 pro 用户。对于 pro 阅读用户，他们有自己的阅读工作流，自己订阅了好几个顶级 llm，有自己的 ai 阅读 prompt，那么，一个纯粹的信息收集筛选过滤工具就是最理想的。类似 surge。非 pro 阅读用户？根本不会花钱买这样的软件。我买了很多 surge 的授权，全家人所有设备都用。我还订阅了多年的 readwise reader，我感觉这两个产品的模式都挺适合 folo 的。 folo 对于阅读者很有价值，希望 folo 以后更好。🙏

3天前

openai，deepmind，你们那些在国际奥赛上拿金牌的模型还藏着干什么，赶紧端出来吧？ deepseek 都直接把竞赛金牌模型开源啦。 --- 这些在benchmark 中拿到国际奥赛金牌的模型，跟普通ai用户有什么关系？有什么实际的使用场景？是 coding 更强？还是说有其他什么 use case？判断一个模型对普通用户的价值，就看它最强的 use case。gpt-4.5 是写作；o3 是agentic 搜索；nano banana pro 是知识漫画、PPT…… 这些竞赛金牌模型，得大量用户在真实世界测试出有经济价值的 use case，还好理解。

3天前

gemini 最佳实践：if 深度思考，then 信息图总结。每次和 gemini 聊完一个话题，如果是多轮的层层深入的对话，最后有所收获的话，那就多走一步：选择 nano 🍌， > 基于我们前面的对话，画一张信息图，整理核心观点例如，刚才和 ai 聊 llm 强化学习对于父母的启发。语言是模糊的，思想是在多轮对话中逐渐清晰的，和 llm 多轮对话当然是有启发的，但多了信息图总结这一步，相当于又是一轮的总结和提炼。而且是另一个模态的，从文本模态到视觉模态，对于信息消化、理解和掌握都是相当有益且必要的。这个习惯很重要，也是因为 nano banana pro 才让这个新实践成为可能。需要先做个 5678 遍，形成稳定的最佳实践，形成习惯。

#Gemini #信息图 #LLM #强化学习 #最佳实践

3天前

为什么 nano banana pro 的文字渲染和指令跟随，有如此大的进步？以配图为例，分别是大量汉字的 PPT 和知识漫画，这种级别的文字生成，背后的 why，是真正有趣的地方。 === 对于扩散模型（diffusion model），生成图片的本质是去噪（denoising）。模型学习的是图像在潜空间（latent space）里的概率分布，通过预测逐渐减去噪声，逐步让图像“显形”，把一张图片“画”/“雕刻”出来。 dall·e 2和3、stable diffusion 等都是如此。它们本质上是没文化的“画图机器”，处理的是连续的像素值。对于它们来说，图片里的文字只是像素，就像不懂中文的老外，生成的汉字看起来“像”，但笔画等细节是乱七八糟的，因为它根本不“懂”这些汉字。但是，对于 nano banana pro 和 gpt-image-1 这样的原生多模态模型（token in, token out 的 native multimodal transformer），生成图片的本质已经不再是“绘画”，而是“预测下一个token”。对nano banana pro 来说，画面里的汉字，不论是图片还是文字，实际上是同样的数学向量，是“跨模态”的。它生成的汉字，是在用写文字的逻辑，在“写”图片里的汉字，所以拼写错误率极低。

#Nano Banana Pro #文字渲染 #多模态模型 #token预测 #图像生成

3天前

chatgpt 以来，发展了三年的LLM，提供的早已不止是情绪价值。我在2025跨年对谈时就明确认为，2025年，使用ai的关键，是向 ai “要价值”！要直接的、经济的价值！ 2025年的发展，基本上验证了我的判断。本周的ai专题直播，一起聊一聊这三年，这三年的ai学习、应用。欢迎预约直播，本周五直播间见。预约方式：（不知不觉，发现 2025 年已经做了 20 场 ai 专题直播了。每次 2 小时，聊一个 ai 专题。但是我不喜欢公开免费那种，最起码得付个 1 分 2 分钱，也算对参与者兴趣的筛选，哈哈。）

#LLM #AI价值 #2025年 #AI专题直播

3天前

记得给孩子正反馈。再小的成绩也值得庆祝🎉 今天收到通知，我家小学生入围海淀区信息学竞赛小学组第二轮了。👏 虽然 1000 人，但毕竟参赛范围是全区五六年级近 7 万人呢。虽然整个学校入选 35 人，但是作为五年级、女孩，也是挺稀少呢。虽然只是才第二轮，毕竟我们是按兴趣来玩，没有走应试教培路线呢。

#孩子正反馈 #海淀区信息学竞赛 #小学组第二轮 #五年级女孩 #兴趣

3天前

缘，妙不可言。那就 mark 一下：小破号关注数，在 chatgpt 发布 3 周年的今天，恰好 5 万。 👏👏👏 这个号一直都定位为个人“小破号”，文章都是一个人写，之前断断续续发布，注册接近 10 年也不过 2 万关注。但是，从今年 2 月份开始，我和 chatgpt 结对子写作，一起创作内容，到现在大概10 个月，关注数从 2 万增加到 5 万。虽然仍然是个小破号，仍然是“随心所欲”的个人分享，但是，5 万里程碑也是值得庆祝的，哈哈🎉 （中午吃饭加个🍗）

#ChatGPT #结对写作 #粉丝增长 #个人账号 #庆祝

4天前

整整 3 年前，ChatGPT 发布。 3 年后，我们都生活在一个完全不同的、甚至没有想象过的世界。会有人认为 2025 年末的现实，不是曾经的科幻吗？

#ChatGPT #人工智能 #技术变革 #未来 #科幻

4天前

用 nano banana pro 把家里小学生照片转换为卡通风格。

#Nano Banana Pro #小学生 #照片 #卡通风格

4天前

10 年前，我自己手绘 logo。给自己的项目起名叫 candobear。 5 年前，请设计师做 vi，连表情包都要花钱请人做。现在，一句 prompt，基于candobear卡通形象的一整套表情包就出来了🤣

#candobear #AI #表情包 #效率提升 #卡通形象

4天前

昨天走到中国蜜蜂研究所门口遇见他们出摊卖蜂蜜，看到定价，愣了一下，“这是高手”。（他们家的蜂蜜很好，这是讨论价格的前提。）你买不买？你觉得这个定价好玩在什么地方？

#中国蜜蜂研究所 #蜂蜜 #定价 #高手 #有趣

4天前

最近 google ai 模型能力过强，用户增长过快，他们终于开始升级 gemini 的 UI 了。独立的桌面 app 也在开发中。但实际上，桌面 app 远远没有 web app 好用。我的 chatgpt mac app 基本吃灰，因为 web app 才能提供 llm 更完整更好的体验。（如果不做本地 mcp，不操作本地工具，要桌面 app 干啥）更好的方式，是把 chrome 全面升级为 llm-first 的 ai 浏览器。最激进的升级，就是把 mac app 和 ai 浏览器整合成一个 app。当然了，这是过于狂野的一个梦，说不定 2026 年结束前有可能看到🤣

Google Gemini 2.5发布引发AI模型性价比热议· 475 条信息

OpenAI新德里发布会：ChatGPT语音翻译功能引发热议· 869 条信息

#Google AI #Gemini UI #LLM-first 浏览器 #AI 桌面应用 (负面) #AI 发展趋势

5天前

用nano banana pro创作知识漫画，是最有实际价值的ai 作图 use case。想象一下，用这种方式给孩子讲解抽象的数学概念、复杂的编程知识和算法，讲解 ai 原理…… 上午又做了一本《哆啦 A 梦讲解GPT 原理》。开个玩笑说：7 年没搞懂的 gpt 运行原理，哆啦 A 梦 7 分钟给你讲透了🤣 优化了 prompt 和工作流之后，gemini 设计的内容更丰富、更有趣的（内容设计、结尾幽默反转等）。然后丢给nano banana pro，25 张漫画，分分钟就搞出来了。我仔细读了几遍，质量非常高。个别瑕疵，下次做的时候可以轻松解决（页码bug 和个别文字乱码，很容易处理）。下面是全部漫画，分批发出来： p0-p3 第一章：序幕——语言只是概率的游戏？

#知识漫画 #AI作图 #GPT原理 #哆啦A梦 #Nano Banana Pro

6天前

平均每天 10 个垃圾电话。你们是怎么处理的？😭

#垃圾电话 #骚扰 #困扰 #求助

6天前

nano banana pro 的知识漫画太牛了！！！《哆啦 A 梦给你讲解 transformer 原理》：深入浅出、具体形象、寓教于乐。直到现在，nano banana pro 仍然让我震撼。一个简单的 prompt，就能制作这种级别的漫画：把transformer 原理深入浅出、具体生动，用故事讲出来。基本工作流很简单：gemini 3.0 pro 设计分镜，然后把12 张漫画分镜给 nano banana pro 一张一张画出来。 transformer 讲解一共 12 张。你仔细读一读，感受一下，这种“知识漫画”到底好不好，价值大不大？（GOOG 还得加仓🤣）

nanobanana平台助力个人形象照生成，专业形象照引发热议· 107 条信息

#Nano Banana Pro #知识漫画 #transformer 原理 #哆啦A梦 #Gemini 3.0 Pro

6天前

今晚直播，nano banana pro 实战专题。不考虑玩票性质的应用，单讨论对普通人有实际价值的用法。2个小时，一次性讲清楚。直播间链接（文章末尾，点“阅读原文”）：

nanobanana平台助力个人形象照生成，专业形象照引发热议· 107 条信息

#Nano Banana Pro #直播 #实战 #普通人 #应用

6天前

ilya 在最新podcast 访谈里，把人类情绪类比为 RL 中的价值函数（value function）。不论是人脑还是 llm，价值函数对行为给出奖励或惩罚，通过反馈机制来调整和训练神经网络。 ilya 认为，情绪本身是很简单的，甚至有希望被映射为“人类可理解的规则”。在我看来，这已经被中国的注意力商人做到了：xx、xxx 等平台，本质上就是情绪经济，把用户当成奴隶，进行情绪剥削(操纵情绪以进行注意力剥削)。情绪机制非常简单，也容易被算法琢磨清楚并加以操纵，所以，当下的现实，就是群体的情绪被系统性操纵的现实。

#情绪剥削 #注意力经济 #算法操纵 #价值函数 #群体情绪

1周前

mark 一下：2 000 000 小时学习时长。大概就是 2000 个学员，人均 1000 小时。 20000 个学员，人均 100 小时。

#学习时长 #学员 #人均学习

1周前

if 你关注 ai，then 推荐观看这部 deepmind 纪录片。尤其适合家庭观看，顺便聊一聊 ai、游戏、思考等话题。每天吃饭看一点，三次就能看完。这部纪录片去年就电影节放映了，但昨天google 把全片在youtube 上免费放出来了。非常有趣的是纪录片的名字：《思考游戏》（the thinking game）。可以说，最让人敬佩的，不是 demis 得了诺贝尔奖，不是 demis 的智商，而是那种“把世界当成一场思考游戏”的眼光。 ====== 如果把整个人类文明看成一场漫长的“思考游戏”，这部片子讲的，就是一群人如何把这场“思考游戏”本身拆开、重写规则的故事。对他们来说，棋盘、街机游戏、星际争霸、蛋白质折叠，甚至整座虚拟世界，都只是训练一种东西的道具：通用智能。 Demis 的人生像一条被同一问题穿线的轨迹：少年国际象棋天才，在教堂里熬到第十个小时，突然意识到，也许把几百个顶尖大脑锁在一间大厅里只为分出输赢，是在浪费心智；于是转向游戏设计，用主题公园里的“呕吐连锁反应”去逼真模拟人类行为；再到剑桥研究大脑，从神经科学里偷师，最后拉上 Shane，干脆在伦敦创立 DeepMind，明目张胆地说：我们要做 artificial general intelligence。他们选择了一条看起来很“不务正业”的路径：先让系统学会在 Atari 里打 Pong、挖 Breakout 的侧翼隧道，再去下围棋、打星际。强化学习、奖励信号、环境与智能体的闭环，在这些游戏里被一次次打磨：系统一开始连挡球都不会，只知道分数越高越好，最后却能在围棋上下出连职业棋手都无法想象的招法，能在星际里练出堪比职业选手的多线操作。这里有一种残酷的坦诚：你不告诉机器规则，只给目标，它会自己找到通向高分的“人类从没想过”的路径。但真正让这条路线显出重量的，是当他们把同样的思维搬到现实科学问题上。蛋白质折叠这个自 20 世纪 60 年代就存在的难题，几十年里无数聪明人试过，都卡在实验慢、数据少上。第一次参加 CASP 比赛，他们的 AlphaFold 确实赢了同行，却只是在“一个没人解好的问题上解得稍微好一点”。团队后来回看那一届，很坦白：我们知道自己还很烂，这只是最高的梯子，但月亮还在很远的地方。转折来自第二次“总攻”：重写数据管线，把物理与生物学的结构知识真正喂进模型，让系统不再只是模仿，而是内化约束。最终在 CASP14 上，他们的结构精度几乎等于按下按钮得到实验级结果，主持人说，经过半个世纪，这个问题可以宣布被解决了。接下来的一步更激进：既然可以在一个月里预测全已知物种的蛋白质，那就别等别人排队提交序列，直接把全地球的蛋白质都“折完”，免费公布，让它成为人类生物学的基础设施。技术从来不是中性的玩具。AlphaGo 之后的“Sputnik moment”、AI 军备竞赛的隐喻、与曼哈顿计划的对照、对 autonomous weapon 的明确拒绝，以及对 move fast and break things 的公开反感，都在提醒一个事实：当你试图造出一种比人类更强的认知系统时，你不是在做一个新 app，而是可能在改写历史的分界线。连 DeepMind 自己的人都开始担心：也许我们将来要做的，不是说服世界我们已经造出了智能，而是解释我们还没到那一步。这部片子最有价值的地方不在于追星 DeepMind，而在于它把几个关键问题扔在桌面上：什么叫“通用”的学习能力？在一个只看奖励的系统里，价值是如何被编码、被放大的？科学探索和工程冲刺之间，节奏如何拿捏，才不会“死在时间轴上”？当智能被外包给机器，人类该把注意力放在哪里——是新的问题意识、新的制度与治理，还是对自身价值观的重新书写？也许真正值得我们模仿的，不是某个算法或产品，而是那种“把世界当成一场思考游戏”的眼光：敢于承认自己暂时还很烂，敢于在失败里调整节奏，也敢于在成功时把成果毫无保留地推向全人类。

#DeepMind纪录片 #AI思考游戏 #通用人工智能 #蛋白质折叠 #技术伦理

1周前

孔乙己考公，到底是孔乙己的悲哀，还是社会的悲哀？制造孔乙己的社会，如何才能停止制造孔乙己？肉食者鄙，会或许只能靠 ai 休克疗法。

#高考反思：名校情结下的教育之殇· 269 条信息

#孔乙己 #考公 #社会悲哀 #AI休克疗法 #肉食者鄙

1周前

ilya：真正稀缺的是“想法”（idea）和“研究品味”（taste），不是算力。深以为然。在ai 时代，每个人的大脑算力都可以被当前顶级 ai 指数级增强。真正稀缺的，是你关注什么问题，你思考问题解决问题时独特的 taste。

#AI浪潮：重塑就业，风险暗涌？· 140 条信息

#AI时代 #想法稀缺 #研究品味 #问题关注 #独特思考

...