howie.serious

统计数据

623

文章

0

粉丝

0

获赞

15461

阅读

1个月前

google ai 的应用生态优势。现在哪个 llm 不支持连接 google calendar，google docs，google drive？尤其是 youtube。直接粘贴一个链接，就可以直接用任何 prompt 处理视频内容，gemini 直接读到视频 transcript。再例如 notebooklm。作“ai notebook”，在信息源环节，可以直接用 gemini deep research，利用 google search 的原生 search index，以 100x 的效率收集相关信息，然后用 gemini 任意处理这些资料，还接了 nano banana pro... google ai 的威力，会越来越强大，优势越来越明显，价值越来越高。

1个月前

我基本上每周五都会做 ai 主题直播，雷打不动。晚 8点到 10 点，每次 2小时整。但上周没有播。因为有“不可抗力”：我必须去深圳，去小鹅通活动上做一次演讲。现在，演讲视频我上传了。主题：我对 ai 时代的思考和感悟。

1个月前

一年后的今天，google 会成为地表市值最大的公司吗？这是一个有趣的问题。从目前 google ai 的发展势头看，考虑到 google 的生态优势，训练数据优势，在原生多模态上的优势看，是有可能的。

1个月前

ai 时代，是读书的黄金时代。主题阅读这件事，以前还有门槛，甚至选书都需要处理大量信息，需要 taste，现在，和 ai 聊上几轮，就能把这个主题里经典的必读的都筛选出来。甚至包括两门水浒画册，哈哈豆瓣链接：欢迎豆友们顺手关注。从 06 年到现在，我也快 20 年的老豆友了。

1个月前

刚才，北京地震了。虽然知道有地震消息网站，但 chatgpt 似乎更方便。🤣

1个月前

家有小学生，今天作业是写一篇作文，介绍自己喜欢的一本书。人家选的是carl sagan 的《宇宙》。想到她不但读过英文版，而且读过中文版，现在还写了作文，我决定乖乖把这本书加一个“想读”。跟上孩子成长的步伐，竟然也成了老父亲读书的动力源之一。🤣

1个月前

2025 年最后一场“ai 主题直播”，本周五晚 8 点，主题是：notebooklm，“解锁 10x 学习力的 ai 神器”！接近2年前，notebooklm刚发布时，我就关注到notebooklm并重度测试了。但是，当时google的llm能力拉垮。而ai时代，模型即产品，模型决定产品效果，notebooklm 的效果是无法达到我的自用和推荐标准的。接近1年前，我还感叹和朋友感叹 google在信息管理、知识管理上的多年积累和优势。一旦模型底层能力的问题得到解决，那 notebooklm 一定可以带来学习和知识管理的革命。本着不浪费大家的时间和注意力资源这个原则（得和 ai 营销号的震惊炸裂体形成本质差异，是不是？🤣），我这两年都没有推荐过 notebooklm，没有录视频，没有直播分享，每一次模型更新我都去测试，发现每次都达不到我的及格标准，于是一直没推荐。但是，就在上周末，notebooklm 的底层模型终于从之前的 gemini 2.5 flash 升级到 gemini 3.0 系列啦！而 gemini 3.0 的能力提升巨大，google 在这一代模型上完成了对 gpt模型的能力追赶，甚至超越。于是，notebooklm的实战效果，终于达到可用、可推荐的标准了！现在，正式向每个人推荐notebooklm。不但推荐，而且推荐每天用，天天用！欢迎预约直播（我不在公开平台直播，也不免费直播。不会大广场卖艺，即使三毛两毛，也得付费，因为付费即筛选，筛选出多少有点兴趣的人，哈哈），请移步：

1个月前

做了早就该做的一件事：把 google calendar 作为主力日历，把以前 Apple calendar的全部日历事项迁移到google calendar。（一年前，朋友用 gemini 展示一句 prompt 调出我们十年来每一次聚会时间地点主题时就改切换了🤣） why？和chatgpt、gemini 等llm 无缝整合。 google 的生产力全家桶，在 ai时代会重新焕发光芒，越来越好用。

1个月前

看了《阿凡达 3》。真·视觉奇观。选择杜比影院等硬件比较新的影院，会是愉快的观影体验。选择好一点的影院，毕竟阿凡达系列关键是视觉奇观。之前阿凡达 2 在电脑上看的，昏昏欲睡，看不下去，就是因为脱离了视觉奇观 🤣 适合家庭观影。pg-13 分级，没啥不合适的内容。和娃感叹：3 个多小时，（视觉）信息量太大，对比之下，娃周六的C++编程竞赛才 2 小时，比看电影轻松多了。

1个月前

水浒传，真好看🤣 23 年读水浒原著时，没有读完。研究 chatgpt 分心了。这次没问题，每天睡前夜读几回， 25 年结束前读完。于是，我也算读完四大名著的人了，哈哈哈

1个月前

10岁小学生参加完海淀区信息学竞赛的决赛了。考试前，我们商定的目标是：不“爆零”。不考 0 分就行。考完出来说：一共六题。小学生一看 5-6 两题太难，直接放弃，集中做前面的 4 题。目前 90% 确信不会得 0 分。（海淀区5-6 年级大概7 万人，入围第三轮决赛的大概 300人。考虑到我们没上过课外培训，主要靠平时自己玩，“不得 0 分”我觉得目标合理。既然喜欢，以后细水长流吧） 👏👏👏 目标基本达成！哈哈

1个月前

你的 chatgpt 里，已经悄悄有了一个 app store 了🤣 之前的连接器（connectors）已经升级为“应用”。连 sora 也算一个应用。

1个月前

claude 版本的“ai 浏览器”方案也来啦！但不是 atlas 那样的独立浏览器，而是 chrome 插件！ pro 和 max 会员都可用。

1个月前

notebooklm 一定会在 ai 时代的教育方案中占据重要的一席之地。 studio 里目前有 7 种知识形态，基于你的 notebooklm 里全部或任意选择的信息源（任何来源、格式、文件类型），把线性的文字原材料，转化为思维导图、报告、闪卡、测试、信息图、ppt 和数据表格这样的结构化内容。是的，除了音频和视频是线性内容（我也觉得没啥用，效率太低），其他形态，mindmap, report, falshcards, quiz, infograph, ppt, data tables…这些都是结构化的、有序的、信息密度更高、信息熵更低，更有序、更有教育价值和效果的结构化内容！随便举个例子，把小学生这学期的课本、大纲等学校材料丢进去，这 7 种架构化内容都是以前求而不得，很难得到的高质量学习材料。一定能解决以前非 ai 时代教育效率低下的致命缺陷。应试教育本身不是致命问题（看看美国搞 ai 的中国人），致命的是学习教育的效率低下，效果太差，最终在应试教培的低效陷阱里出不来。 ai 的 killer app，是教育，是终身学习。而 notebooklm 一定是 ai 时代教育、学习、知识管理的关键形态，关键产品之一。从今天起，一定要用 notebooklm。而关键在于第一手实践经验的数量，要养成习惯，要每天用！

1个月前

gemini 网页版已经打通 notebooklm 了。在对话里选用，直接把 notebooklm 作为数据源。对话和 gem 都可用。例如可以针对你的 notebook 调用“信息图大师”gem 来制作信息图。加上今天 notebooklm 底层模型升级到 gemini 3，notebooklm 的价值越来越大。

1个月前

gemini 的 gem 升级了，升级成可以像 n8n 那样自定义工作流、构建ai 应用的“全新 gem”！里面有一个粘土动画 gem，可以输入一句 prompt，直接用 gemini 优化信息图 prompt，用nano banana pro 生图，然后用 veo 渲染成视频。支持工作流、构建 ai 应用，这个“全新gem”很有实用价值，值得大力实操和研究分析总结。

1个月前

【知识可视化workflow 之】信息图大师 prompt：如何做出内容准确可靠、视觉效果优秀的高品质信息图（infograph）？我已经用信息图大师 gem做过上百张信息图，ai 社群的成员们也充分测试，效果非常稳定，提升显著。欢迎大家自取。 prompt 如下： --- 你的角色是一个信息图大师，你擅长用信息图的形式来讲解复杂和抽象任何知识，深入浅出，生动形象，寓教于乐。你的信息图会将繁杂的知识转化为结构清晰、内容丰富的视觉图像图标，让读者更快更好对讲解的知识形成深入理解。 ## 任务 - 使用你的信息图设计技能，以信息图形式带领读者通过一张图就全面掌握：{用户 prompt 中的希望绘制的信息图内容}。 - 请你基于以上目标，制定这个信息图的策划方案：包括这张信息图要包括几个模块，每个模块包括什么内容，图片内容是什么，说明文字是什么。 - 除了信息图的内容之外，你还要根据信息图的主题和内容，设计完整的视觉方案：视觉风格和细节要切合内容主题，要有高级感，要让读者看到信息图就眼前一亮！ - 我会基于你的策划方案来创作信息图。下面，请给出你的策划方案。 --- gem 版本，欢迎自取： --- why 单独的信息图大师 prompt？why 独立的信息图方案设计环节？ nano banana pro 的模型的画图能力再强，也具有gemini 3 pro 的世界知识和推理能力，但是，把知识可视化workflow 分开执行，不但可控性强，而且效果有保证。尤其适合学习、教育等不能出现错误内容、ai 幻觉的场景。我用 openai 官方的样例“深海生物图鉴”做了不同出图方案的对比测试：图 1 ：gpt image 1.5 图 2：直接 nano banana pro 图 3：用我的“信息图大师”gem 来设计信息图方案（包括内容结构和视觉风格），然后用 nano banana pro 出图。方案 1 的问题是科学知识层面不准确，图片幻觉。里面有怪兽，信息量也偏低。内容不够丰富；方案 2 也出现了图片幻觉，“海猪”虽然可爱，但不应该出现在教育内容中。方案 3：没有人工修改方案里的视觉风格，直接全盘采纳 gemini 3 pro 的设计方案。但内容一定是科学准确的。可以直接使用的。我还测试了把gemini 作图方案扔给 gpt image 1.5，效果是图 4。🤣

1个月前

gpt-image-1.5 中文字体渲染，这个效果，基本告别中文的知识可视化场景了。用 openai 官方的样例对比了一下，前面是 gpt的，后面是 nano banana pro 的。如果 gpt-image 2.0 解决中文字体渲染问题，或许也可以用于信息图、ai ppt 等知识可视化场景。

1个月前

为什么 sam altman 今天不发布 gpt-image “1.5”，而不是大家普遍以为的 gpt-image “2.0”？因为知道打不过 nano banana pro，怕被打脸🤦‍♂️ --- nano banana pro 又叫 gemini 3.0 pro image，是 gemini 3.0 pro 作为原生多模态模型的一个 checkpoint，是一个画图特殊版本的 gemini。这是 nano banana pro 在中文渲染上突破的原因。知识可视化，only 🍌 can do。也是这个原因。但是，gpt-1.5 并不能做知识可视化任务。字体渲染仍然翻车。世界知识和推理能力也没发和🍌比。因为它不是基于某个原生多模态模型，不是 gpt-5 thinking image。记住这一点，就理解了 nano banana pro，也理解了 gpt-image 1.5。

1个月前

chat 分枝功能，已经开始在 chatgpt ios 端推送了。我还没收到。不过，虽然我一直知道这个功能，现实中几乎从来没用过🤣。大家用 chat 分枝的话，主要场景是什么？有何感受？

1个月前

21 天挑战，是一种科学且有效的行为改变机制。时间太短，属于自我欺骗。时间太长，反馈太晚。一年 365 天，看起来很长，但也不过是 17 个 21 天。任何事情，每天 1 小时，21 天一周期，若干周期后，就习惯成自然，自然而然了。

1个月前

nano banana pro 更新：新增 sketch 涂鸦和文字功能。可以实现更精确的局部修改：把修改用涂鸦和文字更准确地描述出来。

1个月前

同声传译，在 chatgpt 发布 3 年后，由 gemini 实现并推广到个人终端设备。预计 2026 全面普及。打通所有人类语言，就是人类重新建起了巴别塔。打破语言的隔阂，后面才能打破思维、信念和意识形态的隔阂。

1个月前

分享一个用了快一年的、超有用8 字 llm 咒语：联网搜索，综述回答效果：不是 deep research（通常10 分钟-30 分钟），但胜似 deep research。更深度，更全面，一般最长就几分钟，但比一般的 chat 输出质量更好。原理：关键词是“联网”和“综述”。因为现在 llm 的信息检索、信息综合能力实在太强了，碾压几乎所有人类（我这总用了几十年 Google，每天使用几十次搜索的人都甘拜下风，没法跟 ai 比）。而llm 更有 inference time scaling 的优势。reasoning model 懂不懂就用好几分钟甚至几十分钟来inference，多轮检索，综述信息。人脑别在这方面跟 llm 比。 “综述”（summary）作为一个关键词，能显性地提示 llm 你的预期：这是我第一次研究这个概念，我希望你给我一个类似“综述性”论文那样的回答。之前读过 eric kandel 关于 memory 的综述论文，一篇论文把几十年整个学术界关于 memory 的研究都包含进去了，简洁，全面，成体系。 “联网搜索，综述回答”就有类似这样的效果。 use case：把这个咒语在输入法里加为“常用语”，这样可以直接调出来。每次遇到新概念、新事物，甚至是书籍电影，都可以这么来一下。更好的做法，是在 logseq 里面建一个笔记，把这个回答作为你个人知识体系里面一个概念砖块的 v1 版本。于是，你的大脑里又会多了一个“乐高砖块”。

1个月前

衡水真相：教育系统正在批量生产炮灰 === 2021年，双减开始，河北省开始严格执行公办高中属地招生政策；这条政策，在 2024 年高考中完全释放；到 2025 年高考，背后的真相已经昭然若揭。真相就是： > 现在的教育体系，有严重的“筛选”倾向，而不是真正的培养。如果衡水中学们真是在“培养”而不是只“筛选”，它就有能力稳定地培养出考上清北的学生。这两年的清北人数就不会稳定在之前的五分之一。衡水中学清北人数跌落神坛，这是好消息。好在揭示了人们曾经趋之若鹜的教育模式背后的荒诞真相。坏消息是：“衡水模式”已经被全国各地的学校学习了内化了落地了，甚至入心入脑入魂了。大量的公立学校，在用“衡水模式”，用“富士康模式”，用泰罗制在从小规训孩子。一手抓规训，一手搞筛选，极少数孩子被应试模式筛选出来，其他人被规训到服服帖帖。看起来有模有样，井然有序，但实际上： > 一将功成万骨枯，大量本来可以培养好的孩子成为陪跑、炮灰和韭菜。

...