池建强

统计数据

95

文章

0

粉丝

0

获赞

489

阅读

3周前

很少人脑子不成长，以为别人也不成长，还以为我天天写技术文章呢，我做极客时间都多少年了，营收几个亿，付费用户一百万。做墨问创业也快三年，还没死活得还特别舒服，我这是在干嘛，在成长啊，人都得成长，别搞得自己跟窝囊废一样。

#个人成长 #商业营收 #付费用户 #创业 #积极

3周前

很多人永远搞不清楚在自己地盘写东西和去别人的评论去嘲讽和骂人的区别。比如我对冯大辉老师很不满，比如啊，那我可能会自己写文章吐槽冯老师，这个不好那个不好，对吧，这个没问题吧。我在自己客厅，不违法的内容，不违背伦理的内容，我都可以说，可以写，对不对。但是，如果我把这些内容直接扔到冯老师的公众号评论区里，那就是我傻逼了，成了完全没有网络社交礼仪的人。那被人拉黑还不是活该吗？这是区别。

#网络礼仪 #社交规则 #评论区行为 #冯大辉 #负面评价

3周前

看到有人吐槽公众号排版，我自己在上面写了 13 年了。每次排版时间不会超过五分钟，一般就是一分钟搞定，很多人把自己的版式搞得花里胡哨，何苦呢，搞各种五颜十色的标题能给你带来阅读量还是能带来钱啊？公众号给我们公司至少带来一千万级别的营收，我肯定感谢这个平台啊。

#公众号 #排版吐槽 #营收 #平台感谢 #简单高效

3周前

不仅蠢，还是一种自带优越感的蠢最近微信的推荐确实在改进，比如这篇：996 正在“入侵”硅谷，月初发布，一周内大概一万阅读人数，最近被捞出来推荐了，到现在有 3.6 万阅读人数，这不就来了很多非关注者的阅读嘛。我现在的评论权限都很宽松，关不关注，都可以评论，这就导致评论内容良莠不齐。比如附图。其实这个评论者根本没必要说第一句话，完全是忍不住要嘲讽并展示一下自己的优越感，但别人一看就很愚蠢，如果你只说后一句，最多是逻辑有点问题。但前一句展示的不仅是蠢，还是一种自带优越感的蠢。最近冯大辉老师在 X 上发了一篇文章里也谈论了这个问题：有些网友反馈问题的时候，如果把那句骂人（嘲讽）的话去掉，并不影响他们的内容的表达。就好比我们日常跟亲人或朋友吵架的时候，最后那句表达情绪的话是最愚蠢最伤人的，根本没必要说。如果你不会好好说话，那么这个世界迟早告诉你，应该怎么说话。 2025年9月27日

#微信推荐 #996入侵硅谷 #评论区乱象 #优越感嘲讽 #好好说话

3周前

Nothing Phone 这个基于大模型操作 App 的实现，通过 AI 语音控制，不就是大家想要的 Siri 的功能吗？这款手机有点越用越喜欢了

#Nothing Phone #AI语音控制 #Siri功能 #用户喜爱 #大模型应用

3周前

北京时间凌晨，OpenAI 为 Pro 用户上线了了一个新功能：ChatGPT Pulse 预览版，据说后续会扩展到 Plus 用户，最终面向所有人。以前大模型都是问答，被动响应，这次的 Pulse 的核心是主动：不用提问，AI 会在你睡觉时自动做研究，早上以主题卡片的形式为用户推送一些个性化更新。它能做什么呢？ • 结合你和 ChatGPT 的聊天记录、反馈以及连接的应用（Gmail、Google 日历等），生成当天的精挑内容。 • 想去三亚旅行？它可能推天气、攻略、机票折扣。 • 提到了今天牙疼，会推送牙齿健康和相关医疗信息。 • 连接日历后还能草拟会议议程、提醒礼物、推荐出差餐厅。 • 连接 Gmail 后会帮助你总结邮件信息。有趣的是，Pulse 是“可结束”的：每天一批精选内容，看完就结束，不诱导你无限刷屏。更新也是当天有效，除非你将其保存为对话或继续追问。用户代价是什么呢？需要开放大量个人数据，比如聊天历史、邮件、日历，当然我们也可以只开放聊天记录，这些都需要用户手动点同意才行。虽然 OpenAI 一直声称有多重安全过滤，但细节并不透明，隐私与信息茧房问题依然是值得关注的。以前我们和 AI 聊完，它会主动寻找其他方向问用户是否还需要做点什么，现在更进一步：不仅整理信息，还能主动制定计划、总结邮件、根据聊天信息提供行动方案、关键时刻提醒等等。这个模式如果反馈良好，很多大模型会跟进，人类会增加一个更聪明的信息入口。前提是，你得一直在和这个 AI 聊天和问答。这形成了另一种粘性，哪个模型你用的越久，你就越离不开它。是时候选择一个好模型一直用下去了。

#ChatGPT Pulse #OpenAI #个性化信息推送 #隐私风险 #AI助手

3周前

北大教授俞孔坚在巴西坠机身亡，当天曾发视频称“探秘刚刚开始”；事发时小飞机突然失去高度坠落并爆炸，机龄 67 年。人生无常，有想做的抓紧做该去现场的，还是得抵达现场

北大教授俞孔坚巴西坠机身亡，生态理念捍卫者陨落· 3 条信息

#俞孔坚 #巴西坠机 #北大教授 #飞机事故 #人生无常

3周前

查理·柯克被枪击的事情 Google 一下全是新闻，为什么问 Gemini，回答是这个样子了？给它提供了很多链接，都说是假新闻？这 AI 真是邪门。ChatGPT 一开始也说是假的，喂了几条新闻说是真的了。

查理·柯克遭暗杀事件：屋顶枪手引发恐慌· 179 条信息

#查理·柯克 #枪击事件 #假新闻质疑 #AI 偏见 #信息验证

3周前

Linux 和 Git 都是 Linus 的伟大发明，这样的时代正在离我们远去。

#Linux #git #Linus Torvalds #开源 #技术

4周前

Apple Watch Ultra 3 到了你要问我有什么变化，我只能说，嗷嚎，屏幕看起来亮了一些。这是唯一能从外表看出来的一点变化了。下午把 Ultra 1 解绑，移除 esim 卡，旧表放起来准备抵个折扣，把新表换上，esim 弄的很不智能，需要下载一个“和多号”App，重新搞一遍才行，费点事，反正都就绪了。试了一下，还真是亮了一点，斜着看也能看清楚了，据说极端气候中很有用。为此，我准备在十一假期里去找一找极端气候。主打一个：哪里有风雪，哪里就有我。二爷问我值得买吗？我说有钱就值得。其实这次 Ultra 3 除了亮，比较吸引我的还有这么几点：续航提升，正常使用最长可达 42 小时。也就是说可以两天一充，睡觉戴就很方便了，这次也新增了睡眠评分的功能。其次是 Ultra 3 加入了 5G 支持，信号覆盖和联网能力在弱网环境下表现更好，我喜欢跑步，以前不放心还是会带个 iPhone，这次看起来可以完全解放手机，通过网络听歌听播客也不在话下了。第三就是芯片升级到了 S10，带来了更快的响应速度和更高的能效。没了，至于防水等级达到 100 米，支持水肺潜水和高速水上运动，云云，我特么坐个船都能晕死过去，水下两米就想启用 SOS 功能的主，恐怕也不会用到水肺潜水这种高级特新吧。用用看。

1个月前

昨天打了个车，司机开起来像是在驾驶战斗机，油门和刹车要么不用，要么用到底，短短 9 分钟，我特么都快飘起来了，忽左忽右，忽前忽后，贴地飞行，差点给我干吐了。好在时间短。到了酒店当司机师傅说，请带好随身物品的时候，油门已经开始隐隐轰鸣起来，我说：谢谢。这时候我想起了老罗吃完西北对服务员说的，挺好。

#出租车 #驾驶体验差 #速度快 #恶心 #幽默

1个月前

具体信息在这里：我用的镜片是尼康的，4000 一片。建议你收藏起来，因为几乎所有人最后的结局都是老花。除非岁数不够。

#尼康镜片 #老花 #视力健康 #消费建议

1个月前

AI 绘制图像，确实和人拍的各有千秋，但写作完全依赖 AI ，写出来的基本没法看，各平台也不会给你流量的。 AI 辅助写作是没问题的，查资料一个顶五个，还能给思路和启发，价差错别字，润色，但最终你得完成个人风格写作。

AI视频井喷：Midjourney领跑，多模态混战· 251 条信息

#AI绘画 #AI写作 #辅助写作 #个人风格 #流量

1个月前

上午墨友在群里推荐播客，我想了想，自己有阵子没听播客了，就说，没什么想听的，说完觉得有点扫兴。这就像是一群小伙伴在讨论中午去吃汉堡还是去吃馅饼的时候，一个中年男人站出来慢吞吞的说，我不喜欢吃饼。谁特么问你啦？你不喜欢吃饼我还不喜欢传球呢，你个老登。这件事引起了我的反思，于是中午点了个饼。最近我发现以前挺喜欢的事儿——比如玩游戏、出行、听播客——突然就失去了兴趣。人不想动，在北京就挺好，播客有阵子没做了，我感觉大部分播客的信息密度都太低了，絮絮叨叨的，实在听不下去。很多朋友也很久没见了。有墨友说播客这事主打情绪价值和通勤陪伴，那我听音乐是不是更香呢。对我来说是的。二爷说，好像好奇心被磨钝了一样。我觉得是，人年龄越大，对愉悦的耐受度也变大了。就是你并不容易找到一件让自己特别开心的事。最后我发现，能一直让我找到心流状态的，还是创作。比如写作、摄影、设计产品等等，这些东西似乎一直有种生命力，驱动着我内心的小火苗，不会熄灭。

#播客 #中年危机 #创作 #兴趣 #北京

1个月前

为什么 Vibe Coding 没有自己写代码快乐？写过程序的人可能会知道，编程写代码是会让我们进入心流状态的：设计系统架构、数据结构、把逻辑画出来、UI 摆上，打开 IDE，摆好机械键盘，把这些东西噼噼啪啪敲进光标闪烁的屏幕里。点个 run，发现有问题，改为 debug，哦，卡住了，看看哪里出了问题，原来出了 Exception，try catch，打断点，单步调试，一点点逼近答案，解了。程序跃然屏幕之上。其实很多工程师喜欢编程，喜欢的是这个透明的心流过程。 Vibe 呢，写一段自然语言，回车。没事了，剩下的就是等待，喝咖啡，吃点东西，刷手机，上个厕所回来，咦，这些 Agent 还没跑完。这他妈能有啥意思？

#Vibe Coding #编程心流 #工程师 #debug #效率

1个月前

Oracle 这个老牌传统企业这是搞啥呢？拉出了一条垂直上扬的直线啊，甲骨文公司股价开盘后涨幅迅速扩大至40%，总市值接近9500亿美元，一日增加2700亿美元。创始人拉里·埃里森的个人财富在一天内暴增近1000亿美元，创下有史以来单日最大财富增长纪录。多久没听过 Oracle 新闻了？这是偷摸赚大钱啊。当年看过 Oracle 创始人埃里森的俩桥段，一个是去大学演讲，被哄下来，第二个是乔布斯回苹果的时候，埃里森说，要不我把苹果买下来得了，你去当 CEO。 1996 年，乔布斯还在 NeXT 的时候，苹果已经快完蛋了。1997 年乔布斯准备回归苹果，但当时他并没有绝对的控制力。埃里森是乔布斯的密友之一，当时两人有过一次著名的对话。埃里森半开玩笑半认真地说： “要不我把苹果买下来算了？你直接去当 CEO。” 乔布斯摇头拒绝了。他说，如果“买下苹果”再上台，这会让外界觉得苹果是“被收购重组”的公司，失去了独立性和灵魂。他坚持要通过正常的商业博弈回归。后来，苹果用 4 亿美元收购了 NeXT，乔布斯顺理成章地重返苹果，开始了传奇的“二次创业”。而埃里森也在苹果的董事会里坐了几年，算是陪伴乔布斯度过那段关键时光。算一下这老爷子也 80 了。

#甲骨文股价暴涨 #拉里·埃里森财富暴增 #乔布斯与埃里森 #苹果收购NeXT #科技巨头

1个月前

浏览器语言英文，线路选对，Google 的 AI Mode 就出来了，不过不支持中文搜索，强行用英文做了交流，并没有看到比 Perplexity 更强的地方。等支持中文了再试试

谷歌Deep Research：AI操作系统雏形？· 95 条信息

#Google AI #英文搜索 #perplexity #AI体验 #不支持中文

1个月前

iPhone 和 iPad 接连收到提醒，iOS 26 和 iPadOS 26 的正式版本好像给 beta 用户推送了。我的 iPhone，还能战否？

iOS 26 Beta 2：流畅优化难抵卡顿发热· 160 条信息

#iOS 26 #iPadOS 26 #beta 用户 #iPhone #iPad

1个月前

Claude 这条路在中国企业这里彻底断掉了 9 月 5 日这一天，Anthropic 在官网发布了一则消息：立即停止 Claude 向中国资本控股企业提供服务。所谓“控股”，指的是持股比例超过 50% 的企业，这一政策覆盖的可不仅仅是大陆公司，事实上大陆公司本身也用不了。这个策略同时包括那些在境外注册，但有中国资本或股东背景的公司和组织。目前看起来，Claude 这条路在中国企业这里彻底断掉了。 AI 的地缘政治过去二十年，互联网科技产品大多强调“全球化”。硅谷的产品可以在北京、东京、柏林同时使用，哪怕偶尔有审查或功能阉割，底层的技术逻辑还是相通的。但到了 AI 时代，这条路越来越窄了。先是芯片，后是软件。 Anthropic 在公告中说，这项措施是为了“应对法律、监管与国家安全风险”。换句话说，AI 已经被当作战略资源。和石油、芯片一样，AI 模型不再是单纯的商业工具，早就被嵌入到大国博弈的棋盘里。这一点在 GPT-4 之后已经很明显。美国政府把最先进的 AI 模型看作“国防资产”，严格控制其出口与使用范围。现在 Anthropic 的决定只是把这种控制明确落地到商业规则中：你是谁、你后面是谁，这决定了你能不能用 Claude。有意思的是，Anthropic 并非只针对中国，公告里明确提到，这一政策同样适用于美国认定的“对手国家”，比如俄罗斯啊、伊朗啊、朝鲜等等。 blacklist，在这份名单上，中国的体量让事情变得敏感起来。这件事让我们也看到另一层逻辑：这也是商业上的风险规避。Anthropic 不希望自家模型被用于可能引发地缘冲突、规避制裁或触及安全边界的场景。对于一家需要不断融资、依赖美国政府关系的公司来说，这个选择也不意外。直接一点，这对于中国企业来说，意味着什么呢？如果你是一家 AI 初创公司，哪怕是注册在新加坡、开曼群岛，只要背后有中国资本背景，无论是中国的 VC 还是大公司投资，都将无法继续使用 Claude 的服务。Anthropic 说的非常明白，这是为了避免中国企业通过设立海外子公司、购买第三方云服务来“曲线救国”。比如字节的 IDE 工具 Trae，一个版本是国内版，只能用国内大模型，另一个是国际版，海外公司的版本，可以使用 GPT，Gemini，Claude，现在呢，我猜测至少是不能使用 Claude 了，包括我之前介绍的阿里 IDE Qoder，都是一样的策略。 1、国内开发者与 Claude 渐行渐远，想通过 API 调用或境外云服务接入，几乎没有可能。 2、Claude 代表了当下语言模型在编程、推理、长文本处理上的最强水平，尤其是编程能力，失去这个通道，我们需要加快国内模型追赶速度。某种角度，这是好事。 3、资本与创业环境会变化。投资人要考虑的，不仅是模型能力，还有合规风险。你投的这家公司，是不是有可能因为“用不了 Claude”而失去竞争力？一道新的铁幕落下，倒也不算意外。冷战时期，人类世界被铁幕分割成两部分。今天的 AI 行业，似乎也在形成新的铁幕。Claude 在那边，豆包、文心、通义、月之暗面在这边。模型的性能差异、训练语料差异、生态和市场差异，都会随之变得割裂，各自发展。长远来看，这未必是坏事，正如当年的芯片产业，断供是痛苦的，但也是国产替代最直接的催化剂。 Anthropic 的这份公告，强化了某种意象：全球 AI 行业正在从“技术竞争”转向“地缘政治竞争”。AI 同样是国家安全、战略利益的一部分。面对，继续向前走就好了。

#Claude禁令 #AI地缘政治 #中国AI发展 #国产替代 #技术封锁

1个月前

晕了，我喜欢的 AI 浏览器 Dia 被收购了。刚看 X 刷到了让我震惊的消息：我常用的 AI 浏览器 Dia 的母公司被 Atlassian 公司以 6.1 亿美金现金收购了……收购了。据说 Dia 会独立发展，但我立刻感到了隐隐的担忧。 Atlassian 是一家澳大利亚的软件公司，总部位于悉尼，成立于 2002 年。创始人是 Mike Cannon-Brookes 和 Scott Farquhar，两位年轻的大学毕业生当时为了避免去大公司打工，贷款 1 万澳元开始创业。公司最知名的产品是 Jira 和 Confluence：Jira 最初是一个缺陷跟踪工具，如今已经演变为广泛使用的项目管理和敏捷开发平台，支持 Scrum、Kanban 等方法，被全球的开发团队和企业用于任务跟踪、Bug 管理和项目协作。Confluence 是一个企业协作与知识管理工具，用于文档共享、团队协作和企业 Wiki。除了这两款核心产品，Atlassian 还推出了 Trello、Bitbucket、Opsgenie 等工具，覆盖了团队协作、代码托管、事件响应等多个领域。 Atlassian 的商业模式主要是自助式 SaaS 订阅，目前市值 40 多亿美金，不知道为啥收购 Dia 的公司。创始人为什么要卖掉 The Browser Company ，猜测是投资方的压力，这公司做了这么久真是没赚几个钱，就看咔咔发布产品了。我猜测 Atlassian 买一个 AI 产品公司可能更多看重团队的 AI 产品能力。只希望 Dia 能独立发展就好了，AI 浏览器这个市场我还是挺看好的，这个产品的功能和品味很对我胃口，不行咱也做一个吧。

#Dia浏览器被收购 #Atlassian公司 #AI浏览器市场 #用户担忧 #产品独立发展

1个月前

ChatGPT 开始任务 task 功能的内测了用自然语言的方式为用户设置提醒，完成任务，执行计划等，目前还没灰度到我😂 支持完全任务完成通知，通过网页、桌面和移动平台发送。允许用户同时运行最多10个活动任务，超出限制需暂停或删除任务。功能仍处于测试阶段，不支持语音任务设置或连续后台搜索。

OpenAI新德里发布会：ChatGPT语音翻译功能引发热议· 559 条信息

#ChatGPT #任务功能 #内测 #自然语言 #任务管理

1个月前

这事你还没注意呢，巨无霸已经完成“反超时刻” 过去两年世界的主旋律就是 AI 行业，AI 行业的主旋律和明星公司自然是 OpenAI 的 GPT 了。无论是模型能力，发布节奏，还是产品化速度，品牌深入人心的影响力，GPT 一枝独秀，虽然说前三名是 OpenAI、Google 和 Anthropic，对应的模型就是 GTP、Gemini 和 Claude，但大家普遍的心智还是，二三名和第一，有代际差距，至少是落后几个月的身位。我记得 AI 搜索流行的时候，国外同行都有共识，这事对 Google 影响最大，当 Perplexity 宣布用 AI 搜索颠覆 Google 的时候，这个巨无霸是否在瑟瑟发抖呢？看起来并没有。 DeepMind 作为 Google 内部最具创新力的团队之一，很早就在基础模型、推理能力、跨模态理解等领域深耕多年。许多技术突破和算法优化，悄摸早就用在 Google 的各条产品线上了，只是大多数人并未察觉。等到 Gemini 2.5 Flash Image 发布的那一刻，才让人意识到，Google 并不是慢了一步，而是在等待一个合适的时机，这个时机甚至不是自己创造的或者 Google 营销的，而是产品自身带来的引爆点。 DeepMind 的积累和 Google 的产品能力，最终在这场 AI 的竞赛中实现了“暗中提速”，也让外界对 Google 的判断出现了偏差。如果说之前大家还在讨论“谁的模型跑得更快”，那么现在，Google 给出的答案是：不止快，更聪明。并且 Nano Banana（Gemini 2.5 Flash Image的模型代号）的速度真心不慢。上周只是生图的速度快，当时我还觉得这质量不如 GPT 啊。今天试了一下，生成的图片质量已经不分伯仲了： Google DeepMind 视觉生成产品负责人 Nicole Brichtova 在谈到这一代模型时，用了“质的飞跃”来形容。她认为，不论是图像生成，还是后续的编辑，Gemini 2.5 Flash Image 已经达到了业内的新高度。而这确实是用户亲身体验后才能感受到的震撼。 1、一致性与自然交互这代模型最令人惊讶的地方，在于它解决了长期困扰生成式 AI 的“连续性”问题。以往的图像生成工具，如果你要求它“换个角度”或者“换件衣服”，往往会生成一张完全不同的人物，就像在描述另外一个角色。而 Gemini 2.5 Flash Image 的特性是：它能在多轮自然语言交互中保持角色高度一致，这周我又试了试，一致性正在变得越来越好。你可以换动作、换服装、甚至换场景，但画面里的那个人，依然是“同一个人”。这对于创意产业、品牌设计乃至虚拟 IP 的构建，都是革命性的。更妙的是，这种交互方式不再是“冷冰冰的参数和命令”，而是接近人类自然对话的体验。模糊的表达、自由的提示，甚至一句极简的“再来一张”，模型都能理解并产出符合预期的结果。 2、从“生图”到“对话” 回想一下上周，我还觉得 nano banana 这样的模型和 GPT 之间的差距明显，而短短一周后，差距就很难分辨了。模型的进化速度，就像火箭一样，一次次把人类的想象推向更远的地方。过去我们谈 AI 图像生成，用的是“生图”这个词，意味着它像摄影一样，一次性生成一张图。现在，Gemini 2.5 Flash Image 的体验，更接近一种“对话”。你和它说话，它理解上下文，持续生成；你提出修改，它保留一致性，灵活调整。模型的“聪明程度”第一次让人觉得，它不仅仅是一个工具，而更像一个合作者。 Nicole Brichtova 在采访时说过另一句话：“我们现在看到的，只是这些模型潜力的冰山一角。” 是图像生成、角色一致性和自然语言驱动的突破，但在这些能力背后，真正令人期待的是 AI 原生的交互范式。当模型具备了跨模态的语义理解能力，它就不再局限于“输入-输出”，而是可以持续陪伴用户，完成更复杂的创作任务。这可能是一次范式转移。在 AI 时代有个和以前非常不一样的现象：纯工具没什么护城河，留给创业者的时间差非常小。很多创业公司基于之前大模型做出来的工程化产品，一旦新模型出来，你的工程化能力，直接就被新模型碾压了，这是个巨大的创业鸿沟。比如你之前基于 GPT 的 API 搞了很多工程化的算法保证角色一致性做了一个绘图工具，现在 Nano Banana 出来，你的产品立刻就会被抛弃了。用户不会有忠诚度的。但剪映这样的工具肯定不会抛弃，对吧？因为剪映做的工程化，大模型是做不了或不愿意做的。如何重新思考并建立自己的用户群和核心机制，这是创业公司必须要考虑的事。 Gemini 2.5 Flash Image 的发布，标志着 AI 进入了一个新的阶段。角色一致性、自然对话式生成和高质量的图像编辑，已经让我们看到了未来的影子。但有一点可以肯定：AI 领域的竞争不再是单点的功能对比，而是生态、交互和用户体验的全面较量。

Google Gemini 2.5发布引发AI模型性价比热议· 222 条信息

OpenAI新德里发布会：ChatGPT语音翻译功能引发热议· 559 条信息

#Gemini 2.5 Flash Image #AI 图像生成 #角色一致性 #自然语言交互 #DeepMind

1个月前

nano banana 的生图质量在迅速提升，上周比 GPT 还差很多，这周已经很难分辨了。

#nano banana #生图质量提升 #GPT #AI技术 #图像生成

1个月前

Nothing Phone 3 是最近让我眼前一亮的硬件，很久没见到这么设计的手机了，Nothing OS 也极为简洁，几乎保持了原生安卓的设计，又增加了不少智能功能，谷歌全家桶和 ChatGPT 用起来无比丝滑，辛好，没错过这部手机。拍照也很不错。俩耳机也很好

#Nothing Phone 3 #原生安卓 #ChatGPT #简洁设计 #拍照不错

1个月前

随着纳米香蕉风暴席卷全球，“火爆程度高于同期 GPT-4o”、“短时间内在 LMArena 等平台登顶”、“单日百万级互动量”，这些传说在 X 上广为流传。你看看，模型好 Google 就能瞬间翻盘。晚上总结了一下 Google 最新的顶级 AI 工具，有兴趣的都可以试试。事半功倍。 1、NanoBanana（Gemini 2.5 Flash Image） Google 最新的 AI 图像编辑工具，可通过文本提示实现高度一致的图像变换与本地精细编辑。已集成进 Gemini，是当前评价最高的图像编辑AI之一，适用于产品、时尚、社交等多种图片生成与修改场景。访问入口：或在 Gemini 应用内使用。 2、Flow（Google AI 电影制作工具）该工具集成 Veo 3、Imagen 和 Gemini，创作者可通过自然语言提示快速生成电影级场景和故事，有助于影视创作和内容生成。访问入口：，也可通过官方说明了解更多。 3、Veo 3（AI 视频生成器） Google 最新一代视频生成器，支持从文本、图片或片段生成高质量的视频，并具备逼真的视觉、动作、音频同步等功能，适合创作者和教育人士。访问入口： 4、NotebookLM（AI 数字笔记/文档助手）一款 AI 赋能的文档工具，能帮你快速分析文档、提炼要点并生成总结，现在还支持将多语种笔记直接做成视频演示，非常适合学术与内容创作者。访问入口： 5、Gemma 3（杰玛3）开源大模型这是 Google 基于 Gemini 2.0 技术推出的多模态开源 AI 模型系列，可以在个人电脑、云和移动端运行，支持 140 多种语言、文本、图片等输入，适合学术、开发和商业各种应用。官方支持 HuggingFace、Kaggle 下载以及 Vertex AI 接入。访问入口：Gemma 3 官方页｜开发文档/AI Studio｜Vertex AI 模型库 5、Project Mariner（谷歌 AI 浏览器代理/自动化助手）这是 Google 推出的下一代网页自动化智能体，可理解网页文本和视觉元素、在浏览器里自动完成多步任务（如内容抓取、填写表单、自动比价/搜索等），支持复杂的跨网页操作，目前 Ultra 订阅用户可率先体验，未来会集成进 Gemini Agent 模式。访问入口：Google Labs 演示页面｜官方介绍金秋九月，终于来了，2025，还剩四个月。 2025年9月1日

Google Gemini 2.5发布引发AI模型性价比热议· 222 条信息

OpenAI新德里发布会：ChatGPT语音翻译功能引发热议· 559 条信息

#纳米香蕉风暴 #Google AI工具 #Gemini 2.5 Flash Image #AI电影制作 #开源大模型Gemma 3