随着纳米香蕉风暴席卷全球,“火爆程度高于同期 GPT-4o”、“短时间内在 LMArena 等平台登顶”、“单日百万级互动量”,这些传说在 X 上广为流传。你看看,模型好 Google 就能瞬间翻盘。晚上总结了一下 Google 最新的顶级 AI 工具,有兴趣的都可以试试。事半功倍。 1、NanoBanana(Gemini 2.5 Flash Image) Google 最新的 AI 图像编辑工具,可通过文本提示实现高度一致的图像变换与本地精细编辑。已集成进 Gemini,是当前评价最高的图像编辑AI之一,适用于产品、时尚、社交等多种图片生成与修改场景。 访问入口: 或在 Gemini 应用内使用。 2、Flow(Google AI 电影制作工具) 该工具集成 Veo 3、Imagen 和 Gemini,创作者可通过自然语言提示快速生成电影级场景和故事,有助于影视创作和内容生成。 访问入口:,也可通过官方说明了解更多。 3、Veo 3(AI 视频生成器) Google 最新一代视频生成器,支持从文本、图片或片段生成高质量的视频,并具备逼真的视觉、动作、音频同步等功能,适合创作者和教育人士。 访问入口: 4、NotebookLM(AI 数字笔记/文档助手) 一款 AI 赋能的文档工具,能帮你快速分析文档、提炼要点并生成总结,现在还支持将多语种笔记直接做成视频演示,非常适合学术与内容创作者。 访问入口: 5、Gemma 3(杰玛3)开源大模型 这是 Google 基于 Gemini 2.0 技术推出的多模态开源 AI 模型系列,可以在个人电脑、云和移动端运行,支持 140 多种语言、文本、图片等输入,适合学术、开发和商业各种应用。官方支持 HuggingFace、Kaggle 下载以及 Vertex AI 接入。 访问入口:Gemma 3 官方页|开发文档/AI Studio|Vertex AI 模型库 5、Project Mariner(谷歌 AI 浏览器代理/自动化助手) 这是 Google 推出的下一代网页自动化智能体,可理解网页文本和视觉元素、在浏览器里自动完成多步任务(如内容抓取、填写表单、自动比价/搜索等),支持复杂的跨网页操作,目前 Ultra 订阅用户可率先体验,未来会集成进 Gemini Agent 模式。 访问入口:Google Labs 演示页面|官方介绍 金秋九月,终于来了,2025,还剩四个月。 2025年9月1日
我这半年看过最好的 Vibe Coding 技巧 上周 OpenAI 的创始成员 Andrej Karpathy 在 X 上发了一条长长的推文,继续阐述自己在 Vibe Coding 方面的实践。 这次他开门见山的表示,不要幻想有一个万能的 AI 工具能解决所有编程问题,更可行的做法是建立一个三层结构,让不同的工具在不同场景各司其职,像接力赛一样完成开发任务。 1 在 Karpathy 的日常开发中,大约四分之三的时间最依赖的依然是 Cursor 的自动补全。这里面有一个细节很有意思:Karpathy 并不是依赖自然语言提示去驱动 AI 写代码,而是更习惯在代码里写注释、写片段,用“演示”的方式告诉模型你想要什么。这种方式带宽更高、意图更明确,也避免了上下文缺失造成的偏差。不过他也坦言,有时候 Cursor 太“热情”,会补全一大段并不需要的内容,打断思路。所以他会频繁地开关这个功能,就像和一个“话痨搭档”保持距离。 2 当遇到更大块的功能需求,或者不太熟悉的领域,Karpathy 就会把舞台交给 Claude Code 或 Codex。这类工具更适合快速生成一大段可用的代码实现,尤其是在写 Rust、SQL 这样的语言时,可以立刻把复杂的逻辑搭出来,调试和可视化也能很快跑通。这次他提到一个新词——“后代码稀缺时代”。在这个时代,生成和删除代码都变得轻而易举,代码从来不再是稀缺资源,实验和探索的成本被大幅降低。你想尝试一个新思路?直接让 AI 写一版,跑不通就删掉,重新来过。 不过,AI 写出来的代码质量往往“不够优雅”。Karpathy 给的例子很具体:喜欢堆砌复杂的抽象、滥用 try/catch、写得又长又冗余、缺乏工程品味。这种时候,他需要手动清理,像给新人代码做 code review 一样,把那些不符合自己风格的部分剔除掉。更有意思的是,他还尝试让 Claude 在写代码的同时顺便“上课”——解释为什么这么写,或者帮忙做超参数调优,但这根本不起作用——它真的想写代码,而不是解释任何东西。这从侧面也说明,AI 现在很擅长写东西,但讲解和教学还远没到位。 3 当自动补全和 Claude 都不管用的时候,Karpathy 的“终极武器”是 GPT-5 Pro。他的做法很简单:把一整个疑难问题丢进去,让模型“沉思十分钟”,然后再看答案。很多时候,GPT-5 Pro 能给出人工难以发现的 bug 线索,或者在抽象优化和文献综述中提供独到见解。换句话说,这是他的“救火队长”。 这种三层结构的组合,让 Karpathy 的工作流更像一套生态。轻量需求靠自动补全解决,大规模生成交给 Claude 或 Codex,难题交给 GPT-5 Pro。相比依赖单一工具的思路,这更接近真实的开发场景,也更符合 AI 发展的现状。 在这条推文里,他还谈到“后代码稀缺时代”的焦虑。代码不再稀缺,但人的精力依旧有限。工具更新太快,总让人担心自己是不是落伍了,会不会错过了最前沿的可能性。他把这种状态称为“周日胡思乱想”。 这正是当下许多开发者共同的心态。我们既兴奋于生产力的突飞猛进,又害怕自己无法驾驭这匹充满野性的骏马。 对普通开发者和使用 Vibe Coding 的普通用户来说,这里面有几个启示: 首先,要放弃寻找完美工具的幻想,建立自己的工具组合。不同的任务难度需要不同的 AI,像调动一个虚拟团队一样,谁擅长什么就用谁。 其次,要学会用“代码里的意图”而不是“自然语言的空话”去驱动模型,把注释和片段当作沟通语言,这样效率更高。 最后也不要忽视清理的过程。AI 生成的东西往往像半成品,需要你用工程师的直觉和审美去打磨。 写到这儿我想起一句老话:工欲善其事,必先利其器。只是到了今天,器不再是一把锤子、一个 IDE,而是多个快速迭代的 AI 工具。它们不再是静止的工具,而更像一群性格迥异的搭档。我们需要学会和它们合作,学会在噪音里保持判断,学会在洪流中找到自己的节奏。
投资人愿意押注你并不说明什么 互联网创业公司分两类,一种是融到一定规模资金的。一种是没有机构融资,开工就自己造血的。 融资到位的创业公司遇到发展的瓶颈,大概率会通过招聘更多的人,做更多产品特性来破局,甚至放弃现有的产品,换个新赛道尝试等等。这种公司一般上来就会有十个人甚至更多人的团队,如果业务顺利会保持团队人员增长,到几十人甚至上百上千。发展不起来的话,要么继续融资,要么等团队人员把融资消耗差不多了清算了事。 投资并不能解决问题,今天看到连续创业者 WordPress 创始人 Jason Cohen 在 X 上有感而发: 风险投资人/天使投资人愿意押注你并不没有验证你的成功。他们的大部分投资组合都失败了,还记得吗 只有用户愿意持续为你的产品付费,并且持续留存,这才是真正的验证。 没融资的怎么办呢,上来就需要想办法赚钱,同时做产品,以战养战。这样的公司多大规模都有,几个人的,几十个人的,完全和业务发展相关。利润多了还想发展,就会寻求资本或上市,不想被局限,几个人的小团队也能过得非常滋润。 现在巨头林立,大家都做 AI 特性,其实不做和巨头完全同类的产品即可。只要找到认可你的用户,愿意持续为你的产品付费,并且持续留存,就能活下去。 活的好不好,得看各自本事了。 创业三年的一点感想,很幸运,赶上了 AI 时代。70 后真是幸运的一代,😂
我的前老板老罗竟然开始采访别人了:李想的理想 花了几小时,断断续续把罗永浩和李想的对谈听完了,其实我很喜欢老罗做这种严肃内容(他的八卦和吵架我从不关注),以前加入锤子科技,也是受到老罗语录的影响,当然,更多还是产品对我路子,品味在线。 交代一下背景,我是老罗前同事,在锤子科技工作过两年,我和墨问的大师都是在罗永浩手下打过仗的。那两年真的很累,白天开会讨论业务和产品,做技术方案,晚上看设计,周末随时 oncall,发布会像打仗,复盘呢,有点像秋后问斩,哈哈。 那两年时间像是被压缩了,压力大,成长快,虽然最后锤子没做起来,不过那段时间的经历对我以后做产品创业帮助非常大。在锤科没挣啥钱,但价值在线。 后来我离开锤子,去做内容与产品,我写了很多关于创业和产品的文字,做了我的第一个产品极客时间,再到创业折腾墨问西东。老罗呢,锤子卖了,做直播还债,再到新的科技公司细红线,现在又折腾自媒体了。好。五十多岁,正是闯的年纪。 我和老罗共事两年,他是我的直接上司,从他经营公司的那个劲头和言谈举止看,我觉得老罗绝不会止步于“讲故事”或者当个网红,他对科技产品是有执念的,能力有,但缺陷也很明显,否则锤子也不会黄了,细红线迟迟没有产品问世。他的语言能力,有时候用力过猛,反而会对公司带来伤害。但好处是长处足够长,机会也多。 比如做访谈就很好,相对克制,也会充分发挥他的语言天赋。 其实上一次访谈还是罗振宇采访他,那是 2018 年 3 月的事,一晃 7 年过去,天翻地覆,老罗变成了采访者。他有了自己的新节目《罗永浩的十字路口》。 十年河东,十年河西。//完整内容见评论推