池建强
2个月前
池建强
2个月前
Claude 这条路在中国企业这里彻底断掉了 9 月 5 日这一天,Anthropic 在官网发布了一则消息:立即停止 Claude 向中国资本控股企业提供服务。所谓“控股”,指的是持股比例超过 50% 的企业,这一政策覆盖的可不仅仅是大陆公司,事实上大陆公司本身也用不了。这个策略同时包括那些在境外注册,但有中国资本或股东背景的公司和组织。 目前看起来,Claude 这条路在中国企业这里彻底断掉了。 AI 的地缘政治 过去二十年,互联网科技产品大多强调“全球化”。硅谷的产品可以在北京、东京、柏林同时使用,哪怕偶尔有审查或功能阉割,底层的技术逻辑还是相通的。但到了 AI 时代,这条路越来越窄了。先是芯片,后是软件。 Anthropic 在公告中说,这项措施是为了“应对法律、监管与国家安全风险”。换句话说,AI 已经被当作战略资源。和石油、芯片一样,AI 模型不再是单纯的商业工具,早就被嵌入到大国博弈的棋盘里。 这一点在 GPT-4 之后已经很明显。美国政府把最先进的 AI 模型看作“国防资产”,严格控制其出口与使用范围。现在 Anthropic 的决定只是把这种控制明确落地到商业规则中:你是谁、你后面是谁,这决定了你能不能用 Claude。 有意思的是,Anthropic 并非只针对中国,公告里明确提到,这一政策同样适用于美国认定的“对手国家”,比如俄罗斯啊、伊朗啊、朝鲜等等。 blacklist,在这份名单上,中国的体量让事情变得敏感起来。 这件事让我们也看到另一层逻辑:这也是商业上的风险规避。Anthropic 不希望自家模型被用于可能引发地缘冲突、规避制裁或触及安全边界的场景。对于一家需要不断融资、依赖美国政府关系的公司来说,这个选择也不意外。 直接一点,这对于中国企业来说,意味着什么呢? 如果你是一家 AI 初创公司,哪怕是注册在新加坡、开曼群岛,只要背后有中国资本背景,无论是中国的 VC 还是大公司投资,都将无法继续使用 Claude 的服务。Anthropic 说的非常明白,这是为了避免中国企业通过设立海外子公司、购买第三方云服务来“曲线救国”。 比如字节的 IDE 工具 Trae,一个版本是国内版,只能用国内大模型,另一个是国际版,海外公司的版本,可以使用 GPT,Gemini,Claude,现在呢,我猜测至少是不能使用 Claude 了,包括我之前介绍的阿里 IDE Qoder,都是一样的策略。 1、国内开发者与 Claude 渐行渐远,想通过 API 调用或境外云服务接入,几乎没有可能。 2、Claude 代表了当下语言模型在编程、推理、长文本处理上的最强水平,尤其是编程能力,失去这个通道,我们需要加快国内模型追赶速度。某种角度,这是好事。 3、资本与创业环境会变化。投资人要考虑的,不仅是模型能力,还有合规风险。你投的这家公司,是不是有可能因为“用不了 Claude”而失去竞争力? 一道新的铁幕落下,倒也不算意外。 冷战时期,人类世界被铁幕分割成两部分。今天的 AI 行业,似乎也在形成新的铁幕。Claude 在那边,豆包、文心、通义、月之暗面在这边。模型的性能差异、训练语料差异、生态和市场差异,都会随之变得割裂,各自发展。 长远来看,这未必是坏事,正如当年的芯片产业,断供是痛苦的,但也是国产替代最直接的催化剂。 Anthropic 的这份公告,强化了某种意象:全球 AI 行业正在从“技术竞争”转向“地缘政治竞争”。AI 同样是国家安全、战略利益的一部分。 面对,继续向前走就好了。
池建强
2个月前
晕了,我喜欢的 AI 浏览器 Dia 被收购了。 刚看 X 刷到了让我震惊的消息:我常用的 AI 浏览器 Dia 的母公司被 Atlassian 公司以 6.1 亿美金现金收购了……收购了。据说 Dia 会独立发展,但我立刻感到了隐隐的担忧。 Atlassian 是一家澳大利亚的软件公司,总部位于悉尼,成立于 2002 年。创始人是 Mike Cannon-Brookes 和 Scott Farquhar,两位年轻的大学毕业生当时为了避免去大公司打工,贷款 1 万澳元开始创业。 公司最知名的产品是 Jira 和 Confluence:Jira 最初是一个缺陷跟踪工具,如今已经演变为广泛使用的项目管理和敏捷开发平台,支持 Scrum、Kanban 等方法,被全球的开发团队和企业用于任务跟踪、Bug 管理和项目协作。Confluence 是一个企业协作与知识管理工具,用于文档共享、团队协作和企业 Wiki。 除了这两款核心产品,Atlassian 还推出了 Trello、Bitbucket、Opsgenie 等工具,覆盖了团队协作、代码托管、事件响应等多个领域。 Atlassian 的商业模式主要是 自助式 SaaS 订阅,目前市值 40 多亿美金,不知道为啥收购 Dia 的公司。 创始人为什么要卖掉 The Browser Company ,猜测是投资方的压力,这公司做了这么久真是没赚几个钱,就看咔咔发布产品了。 我猜测 Atlassian 买一个 AI 产品公司可能更多看重团队的 AI 产品能力。 只希望 Dia 能独立发展就好了,AI 浏览器这个市场我还是挺看好的,这个产品的功能和品味很对我胃口,不行咱也做一个吧。
池建强
2个月前
这事你还没注意呢,巨无霸已经完成“反超时刻” 过去两年世界的主旋律就是 AI 行业,AI 行业的主旋律和明星公司自然是 OpenAI 的 GPT 了。无论是模型能力,发布节奏,还是产品化速度,品牌深入人心的影响力,GPT 一枝独秀,虽然说前三名是 OpenAI、Google 和 Anthropic,对应的模型就是 GTP、Gemini 和 Claude,但大家普遍的心智还是,二三名和第一,有代际差距,至少是落后几个月的身位。 我记得 AI 搜索流行的时候,国外同行都有共识,这事对 Google 影响最大,当 Perplexity 宣布用 AI 搜索颠覆 Google 的时候,这个巨无霸是否在瑟瑟发抖呢? 看起来并没有。 DeepMind 作为 Google 内部最具创新力的团队之一,很早就在基础模型、推理能力、跨模态理解等领域深耕多年。许多技术突破和算法优化,悄摸早就用在 Google 的各条产品线上了,只是大多数人并未察觉。 等到 Gemini 2.5 Flash Image 发布的那一刻,才让人意识到,Google 并不是慢了一步,而是在等待一个合适的时机,这个时机甚至不是自己创造的或者 Google 营销的,而是产品自身带来的引爆点。 DeepMind 的积累和 Google 的产品能力,最终在这场 AI 的竞赛中实现了“暗中提速”,也让外界对 Google 的判断出现了偏差。 如果说之前大家还在讨论“谁的模型跑得更快”,那么现在,Google 给出的答案是:不止快,更聪明。 并且 Nano Banana(Gemini 2.5 Flash Image的模型代号)的速度真心不慢。上周只是生图的速度快,当时我还觉得这质量不如 GPT 啊。今天试了一下,生成的图片质量已经不分伯仲了: Google DeepMind 视觉生成产品负责人 Nicole Brichtova 在谈到这一代模型时,用了“质的飞跃”来形容。 她认为,不论是图像生成,还是后续的编辑,Gemini 2.5 Flash Image 已经达到了业内的新高度。而这确实是用户亲身体验后才能感受到的震撼。 1、一致性与自然交互 这代模型最令人惊讶的地方,在于它解决了长期困扰生成式 AI 的“连续性”问题。 以往的图像生成工具,如果你要求它“换个角度”或者“换件衣服”,往往会生成一张完全不同的人物,就像在描述另外一个角色。 而 Gemini 2.5 Flash Image 的特性是:它能在多轮自然语言交互中保持角色高度一致,这周我又试了试,一致性正在变得越来越好。 你可以换动作、换服装、甚至换场景,但画面里的那个人,依然是“同一个人”。这对于创意产业、品牌设计乃至虚拟 IP 的构建,都是革命性的。 更妙的是,这种交互方式不再是“冷冰冰的参数和命令”,而是接近人类自然对话的体验。模糊的表达、自由的提示,甚至一句极简的“再来一张”,模型都能理解并产出符合预期的结果。 2、从“生图”到“对话” 回想一下上周,我还觉得 nano banana 这样的模型和 GPT 之间的差距明显,而短短一周后,差距就很难分辨了。 模型的进化速度,就像火箭一样,一次次把人类的想象推向更远的地方。 过去我们谈 AI 图像生成,用的是“生图”这个词,意味着它像摄影一样,一次性生成一张图。现在,Gemini 2.5 Flash Image 的体验,更接近一种“对话”。 你和它说话,它理解上下文,持续生成;你提出修改,它保留一致性,灵活调整。模型的“聪明程度”第一次让人觉得,它不仅仅是一个工具,而更像一个合作者。 Nicole Brichtova 在采访时说过另一句话:“我们现在看到的,只是这些模型潜力的冰山一角。” 是图像生成、角色一致性和自然语言驱动的突破,但在这些能力背后,真正令人期待的是 AI 原生的交互范式。当模型具备了跨模态的语义理解能力,它就不再局限于“输入-输出”,而是可以持续陪伴用户,完成更复杂的创作任务。这可能是一次范式转移。 在 AI 时代有个和以前非常不一样的现象:纯工具没什么护城河,留给创业者的时间差非常小。很多创业公司基于之前大模型做出来的工程化产品,一旦新模型出来,你的工程化能力,直接就被新模型碾压了,这是个巨大的创业鸿沟。 比如你之前基于 GPT 的 API 搞了很多工程化的算法保证角色一致性做了一个绘图工具,现在 Nano Banana 出来,你的产品立刻就会被抛弃了。用户不会有忠诚度的。 但剪映这样的工具肯定不会抛弃,对吧?因为剪映做的工程化,大模型是做不了或不愿意做的。 如何重新思考并建立自己的用户群和核心机制,这是创业公司必须要考虑的事。 Gemini 2.5 Flash Image 的发布,标志着 AI 进入了一个新的阶段。角色一致性、自然对话式生成和高质量的图像编辑,已经让我们看到了未来的影子。 但有一点可以肯定:AI 领域的竞争不再是单点的功能对比,而是生态、交互和用户体验的全面较量。
池建强
3个月前
随着纳米香蕉风暴席卷全球,“火爆程度高于同期 GPT-4o”、“短时间内在 LMArena 等平台登顶”、“单日百万级互动量”,这些传说在 X 上广为流传。你看看,模型好 Google 就能瞬间翻盘。晚上总结了一下 Google 最新的顶级 AI 工具,有兴趣的都可以试试。事半功倍。 1、NanoBanana(Gemini 2.5 Flash Image) Google 最新的 AI 图像编辑工具,可通过文本提示实现高度一致的图像变换与本地精细编辑。已集成进 Gemini,是当前评价最高的图像编辑AI之一,适用于产品、时尚、社交等多种图片生成与修改场景。 访问入口: 或在 Gemini 应用内使用。 2、Flow(Google AI 电影制作工具) 该工具集成 Veo 3、Imagen 和 Gemini,创作者可通过自然语言提示快速生成电影级场景和故事,有助于影视创作和内容生成。 访问入口:,也可通过官方说明了解更多。 3、Veo 3(AI 视频生成器) Google 最新一代视频生成器,支持从文本、图片或片段生成高质量的视频,并具备逼真的视觉、动作、音频同步等功能,适合创作者和教育人士。 访问入口: 4、NotebookLM(AI 数字笔记/文档助手) 一款 AI 赋能的文档工具,能帮你快速分析文档、提炼要点并生成总结,现在还支持将多语种笔记直接做成视频演示,非常适合学术与内容创作者。 访问入口: 5、Gemma 3(杰玛3)开源大模型 这是 Google 基于 Gemini 2.0 技术推出的多模态开源 AI 模型系列,可以在个人电脑、云和移动端运行,支持 140 多种语言、文本、图片等输入,适合学术、开发和商业各种应用。官方支持 HuggingFace、Kaggle 下载以及 Vertex AI 接入。 访问入口:Gemma 3 官方页|开发文档/AI Studio|Vertex AI 模型库 5、Project Mariner(谷歌 AI 浏览器代理/自动化助手) 这是 Google 推出的下一代网页自动化智能体,可理解网页文本和视觉元素、在浏览器里自动完成多步任务(如内容抓取、填写表单、自动比价/搜索等),支持复杂的跨网页操作,目前 Ultra 订阅用户可率先体验,未来会集成进 Gemini Agent 模式。 访问入口:Google Labs 演示页面|官方介绍 金秋九月,终于来了,2025,还剩四个月。 2025年9月1日
池建强
3个月前
我这半年看过最好的 Vibe Coding 技巧 上周 OpenAI 的创始成员 Andrej Karpathy 在 X 上发了一条长长的推文,继续阐述自己在 Vibe Coding 方面的实践。 这次他开门见山的表示,不要幻想有一个万能的 AI 工具能解决所有编程问题,更可行的做法是建立一个三层结构,让不同的工具在不同场景各司其职,像接力赛一样完成开发任务。 1 在 Karpathy 的日常开发中,大约四分之三的时间最依赖的依然是 Cursor 的自动补全。这里面有一个细节很有意思:Karpathy 并不是依赖自然语言提示去驱动 AI 写代码,而是更习惯在代码里写注释、写片段,用“演示”的方式告诉模型你想要什么。这种方式带宽更高、意图更明确,也避免了上下文缺失造成的偏差。不过他也坦言,有时候 Cursor 太“热情”,会补全一大段并不需要的内容,打断思路。所以他会频繁地开关这个功能,就像和一个“话痨搭档”保持距离。 2 当遇到更大块的功能需求,或者不太熟悉的领域,Karpathy 就会把舞台交给 Claude Code 或 Codex。这类工具更适合快速生成一大段可用的代码实现,尤其是在写 Rust、SQL 这样的语言时,可以立刻把复杂的逻辑搭出来,调试和可视化也能很快跑通。这次他提到一个新词——“后代码稀缺时代”。在这个时代,生成和删除代码都变得轻而易举,代码从来不再是稀缺资源,实验和探索的成本被大幅降低。你想尝试一个新思路?直接让 AI 写一版,跑不通就删掉,重新来过。 不过,AI 写出来的代码质量往往“不够优雅”。Karpathy 给的例子很具体:喜欢堆砌复杂的抽象、滥用 try/catch、写得又长又冗余、缺乏工程品味。这种时候,他需要手动清理,像给新人代码做 code review 一样,把那些不符合自己风格的部分剔除掉。更有意思的是,他还尝试让 Claude 在写代码的同时顺便“上课”——解释为什么这么写,或者帮忙做超参数调优,但这根本不起作用——它真的想写代码,而不是解释任何东西。这从侧面也说明,AI 现在很擅长写东西,但讲解和教学还远没到位。 3 当自动补全和 Claude 都不管用的时候,Karpathy 的“终极武器”是 GPT-5 Pro。他的做法很简单:把一整个疑难问题丢进去,让模型“沉思十分钟”,然后再看答案。很多时候,GPT-5 Pro 能给出人工难以发现的 bug 线索,或者在抽象优化和文献综述中提供独到见解。换句话说,这是他的“救火队长”。 这种三层结构的组合,让 Karpathy 的工作流更像一套生态。轻量需求靠自动补全解决,大规模生成交给 Claude 或 Codex,难题交给 GPT-5 Pro。相比依赖单一工具的思路,这更接近真实的开发场景,也更符合 AI 发展的现状。 在这条推文里,他还谈到“后代码稀缺时代”的焦虑。代码不再稀缺,但人的精力依旧有限。工具更新太快,总让人担心自己是不是落伍了,会不会错过了最前沿的可能性。他把这种状态称为“周日胡思乱想”。 这正是当下许多开发者共同的心态。我们既兴奋于生产力的突飞猛进,又害怕自己无法驾驭这匹充满野性的骏马。 对普通开发者和使用 Vibe Coding 的普通用户来说,这里面有几个启示: 首先,要放弃寻找完美工具的幻想,建立自己的工具组合。不同的任务难度需要不同的 AI,像调动一个虚拟团队一样,谁擅长什么就用谁。 其次,要学会用“代码里的意图”而不是“自然语言的空话”去驱动模型,把注释和片段当作沟通语言,这样效率更高。 最后也不要忽视清理的过程。AI 生成的东西往往像半成品,需要你用工程师的直觉和审美去打磨。 写到这儿我想起一句老话:工欲善其事,必先利其器。只是到了今天,器不再是一把锤子、一个 IDE,而是多个快速迭代的 AI 工具。它们不再是静止的工具,而更像一群性格迥异的搭档。我们需要学会和它们合作,学会在噪音里保持判断,学会在洪流中找到自己的节奏。
池建强
3个月前
投资人愿意押注你并不说明什么 互联网创业公司分两类,一种是融到一定规模资金的。一种是没有机构融资,开工就自己造血的。 融资到位的创业公司遇到发展的瓶颈,大概率会通过招聘更多的人,做更多产品特性来破局,甚至放弃现有的产品,换个新赛道尝试等等。这种公司一般上来就会有十个人甚至更多人的团队,如果业务顺利会保持团队人员增长,到几十人甚至上百上千。发展不起来的话,要么继续融资,要么等团队人员把融资消耗差不多了清算了事。 投资并不能解决问题,今天看到连续创业者 WordPress 创始人 Jason Cohen 在 X 上有感而发: 风险投资人/天使投资人愿意押注你并不没有验证你的成功。他们的大部分投资组合都失败了,还记得吗 只有用户愿意持续为你的产品付费,并且持续留存,这才是真正的验证。 没融资的怎么办呢,上来就需要想办法赚钱,同时做产品,以战养战。这样的公司多大规模都有,几个人的,几十个人的,完全和业务发展相关。利润多了还想发展,就会寻求资本或上市,不想被局限,几个人的小团队也能过得非常滋润。 现在巨头林立,大家都做 AI 特性,其实不做和巨头完全同类的产品即可。只要找到认可你的用户,愿意持续为你的产品付费,并且持续留存,就能活下去。 活的好不好,得看各自本事了。 创业三年的一点感想,很幸运,赶上了 AI 时代。70 后真是幸运的一代,😂
池建强
3个月前
我的前老板老罗竟然开始采访别人了:李想的理想 花了几小时,断断续续把罗永浩和李想的对谈听完了,其实我很喜欢老罗做这种严肃内容(他的八卦和吵架我从不关注),以前加入锤子科技,也是受到老罗语录的影响,当然,更多还是产品对我路子,品味在线。 交代一下背景,我是老罗前同事,在锤子科技工作过两年,我和墨问的大师都是在罗永浩手下打过仗的。那两年真的很累,白天开会讨论业务和产品,做技术方案,晚上看设计,周末随时 oncall,发布会像打仗,复盘呢,有点像秋后问斩,哈哈。 那两年时间像是被压缩了,压力大,成长快,虽然最后锤子没做起来,不过那段时间的经历对我以后做产品创业帮助非常大。在锤科没挣啥钱,但价值在线。 后来我离开锤子,去做内容与产品,我写了很多关于创业和产品的文字,做了我的第一个产品极客时间,再到创业折腾墨问西东。老罗呢,锤子卖了,做直播还债,再到新的科技公司细红线,现在又折腾自媒体了。好。五十多岁,正是闯的年纪。 我和老罗共事两年,他是我的直接上司,从他经营公司的那个劲头和言谈举止看,我觉得老罗绝不会止步于“讲故事”或者当个网红,他对科技产品是有执念的,能力有,但缺陷也很明显,否则锤子也不会黄了,细红线迟迟没有产品问世。他的语言能力,有时候用力过猛,反而会对公司带来伤害。但好处是长处足够长,机会也多。 比如做访谈就很好,相对克制,也会充分发挥他的语言天赋。 其实上一次访谈还是罗振宇采访他,那是 2018 年 3 月的事,一晃 7 年过去,天翻地覆,老罗变成了采访者。他有了自己的新节目《罗永浩的十字路口》。 十年河东,十年河西。//完整内容见评论推