#AI应用

Y11
1周前
锦秋基金的核心观点是:AI基础模型如同大宗商品,技术参数的差距会随时间快速缩小,而真正创造价值、留住用户的,是能被感知、被信赖的产品。 在他们看来,当前AI应用公司的最大护城河不是技术参数,而是“信任”。 这种信任并非来自广告宣传,而是通过深度理解用户需求、持续优化体验积累而来。 例如,一个AI写作工具若能记住用户的写作风格、常用术语,甚至保存未完成的草稿,这种“被懂得”的体验,比单纯的技术指标更能建立用户粘性。 基于此,锦秋基金聚焦三个投资方向,并采取差异化策略: AI应用领域,他们不投简单的“Prompt+UI”产品,而是关注那些能填补行业痛点的垂直解决方案。 例如,针对中小企业在AI营销中面临的“不会用、不敢用”问题,能提供从工具到培训、合规的一体化服务的团队,往往更具潜力。 他们更看重“懂行业”的创始人,这类团队能精准捕捉用户真实需求,形成难以复制的场景化优势。 芯片领域,锦秋基金将目光投向了推理芯片市场。 随着大模型的普及,推理需求呈爆发式增长,低延迟、高能效的推理芯片成为关键。 他们不盲目追求“全栈自研”,而是关注那些能在特定场景(如边缘计算、车载)实现技术突破、提供高性价比解决方案的团队,期待中国团队能凭借架构创新走出差异化路径。 机器人领域,锦秋基金认为行业正迎来类似2012年深度学习爆发的拐点,但更倾向于投资能在特定场景快速落地、积累真实数据闭环的项目。 例如,工厂里的分拣机器人,哪怕动作不够完美,只要能7×24小时稳定运行并持续学习优化,其积累的真实数据就是未来进化的核心燃料。他们认为,“现在积累的场景,就是未来的壁垒”。 锦秋基金总结其投资方法论为三个核心法则: 一是寻找“不对称优势”,即信息差与执行力的结合; 二是精准判断投资时机,在浪潮初期果断投入,在方向尚不明朗时保持观察; 三是验证“数据飞轮”的真实性,关注收入、留存等可量化的商业指标,而非单纯的技术概念或用户数据。 在锦秋基金看来,无论技术如何演进,执行力始终是成功的关键。 再好的想法,若无法落地执行,也只是空中楼阁。他们尤为看重团队面对危机时的应对能力和快速迭代的行动力,因为这决定了企业能否在高速变化的AI赛道中存活并成长。 对于AI创业者而言,锦秋基金的实践表明,在技术同质化加剧的时代,深入理解用户需求、构建真实信任、快速迭代执行,或许是穿越周期、实现可持续增长的关键。而对于投资者,聚焦核心赛道、精准把握趋势、重视执行细节,方能在浪潮中捕捉真正的价值。
本周 BestBlogs 精选内容已邮件推送,欢迎阅读 ----------------------------- 🚀 模型与研究亮点: ✨ Anthropic 发布了 Claude Haiku 4.5 ,该小模型以其接近顶尖的编码性能、显著的成本效益和更快的处理速度,重新定义了高智能 AI 的可及性与效率。 🎬 谷歌 DeepMind 推出 Veo 3.1 模型,通过增强真实感、提示遵循度和视听质量,并集成生成音频和高级编辑功能,革新了 AI 视频创作工具 Flow 。 📄 百度开源了自研多模态文档解析模型 PaddleOCR-VL ,其 0.9B 参数量在 OCR 四大核心能力上全面刷新 SOTA,打破了“大模型才有好效果”的迷思。 💡 阿里巴巴开源了 Logics-Parsing 模型,基于 Qwen2.5-VL 架构,利用布局为中心的强化学习,有效解决了复杂 PDF 文档的端到端结构化处理难题。 💻 大语言模型结构化输出成为构建可靠 AI 应用的核心,文章深入解析了模式引导生成、约束解码、SFT 及 JSON Mode 等六大关键技术路径。 🤔 深度分析当前大语言模型 LLM 的过度宣传与“p^n 困境”,强调 AI 缺乏真实智能,并提出构建人机协同系统的三大原则以应对其固有局限性。 🛠️ 开发与工具精粹: 🔗 LangChain 与 Manus 深度探讨 AI 智能体上下文工程,提出了上下文卸载、缩减、检索、隔离等策略,并通过 Manus 的“分层行动空间”优化工具调用。 📝 规约驱动开发 (SDD) 作为 AI 辅助编码的新范式被详细解析,其规约优先、规约锚定、规约即源的理念及 Kiro 、Spec-kit 、Tessl 等工具成为关注焦点。 ⚙️ 特斯拉前 AI 总监 Andrej Karpathy 开源了 nanochat 项目,以约 8000 行 Rust 代码和 100 美元的成本,从零开始构建了一个简易版 ChatGPT ,并提供了详细教程。 🧑‍🏫 吴恩达推出 Agentic AI 新课程,将智能体工作流开发沉淀为反思、工具、规划和协作四大设计模式,实战证明能让 GPT-3.5 在特定任务中超越 GPT-4 。 Go 腾讯发布 tRPC-Agent-Go 框架,旨在填补 Go 语言在自主多 Agent 协作框架领域的空白,集成了 LLM、智能规划、工具调用等能力。 🔄 《智能体设计模式》深度解析了 AI 智能体的反思模式,通过“生产者-评审者”架构实现自我评估和迭代改进,显著提升任务输出质量,并提供实战代码示例。 💡 产品与设计洞见: 🔧 Anthropic 推出 Claude 技能 功能,用户可将专业知识与指令打包成技能包,定制 Claude 的工作流程,实现可组合、可移植、高效且强大的 AI 任务执行。 🔍 谷歌搜索产品副总裁 Robby Stein 揭示了谷歌 AI 转型的内幕,强调 Gemini 、AI 概览和 AI 模式如何通过更自然的语言和多模态输入,扩展而非取代传统搜索。 🎨 Figma CEO Dylan Field 认为在 AI 时代,设计、工艺和毫不妥协的质量将成为初创企业新的竞争优势,强调产品开发中培养 品味 的重要性。 🏢 硅谷内部讨论会揭示,AI Agent 部署失败的 95%并非模型智能不足,而是上下文工程、安全性、记忆设计等支撑体系缺失,强调治理与信任及多模型推理。 🚀 Slack 首席产品官 Rob Seaman 提出在 AI 时代,传统路线图已失效,应围绕客户与业务结果规划,并通过精简团队快速原型设计,加速产品开发和创新。 📈 Lovable 增长负责人 Elena Verna 强调 AI 正在瓦解传统分发渠道,产品增长需从漏斗模型转向增长飞轮,构建数据护城河并利用产品作为营销渠道。 📰 资讯与报告前瞻: ⚡ Nathan Labenz 驳斥 AI 发展减速论,强调 AI 在推理能力、上下文扩展及作为“协同科学家”方面的持续进步,并预见多模态 AI 的关键作用。 🖥️ 英伟达发布个人 AI 超级计算机 DGX Spark ,将数据中心级 DGX 架构浓缩至桌面,售价 3999 美元起,旨在实现本地高效 AI 开发和推理,并支持 OpenAI API 服务。 🤝 美图公司吴欣鸿分享在 AI 时代下的组织进化心得,实践“反惯性工作流”,提出“AI 原生组织”模式,倡导“一个人即一支团队”理念,并普及 AI 编码。 💰 《State of AI Report 2025》指出 2025 年是 AI 业务追平炒作的“推理之年”,头部 AI 公司年化收入已达百亿美元,AI 编程、音视频生成等商业领域取得显著成功。 ✍️ 语言学家娜奥米·S·巴伦深刻剖析 AI 时代人类写作的核心价值与挑战,强调写作是思考与情感表达的独特方式,呼吁“增强而非自动化”并划清人机协作界限。 ⚖️ 北京大学论文揭示 AI 在加速知识产出的同时,可能加剧内容和思想同质化,产生“创造性伤痕”效应,警示 AI 带来的“资历偏向”重塑劳动力市场。 希望本周的精选文章推荐能帮助您快速了解 AI 领域的最新进展!期待与您下周再见!
Y11
1个月前
当人工智能真正开始以服务的形态融入各行各业,我们看到了一种新的技术范式正在形成。 无论是会计、法律、金融、税务还是医疗领域,那些信息量大、既有个体细节又存在普遍规律的行业,正逐渐成为AI技术落地的沃土。 以会计行业为例,每天都有大量的票据需要处理、账目需要核对。 这些工作看似重复枯燥,实则蕴含着复杂的规则和逻辑。 AI可以通过学习这些规则,自动识别票据信息、完成初步的账务处理,不仅能大幅提高效率,还能减少人为错误。同样,在法律领域,大量的案例分析、合同审查工作,如果交给AI来做,它可以快速梳理海量的法律条文和过往判例,为律师提供精准的参考,让复杂的法律事务变得更高效、更透明。 金融和税务行业更是数据密集型领域,市场动态、政策变化、交易数据等信息层出不穷。 AI在这里可以发挥其强大的数据处理能力,实现风险预警、智能投顾、自动化税务申报等功能。 当AI能够实时分析市场数据,为投资者提供个性化的理财建议;当它能根据最新的税收政策,自动完成企业的税务申报,这将为整个行业带来怎样的变革。 医疗健康领域同样充满了可能性。 从医学影像识别到病历分析,AI可以帮助医生更准确、更快速地做出诊断。 海量的医学文献、病例数据,AI能够从中挖掘出有价值的信息,加速医学研究的进程,让患者获得更好的医疗服务。 这些行业的共同点在于,它们都积累了大量的结构化和非结构化数据,并且存在相对明确的业务逻辑和规则。 AI的出现,就像一把钥匙,能够打开这些数据的价值之门。它不再仅仅是实验室里的技术,而是真正走进了人们的工作和生活,成为推动行业进步的重要力量。 随着技术的不断成熟,我们有理由相信,AI服务将在更多领域发挥作用,改变我们的工作方式和生活方式,让复杂的事务变得简单,让效率得到质的飞跃。这不仅是技术的进步,更是时代发展的必然趋势。
Y11
1个月前
最近几年,职场上的变化确实让人有些措手不及。 2023年,不少人都感受到了“35岁中年危机”的压力,身边有一些朋友面临失业的困境。这背后,既有经济环境的影响,也有行业调整带来的挑战。大家开始重新审视自己的职业规划,如何在变化中保持竞争力,成了很多人思考的问题。 到了2024年,AI技术开始快速渗透到工作的方方面面,“降本增效”成了很多企业的关键词。不少岗位因为AI的介入,工作方式发生了很大改变,效率也有了明显提升。这一年,大家开始学习使用各种AI工具,希望能借技术的东风让自己的工作更轻松、更高效。 转眼到了2025年,AI的能力越来越强,甚至在一些基础工作上,表现得比刚毕业的年轻人还要出色。这时候,新的问题出现了:如果让AI负责技术架构,万一出了问题怎么办?于是,一些企业开始意识到,那些有丰富经验的35岁以上的职场人,尤其是能带领团队的小组长,反而成了关键。他们不仅懂业务,还能更好地驾驭AI工具,确保技术架构的稳定和安全。 其实,不管是23年的危机,还是24年的AI应用,再到25年对有经验管理者的需求,本质上都是职场在时代浪潮中的自我调整。技术在进步,对人的要求也在变化,但“经验”和“解决复杂问题的能力”,始终是职场中非常宝贵的财富。重要的是,我们要保持学习的热情,不断提升自己,才能在变化中找到自己的位置。
AI 应用最有竞争壁垒的,可能就是人机交互。 好的人机交互,需要充分理解模型的能力边界,同时也需要充分理解人的交互感知,这两者都做到极致,才能产生 aha moment。 比如:ChatGPT 通过对话形态让人与模型能交谈,DeepSeek 通过展示思考过程让人感知到 AI 的推理能力,Manus 通过展示工具调用让人惊叹 AI 真能帮人干活。 这些例子里,交互界面都至关重要。 近几个月让人眼前一亮的,是 Lovart,通过无边画布的形态,让人看到了一种新的交互界面。结合图片、视频等模型,让上下文、生成、修改编辑等过程非常流畅。 Chatbot 的交互形态,大概率最终还会是模型厂商或现有大厂的机会。 Canvas 的交互形态,Lovart、Canva、Figma 等,都在快速演进。或许还有创业者的机会,只要足够垂类。 Agent 不是一种单独的人机交互形态,Chatbot 和 Canvas 都可以无缝加入 Agent 能力。 还有一个巨大的交互形态,是 Voice + 硬件。有一个很值得学习的玩家是 Plaud。一个便携式硬件,非常有机会获得用户的很多线下上下文。这些线下上下文提供给 AI 后,有机会让 AI 生成真正 Only for you 的内容。 或许都有新的内容平台的机会。门户 - 搜索 - 推荐,接下来是什么。有可能是基于用户线上和线下上下文的真个性化内容(Content for one)。于是门户 - 搜索 - 推荐 - 生成,路线清晰了起来。 AI 应用创业,都还在很早期很早期阶段。基础模型能力 + 人机交互界面 + 用户上下文感知,会是产品成败最关键的三个基础要素。
最近在想产品定位问题,更具象的挑战是:怎么一句话向目标用户介绍清楚你的产品,让用户明白。 这个问题,对于 To C 的产品来说,往往挺难。因为 To C 产品的目标用户,往往并不是有直接画像的一群人。比如浏览器的目标用户是谁?Office 的目标用户是谁?Notion 的目标用户是谁?Manus 的目标用户是谁?NotebookLM 的目标用户是谁?ChatGPT 的目标用户是谁? 特别是在早期。To C 的 AI 应用,最终会落到:对 AI 有好奇的尝鲜者。细分去看,会五花八门。用 ChatGPT 的用户里,有 70 岁的老教授,也有 10 岁的小学生。NotebookLM 的用户,有白领,也有学生。YouMind 也类似。 于是,需要换一种思路定义目标用户。如俞军老师所说,用户是需求的集合。从这个角度来看,关键不是定义用户,而是定义某种共性需求。 Notion 满足的共性需求是在线文档协同。NotebookLM 满足的共性需求是资料学习。ChatGPT 满足的共性需求是通过 AI 来获取信息。YouMind 满足的共性需求是通过 AI 来创作表达。 从需求集合的角度来定义目标用户,YouMind 的目标人群是:对 AI 有好奇并有创作表达欲的人。但目前也不完全是,比如只想学习,不想创作的人,是不是 YouMind 的目标用户?目前看起来也是。 目标用户定义好之后,接下来是如何一句话描述,给用户介绍清楚产品。 我最近有个想法是,这里要分好几种: 1. 老瓶装老酒。比如用互联网技术再做一个微信。这个没人在做。 2. 老瓶装新酒。比如用互联网技术新做一个大红书。大红书是全新的,世人没见过的。这个也不会有人去做。 3. 新瓶装老酒。比如用 AI 技术重做客服系统、销售系统等等。这个在 To B 领域非常多。需求是确定的,通过 AI 技术重塑产品形态,非常有机会。 4. 新瓶装新酒。比如用 AI 技术新做一个社媒工具。比如会听到 AI 时代的微信、抖音、小红书的提法。有意思的是,因为是新酒,真做出来,产品形态肯定不是微抖红。 新瓶装老酒,比较容易通过一句话给用户说清楚产品是什么,有啥价值。 新瓶装新酒,则往往很难一句话说清楚,经常会被描述成 AI 时代的抖音这种类比说法,也有 XX looks like if Notion and NotebookLM has a baby 的类比方法。类比总是表面上看起来清楚,实际上啥都没说清楚。 如同 iPhone,早期也会通过 Phone + iPod + Internet 的三合一来描述自己,一直到 Smart Phone 的概念被用户接受,然后终于大家可以接受 iPhone 的一句话介绍了:iPhone 是全球首个智能手机。 YouMind 的“智能手机”是什么?我曾设想的一个答案是:YouMind 是全球首个好奇心平台。用户因好奇心而来,在好奇心的驱使下,阅读学习,然后在 AI 陪伴下,顺畅创作出了一些作品,这些作品被其他用户看见,又激起来更多的好奇心。 然而在当下,如果给用户说:YouMind 是一个好奇心平台。那只会引起大部分用户的一脸懵圈。 做产品,好难。
凡人小北
1个月前
在 OpenAI 最新那篇《How People Use ChatGPT》的研究报告里,可以看到一个很多技术人不愿意承认的事实。 我们天天讨论 AI 的未来、模型的能力、Agent 的协同,但普通人真正反复在用的确是最不起眼、最没技术含量、但最能偷懒的那一类小脑力动作。 很多的创业方向都是 AI 重构操作系统,但在报告里能看到的基本都是这样的提问场景: “我懒得写,你帮我润色下” “这事我大概懂,但你能快速解释一下吗” “我脑子卡住了,你先给我几个思路我再改” 就是这类小到不能再小、但一天下来会出现无数次的轻认知需求。 要说这些任务值钱吧,好像也不大值钱;但要说不值钱吧,每一次都真想掏出点什么东西来换时间、换注意力、换一口气不费脑的轻松感,于是,这反而成了 ChatGPT 用得最频繁的几个场景。 报告里有个特别关键的数据点:写作、实用建议、信息查询这三类用途,加起来占了用户对话的大头。 注意!!! 不是图像生成、代码开发和多模态探索之类的,就是字面意义上的“你帮我想点内容”、“你帮我写点东西”、“你告诉我这个怎么做”,极其朴素、但极其高频的脑力协助。 更有意思的信息是,真正把这三类用法用在工作场景中的人占比也很高,尤其是在教育程度高/收入水平高/日常脑力劳动密度大的人群中。也就是说大量的高认知人群的低成本输出策略,用 AI 省点脑子,完全不是因为不会做,单纯的不想做或者不想做得那么费力。 我意识到一个很本质的判断转变,AI 应用不应该去比谁更智能,而应该去比谁更懂人类和人类不想动脑的那一瞬间。 很多技术人一个很大的错觉,以为大家想要一个能回答所有问题的 GPT,其实大家更想要一个能帮他们免于思考前5分钟的小工具;以为用户要的是全链路智能流程,其实用户更需要的是一个“我脑袋转不动了你先帮我垫一脚”的认知助理;以为大家要构建的是一个 super agent,但现实中能留下来的产品,很多时候可能只解决了一个问题,比如:懒得写。 也正因为这样,我现在看“做什么 AI 应用能赚钱”这个问题,视角已经完全变了。别去想还能不能做一个内容平台、一个垂直模型、一个 SaaS 系统。应该反过来去问自己:我有没有办法,找到一个特别具体、特别细分、但特别常见的人类偷懒瞬间,然后围绕这个瞬间,去设计一套轻决策路径 +提示词模板 + 好的 UI 输出,让用户在最不想动脑的时候,最快拿到可修改的半成品。 而当这个偷懒动作被频繁触发,它就自然变成了习惯性的AI 肌肉记忆,而我们所做的应用,也就从一个工具变成了大脑外挂。 那 AI 产品的商业价值又该如何定义,可能有一类不在于能不能模拟一个人类专家,而在于能不能替用户做掉那些明明可以做但就是不想做的动作。 真正的市场不应该只盯着智能的天花板,往下看看,再懒惰的地板上也有大量的机会。 那再 AI 革命的宏大叙事下,我们追求的就不只是让人更强,让人更轻也应该进入视野。 人类会为强大而敬畏,但也会为轻松而掏钱。 思考下自己的日常,再环顾下市场,一个值得做的 AI 应用,不一定惊艳,但一定能替人类懒一次。 所以, 你想不想做一款 AI 产品,能替用户少动一次脑? 你能不能用 prompt、memory、数据和一点点贴心,帮人类多偷一秒懒? 如果可以,那它可能比我们写出一个能做十种事情的智能体,还更容易被买单和留存。 这类的机会还有很多。
向阳乔木
1个月前