#AI应用

AI 应用最有竞争壁垒的,可能就是人机交互。 好的人机交互,需要充分理解模型的能力边界,同时也需要充分理解人的交互感知,这两者都做到极致,才能产生 aha moment。 比如:ChatGPT 通过对话形态让人与模型能交谈,DeepSeek 通过展示思考过程让人感知到 AI 的推理能力,Manus 通过展示工具调用让人惊叹 AI 真能帮人干活。 这些例子里,交互界面都至关重要。 近几个月让人眼前一亮的,是 Lovart,通过无边画布的形态,让人看到了一种新的交互界面。结合图片、视频等模型,让上下文、生成、修改编辑等过程非常流畅。 Chatbot 的交互形态,大概率最终还会是模型厂商或现有大厂的机会。 Canvas 的交互形态,Lovart、Canva、Figma 等,都在快速演进。或许还有创业者的机会,只要足够垂类。 Agent 不是一种单独的人机交互形态,Chatbot 和 Canvas 都可以无缝加入 Agent 能力。 还有一个巨大的交互形态,是 Voice + 硬件。有一个很值得学习的玩家是 Plaud。一个便携式硬件,非常有机会获得用户的很多线下上下文。这些线下上下文提供给 AI 后,有机会让 AI 生成真正 Only for you 的内容。 或许都有新的内容平台的机会。门户 - 搜索 - 推荐,接下来是什么。有可能是基于用户线上和线下上下文的真个性化内容(Content for one)。于是门户 - 搜索 - 推荐 - 生成,路线清晰了起来。 AI 应用创业,都还在很早期很早期阶段。基础模型能力 + 人机交互界面 + 用户上下文感知,会是产品成败最关键的三个基础要素。
最近在想产品定位问题,更具象的挑战是:怎么一句话向目标用户介绍清楚你的产品,让用户明白。 这个问题,对于 To C 的产品来说,往往挺难。因为 To C 产品的目标用户,往往并不是有直接画像的一群人。比如浏览器的目标用户是谁?Office 的目标用户是谁?Notion 的目标用户是谁?Manus 的目标用户是谁?NotebookLM 的目标用户是谁?ChatGPT 的目标用户是谁? 特别是在早期。To C 的 AI 应用,最终会落到:对 AI 有好奇的尝鲜者。细分去看,会五花八门。用 ChatGPT 的用户里,有 70 岁的老教授,也有 10 岁的小学生。NotebookLM 的用户,有白领,也有学生。YouMind 也类似。 于是,需要换一种思路定义目标用户。如俞军老师所说,用户是需求的集合。从这个角度来看,关键不是定义用户,而是定义某种共性需求。 Notion 满足的共性需求是在线文档协同。NotebookLM 满足的共性需求是资料学习。ChatGPT 满足的共性需求是通过 AI 来获取信息。YouMind 满足的共性需求是通过 AI 来创作表达。 从需求集合的角度来定义目标用户,YouMind 的目标人群是:对 AI 有好奇并有创作表达欲的人。但目前也不完全是,比如只想学习,不想创作的人,是不是 YouMind 的目标用户?目前看起来也是。 目标用户定义好之后,接下来是如何一句话描述,给用户介绍清楚产品。 我最近有个想法是,这里要分好几种: 1. 老瓶装老酒。比如用互联网技术再做一个微信。这个没人在做。 2. 老瓶装新酒。比如用互联网技术新做一个大红书。大红书是全新的,世人没见过的。这个也不会有人去做。 3. 新瓶装老酒。比如用 AI 技术重做客服系统、销售系统等等。这个在 To B 领域非常多。需求是确定的,通过 AI 技术重塑产品形态,非常有机会。 4. 新瓶装新酒。比如用 AI 技术新做一个社媒工具。比如会听到 AI 时代的微信、抖音、小红书的提法。有意思的是,因为是新酒,真做出来,产品形态肯定不是微抖红。 新瓶装老酒,比较容易通过一句话给用户说清楚产品是什么,有啥价值。 新瓶装新酒,则往往很难一句话说清楚,经常会被描述成 AI 时代的抖音这种类比说法,也有 XX looks like if Notion and NotebookLM has a baby 的类比方法。类比总是表面上看起来清楚,实际上啥都没说清楚。 如同 iPhone,早期也会通过 Phone + iPod + Internet 的三合一来描述自己,一直到 Smart Phone 的概念被用户接受,然后终于大家可以接受 iPhone 的一句话介绍了:iPhone 是全球首个智能手机。 YouMind 的“智能手机”是什么?我曾设想的一个答案是:YouMind 是全球首个好奇心平台。用户因好奇心而来,在好奇心的驱使下,阅读学习,然后在 AI 陪伴下,顺畅创作出了一些作品,这些作品被其他用户看见,又激起来更多的好奇心。 然而在当下,如果给用户说:YouMind 是一个好奇心平台。那只会引起大部分用户的一脸懵圈。 做产品,好难。
在 OpenAI 最新那篇《How People Use ChatGPT》的研究报告里,可以看到一个很多技术人不愿意承认的事实。 我们天天讨论 AI 的未来、模型的能力、Agent 的协同,但普通人真正反复在用的确是最不起眼、最没技术含量、但最能偷懒的那一类小脑力动作。 很多的创业方向都是 AI 重构操作系统,但在报告里能看到的基本都是这样的提问场景: “我懒得写,你帮我润色下” “这事我大概懂,但你能快速解释一下吗” “我脑子卡住了,你先给我几个思路我再改” 就是这类小到不能再小、但一天下来会出现无数次的轻认知需求。 要说这些任务值钱吧,好像也不大值钱;但要说不值钱吧,每一次都真想掏出点什么东西来换时间、换注意力、换一口气不费脑的轻松感,于是,这反而成了 ChatGPT 用得最频繁的几个场景。 报告里有个特别关键的数据点:写作、实用建议、信息查询这三类用途,加起来占了用户对话的大头。 注意!!! 不是图像生成、代码开发和多模态探索之类的,就是字面意义上的“你帮我想点内容”、“你帮我写点东西”、“你告诉我这个怎么做”,极其朴素、但极其高频的脑力协助。 更有意思的信息是,真正把这三类用法用在工作场景中的人占比也很高,尤其是在教育程度高/收入水平高/日常脑力劳动密度大的人群中。也就是说大量的高认知人群的低成本输出策略,用 AI 省点脑子,完全不是因为不会做,单纯的不想做或者不想做得那么费力。 我意识到一个很本质的判断转变,AI 应用不应该去比谁更智能,而应该去比谁更懂人类和人类不想动脑的那一瞬间。 很多技术人一个很大的错觉,以为大家想要一个能回答所有问题的 GPT,其实大家更想要一个能帮他们免于思考前5分钟的小工具;以为用户要的是全链路智能流程,其实用户更需要的是一个“我脑袋转不动了你先帮我垫一脚”的认知助理;以为大家要构建的是一个 super agent,但现实中能留下来的产品,很多时候可能只解决了一个问题,比如:懒得写。 也正因为这样,我现在看“做什么 AI 应用能赚钱”这个问题,视角已经完全变了。别去想还能不能做一个内容平台、一个垂直模型、一个 SaaS 系统。应该反过来去问自己:我有没有办法,找到一个特别具体、特别细分、但特别常见的人类偷懒瞬间,然后围绕这个瞬间,去设计一套轻决策路径 +提示词模板 + 好的 UI 输出,让用户在最不想动脑的时候,最快拿到可修改的半成品。 而当这个偷懒动作被频繁触发,它就自然变成了习惯性的AI 肌肉记忆,而我们所做的应用,也就从一个工具变成了大脑外挂。 那 AI 产品的商业价值又该如何定义,可能有一类不在于能不能模拟一个人类专家,而在于能不能替用户做掉那些明明可以做但就是不想做的动作。 真正的市场不应该只盯着智能的天花板,往下看看,再懒惰的地板上也有大量的机会。 那再 AI 革命的宏大叙事下,我们追求的就不只是让人更强,让人更轻也应该进入视野。 人类会为强大而敬畏,但也会为轻松而掏钱。 思考下自己的日常,再环顾下市场,一个值得做的 AI 应用,不一定惊艳,但一定能替人类懒一次。 所以, 你想不想做一款 AI 产品,能替用户少动一次脑? 你能不能用 prompt、memory、数据和一点点贴心,帮人类多偷一秒懒? 如果可以,那它可能比我们写出一个能做十种事情的智能体,还更容易被买单和留存。 这类的机会还有很多。
阿里在商业创新上一直走前前面,马云等创始团队重新回归以后商业布局和外卖大战都是可以写进教科书。从原来的散装阿里到一个阿里,还有很多牌没有打完,我梳理了其中一部分。 投资美图:可转债投资,AI试衣、商品图生成等工具融入淘系生态,美图采用阿里大模型。美图本身也需要阿里的算力资源,阿里需要美图在图片处理上的能力 分众传媒:很早就战略入股,近两个月电梯间广告装上了碰一碰装置,广告可以直达页面。把展示广告做成效果广告,和阿里的合作模式是佣金分成,阿里送红包,如果用户使用红包购买了,分众会拿到一笔佣金。之后可扩展到其他的淘宝商家,线下广告网络与阿里大数据结合,提升广告精准度。 碰一碰支付:每周末补贴,和扫码支付相比用过一次以后就回不去了,3 秒内完成支付。为商家提供了提升效率和深度数字化运营,多次到店奖励加倍。用户的碰一碰红包消耗以后商家也有一笔分成奖励,可以获得更低的资金沉淀和更多的用户触达。 淘宝闪购:用暑假充足的运力发起进攻,市场份额从 2 成提高到 5 成,骑手团队、下沉市场、本地生活负债转资产、给淘宝带去了几千万的日活,一举多得。更妙的是发起外卖战的时候美团已经被京东打掉了90% 的利润,天时、地利、人和。 高德地图:扫街榜永不商业化,要打的是大众点评。高德日活 1.5 亿,大众点评日活 3000 万。谷歌地图在海外的餐厅点评模式做的很成功。 AI :目前是中国最好的开源模型、AI相关产品收入连续8个季度三位数增长、阿里云增速 26% 有相当大的增长空间。还有夸克 AI 月活 1.56 亿,国内AI应用榜首。
宝玉
2周前
如何发掘 AI 应用场景 相对来说,我还比较善于发掘一些日常工作生活中能应用到 AI 的场景,比如上面这些场景,对我自己来说都是蛮实用蛮有价值的,相信很多人看到我的应用和提示词,也能照葫芦画瓢应用起来,说不定也能提升效率。 我经常会想这三个问题: 1. 日常生活中我有什么问题没有被解决好,让我很麻烦或者很痛苦的 2. AI 现在能做什么事情了 3. 如果这件事用 AI 做,该怎么做 比如给孩子 PS 证件照让我很痛苦、为 PPT 找配图很痛苦、为公众号文章配图很烦、要给孩子讲故事希望有好玩的图,这些都是痛点。 如果我有类似这种费时费力的痛点问题,我会习惯性想借助工具解决,现在有 AI 了就会想用 AI 解决,这已经成了我自己的一个习惯性的反应。 但有痛点不代表 AI 就能解决问题,比如之前 GPT-4o 画图能力不错,但 PS 证件照,或者写中文就不行,因为它图像一致性不好,中文支持也不好,所以还需要了解 AI 能力边界在哪里。这时候只能等 AI 模型的进化。 然后模型升级后,比如 nano banana 发布了, Seedream 4.0 发布了,AI 有了新的能力,这时候一些以前不能解决或者解决的不好的痛点问题,就可以再用新的模型新的技术去尝试,看是否解决了。 其实前两步对普通人来说都不难,难的是怎么做,比如你知道 AI 生成封面图,能生成小红书图片,但是怎么写提示词呢?
Mr Panda
1个月前
这是100个AI 工具大集合,推荐给你 Learning Mindgrasp — 自动生成学习笔记和摘要的 AI 助手。 TutorAI — 个性化 AI 家教,随问随答。 Map This — 把复杂概念转为思维导图。 MathGPTPro — 专门解决数学题的 AI。 YouLearn — 把视频/文章转成学习笔记和章节大纲。 Fitness ChefGPT — AI 生成健康食谱。 PPLEGPT — 个性化健身和饮食计划。 GymGenie — 根据目标自动生成训练计划。 AI Meal Planner — 自动营养餐规划。 GymBuddy AI — 训练记录与进度跟踪助手。 Website Development Typedream — 无代码建站工具。 Framer — 设计与建站一体化平台。 Durable — AI 自动生成企业官网。 Softr — 将 Airtable/Google Sheet 转成网站。 10Web — WordPress + AI 一键建站。 Workspace Notion — 知识库 + AI 助手。 Taskade — 协作任务管理 + AI。 Coda — 文档与数据驱动协作平台。 ClickUp — 全能项目管理平台。 Mem — AI 自动整理和检索笔记。 Analysis Excel Formula Bot — 自动生成 Excel 公式。 Excelly — AI 分析和优化 Excel。 Rows — AI 数据分析表格。 SheetAI — 在表格中调用 AI。 ChatCSV — 对 CSV 文件进行自然语言提问。 Art Midjourney — 高质量 AI 绘画工具。 Canva — 设计平台 + AI 生成。 DALLE-3 — 文本生成图像。 Ideogram — AI 生成带文字的创意图像。 Remix AI — AI 风格化图片创作。 Code Github Copilot — 代码自动补全助手。 Amazon Codewhisperer — AWS 出品的 AI 编程助手。 Codeium — 免费 AI 编程辅助。 AI Data Sidekick — SQL 自动生成工具。 SpellBox — 输入需求即可生成代码片段。 Video Runway — 视频生成与编辑 AI。 LeiaPix — 把图片转为 3D 视频。 Kaiber — 文本生成音乐视频。 Genmo — AI 动态视频生成。 Stable Warpfusion — 稳定扩散的视频版。 Email Marketing Beehiiv — 邮件营销 + AI 内容。 Superhuman — 高效邮箱客户端。 Mails AI — 自动写邮件助手。 Robin AI — 邮件自动化客服。 Promo AI — 邮件营销文案生成。 Copywriting Writesonic — 全能写作助手。 Jasper — AI 营销写作专家。 Rytr — 快速写作与改写工具。 MarketingBlocks — 一体化营销文案生成。 Cohesive — 团队协作写作 AI。 Twitter Growth Tweet Hunter — 优化与分析推文。 Typefully — 线程写作与排程工具。 Tribescaler — 自动生成推文钩子。 Fedica — AI 驱动的社交媒体分析。 AI Social Bio — 优化 Twitter 简介。 LinkedIn Growth Taplio — LinkedIn 内容与增长工具。 Social Comments GPT — 自动写评论。 Postli — AI 生成 LinkedIn 帖子。 AuthoredUp — 专业帖子编辑器。 Supergrow — 自动增长 LinkedIn 影响力。 Instagram Growth HeyGen — AI 视频头像生成。 Submagic — 自动生成视频字幕。 Klap — 视频剪辑和重混。 Veed — 在线视频编辑器。 InMagic — Instagram 内容生成。 RepurposePie — 多平台内容复用。 YouTube Growth VidIQ — YouTube SEO 分析。 TubeBuddy — YouTube 增长工具。 Opus — 视频长内容切片。 Scrip AI — 自动生成视频脚本。 YT Copycat — 模仿热门频道写作风格。 Video Editing Veed — 在线编辑器 + AI。 Videoleap — 移动端视频编辑。 Capcut — 抖音旗下视频工具。 Unboring AI — 一键创意视频生成。 Keyframes Studio — AI 场景转视频。 Writing Typeshare — 快速写作 + 模板。 Grammarly — 英文语法检查。 Quillbot — 改写与总结工具。 Rosebud — AI 剧本和故事生成。 MoodPen — 根据情绪写作。 Podcasting Podnotes — 自动生成播客摘要。 2short AI — 把播客转短视频。 Podstash — 播客内容整理。 Type Studio — 播客文字编辑器。 Audo AI — 自动音频降噪。 Chatbot Development Chatsimple — 快速生成业务聊天机器人。 Dante — 无代码 ChatGPT Bot。 AirOps — AI 工作流与 Bot 平台。 Chatbotgen — 生成客服机器人。 Chatling — 网站嵌入式 AI 聊天助手。 Career Careerdekho — 职业探索平台。 Kickresume — 一键生成简历。 Langotalk — 语言学习聊天机器人。 NetworkAI — AI 人脉拓展助手。 InterviewAI — 模拟面试官。 Music Revocalize AI — 人声音色转换。 MusicLM — Google 文本生成音乐。 Synthesizer V — AI 歌声合成器。 Muscify / Soundful — 自动作曲与背景音乐生成。
Mr Panda
1个月前
#上下文工程 我最近在做一个内容摘要生成的小功能,本来以为是个简单的任务:用户输入长文本,我调用更强、更大上下文的模型,让它生成优质摘要。结果发现,这一过程的成本比我预想的高得多。 高质量模型 → 价格昂贵 大上下文窗口 → Token 消耗成倍增长 每月 20 美元的订阅费 → 很难覆盖这些成本 对比下来,连 OpenAI 和 Cursor 这样的公司都不例外。以我自己为例,上个月在 Cursor 上花了接近 100 美元,其中大部分都用在 Claude 模型上,这意味着 Cursor 从我这里几乎没赚到钱。 这背后反映了一个更大的行业问题: 用户对高质量体验的要求 → 迫使应用方使用昂贵的大模型 长上下文输入 → 成本随 Token 增长呈线性甚至指数级上升 订阅模式的收入上限 → 无法有效平衡高频、高消耗用户 因此,对于任何想做 AI 应用的人来说,“上下文工程”是不可回避的核心能力。它的目标是在满足任务效果的同时,最大限度减少传给模型的内容量,用结构化、抽取关键信息的方式,让模型少读冗余、多读核心,从而显著降低计算开销。 因此,对于任何想做 AI 应用的人来说,“上下文工程”是不可回避的核心能力。它的目标是在满足任务效果的同时,最大限度减少传给模型的内容量,用结构化、抽取关键信息的方式,让模型少读冗余、多读核心,从而显著降低计算开销。