从豆包的AI手机感悟到: 如果你敢突破陈规, 成为别人利益的掠夺者, 你才拥有暴富的机会。 豆包和努比亚的AI手机,刚一上市就被各种软件屏蔽。并且引发了巨大的舆论。而且在短时间内被抢空。 论功能,VIVO、OPPO、小米、华为一众手机做不到吗? 貌似是可以做到一部分,比如打开手机搜索。 为了不进一步打破内部默许的软件平衡, 其他手机厂商只好按部就班的阉割功能, 按照原定的营销计划卖手机。 谁都知道,踏出最后一步, 让手机自动操控软件是非常牛逼的卖点, 也是大众使用手机非常刚需的功能。 可他们不敢,不敢冒天下之大不韪, 不敢和软件撕破脸去把这个功能的最后一步完成。 这是一个默认你好我好大家好的圈子生态。 豆包和努比亚的合作,打破了这个生态, 获得了营销的卖点,解决了用户的刚需。 让软件布局好、培养好的用户习惯, 显现了巨大优化空间的商业转化的风险: 用户的注意力将不会停留在软件设计好的路径上。 进而广告、推荐内容都会迎来巨大的商业损失。 而这些损失,将是不知道什么时候才能换取回来的利益。 豆包和努比亚,只是用3000多的手机, 就把这些价值改变了,从而成为AI手机的优质口碑。 实际上AI手机并没有使用“抢夺”, 但已经让利益可以到手, 损失的利益去哪了? 新的商机在哪里呢? 都不重要,先把打破平衡的干掉, 屏蔽一切可疑的AI手机再说!
prompt如何不变成玄学? 让生成结果螺旋起飞的妙计! 第一误区:简短提示词 简短的提示词缺失的是前因后果。没有合理的因,结不出准确的果。我们想创作一个选题,就不能只让他创作选题,这件事是在什么人物身上发生的,是一件具体什么样的事,他有着什么样的社会认知,在这个切面下有什么现象背后的观点? 所有的内容都是一步步铺陈出来的,不是一句话就无因无果创作出来的,提示词工程的基本盘,是给到结果之前合理的推理铺垫。 妙计:做一个内容写几个步骤,每个步骤校对一次结果,在不断的校对中,切中你想要的那个最准确的判断。 第二误区:逻辑是复杂的 AI生成的内容逻辑一点都不复杂,我们的眼光总容易盯着复杂的逻辑觉得模型可能不擅长什么。但逻辑本身是可以通过交叉组合的方式,实现复杂的推导,如果我们让他看见逻辑可以拆成简单的推导过程,模型就会被带到你的轨道上。 妙计:挖掘出所有的可能性,让模型的推理变成堆积木,积木最顶上的内容就是结果,下面的内容全是阶梯。 第三误区:专有名词很好用 专有名词的确能让模型快速进入到某个词库,比如扮演XX专家,但实际上帮助是有限了,结果只能用来做参考。一个人是立体且复杂的,某个专家一定会有失偏颇。 妙计:干脆不要用专有名词,如果你能把这个专有名词,拆成很多标签,然后把标签组合成文字逻辑的文本,你的提示词就会变得更准确。 第四误区:两个极端词交汇 昨天有看到大家用弱智的博士生,或者高素质导师的智力低下学生。这很有趣,而且也只是很有趣。真实的有作用拆解,是给出符合金字塔原理的逻辑和符合由浅入深的语言规律。让我们兴奋的,是进入愿意学习状态的提示词,并不完全是那个结果。 妙计:拆解知识找到最擅长讲知识的那个人,利用他讲知识的逻辑,完成一次更加符合人理解的知识生成。 第五误区:严禁之后为什么还有? 因为模型有自己的程序要求,那个函数被锁定在了大词库中,用严禁是无法规避那个权重较高的大词库的。 妙计:让没有这些内容的文本成为参考,简单易用。减少多轮对话。或者直接上手能累着你啊? 下面给一个我修改后的“背单词”的提示词吧! 在回复中自取.....
我们来聊聊AI味儿: 第一种:先反差描述,然后急于解释。 因为模型的三观没有清洗好,所以大模型一直在扭转这种反常识 ,模型默认为是被迫要这样说。 然后就会接着说:老实说、本质上、其实等等词来进行转折。最后再补一个模型能够想到的案例,试图验证。 这个逻辑是非常缜密的。一定要符合:有效性与真理性。 把形式逻辑做到结果上,这些形式逻辑有很多种,还包括自问自答、定义阐述、案例说明。 第二种:表层示例 模型在组织过程中需要写出具体场景,还原它构思的完美的象,这个象又不能完全具象到刘阿姨、李大妈等等,智能通过比较大的门类层级。 看似都在推理中,实际与落地经验完全不是一回事,与执行差之千里,大体可以叫纸上谈兵。 第三种:虚空对比 在名词和动词的运用上,因为特别严谨,模型往往只能使用常用词,这在推理过程中,属于是进入了词的窄效应。 比如我们谈论哲学家,最优先选中的可能是亚里士多德和弗洛伊德,并不一定能落到维特根斯坦头上。 当你看到一篇文章经常出现你看到上一个词和下一个词在相关性上极高,属于有点文化就能想到的关联词时候,就很可能发现了模型的局限性。 第四种:语义与语用的连接。 模型的严禁程度不允许语义产生歧义,所以在语用上,一定会跟着进行约束,以达到表达的准确。 一旦进入一个需要解释的内容,必定会跟进解释,这两者中出现的连接词,往往包含了我们经常看到的:不是、是、而是、不止是、重要的是、本质上上、说白了。 语义是阐明这件事,语用是约束这件事所处的环境条件。 第五种:过度完美 模型的过度完美表现在,他要把一句话讲清楚,是非常有机器语言规律的,并非人性表达规律。 人的表达,往往拆开来这句话,是不容易形成完整语法的。即使符合语法,也会用词语规避掉完美,来符合自己的语言习惯。 未经雕琢的文字,可以是短句。比如“未经雕琢的文字”和“可以是短句”,就都是短句。 如果连起来写就会很别扭,这是我的习惯。 如果AI的习惯,会写:没有经过雕琢的文字也可以是由短句组成。 因为拆开,对于模型没有设定风格的时候,就不算一句话。 即使设定了风格,在推理过程中,也会偶然选中了必须选中的那个选项,也就偶尔还会冒出来AI味儿。 当然还有一些比如AI认为“讲”、“说”和“写”拥有不同的习惯。 当他识别文本为讲,那就是生活聊天风格,会比较多儿化音或者排比句或者很别扭的地方也放一个“了”做结尾; 识别为说,那就是单人叙述风格,带有大量说教的口吻,连词就会变多,解释也变多; 识别为写,那就是严谨到不能更严谨,长句不断。
在Mr Panda的X冷启动社群中,我关注了三个人,李亿、Bob Zhang、木子不会代码。社群我倒也没进,我每天都在砍信息,避免不必要的注意力转移。 主要是这三个人的巨大变化,让我有些许感慨。对比接广告,Mr Panda社群中盈利的一些小钱何足挂齿。 我们都在这个平台上,都知道这里并不能发家致富,但可以让我们在自我推广和自我输出找到一个平衡,来适应“对持续输出保持敏感性”这件事。 其实我才是被远远甩在后面的人。我曾以为我的AI提示词工程课这么好,大家不应该是汹涌而来么?当一天中没一个点赞的时候,虽然我心中有落寞,还好我不常喝酒,不然又会多亏几瓶酒钱。 人的行为习惯是“想要-值得-拿下”(这六个字是AI给我的,原文是“人会认为值得的东西,付出行动去获取”,小年说过我太文艺青年,那是一个不咸不淡的风格,必然没有什么吸引力),就像喜欢他们的内容一样,填补我生活的部分空白,这是个持续孵化的过程。 以他们的实力,不必用故事,日常做分享,只要有价值,大V只要给一些转发,也能一次乘风起。 他们发的越多,我们就会看到,优秀人的特质,值得被关注的特质。 优秀,很笼统,具象的点评,又不合适。那就只说这类人群的现象:如果你曾经有被人称赞的地方,那么请你展现出来,这个世界就有人鼓掌,这本就是社交特点。 而我们经常把变现作为目标,所以会有一些盲目的追逐,却恰恰展现了,自己对社交网络的青涩认知和对赚钱这件事的虚空幻想。 经过这一两个月的锤炼,看到你们逐渐纯属,发出来的东西越来越成为你们自己本身的样子,越来越适应这个平台的喜好并保持自己的特点,这是挺难的一件事。 我并不是什么过来人,只是真心觉得,多关注了三个让我了解世界的信息窗口。我的关注,是你们应得的报酬。
nano-banana的更新,是一个AI创新的历史性节点。 这个模型揭开了一块AI行业的一块遮羞布。 所有能打的AI绘画模型,不是产品的原因, 仅仅是因为不懂业务,只看需求! 他们认为,客户的需求很重要, 于是追求完成这个需求。 但是完成这个需求,需要扎实的业务功底。 和一个巨长的业务执行流程,整个路径非常复杂。 相当于让一个种地的老汉,去米其林后厨做一份牛排。 大厂同行:都在追求炫酷的简单输入,炫技输出。 领导很兴奋,员工跑断腿,效果打折,周期创作周期巨长。实际在业务上,能解决的问题非常有限,业务识别空缺,导致模型产品化路径的曲折。 总是研究的放后面,能引发话题的放前面。 废了一百年的努力,做出来一个半吊子东西。 结果:小白骂娘,从业者骂娘,营销号捧上天,消费者寥寥无几。 小厂同行:技术实力不足,资源不足,使了大劲满足一点点需求,还需要强大的知识探索欲,技术实践成本高,花几个月时间,巨大资金成本解决一个小问题。有一部分使用基础,熊瞎子劈苞米,消费者丢一群再拉一群。迭代根本没法持续覆盖。 结果:学会的用烦了,没学会的又很难学会。 开源同行:应用做了七七八八,精神世界满足开花,加起来服务没几十万人,全都是赚到钱没给开源创作者花。模型迭代一次,坟头高一尺,没准哪个模型出来,过去的技术根本没有迭代的必要。 结果:有道义的同行人,纷纷跳坑,只剩下几个孤儿。 懂业务,是做AI的前提。 我很早就说过,2023年我之所以用AI绘画, 是因为我要画分镜,我们花了大量的努力, 在2024年初就实现了和名人合影,训练一致性模型。 很多现在简单的功能在一年多前都可以实现, 不懂业务的人,连看都看不懂。 今天nano-banana每一个功能都是直切业务核心点的。 他不是单纯的一个模型技术的更新。 论修改,其实有很多了,方法也有很多。 但是这个模型,一次性把所有的业务关窍打通了。 其实sora已经很厉害, 但是sora对业务的覆盖没那么全面。 几个月前,很多谷子店类的供应商, 都开始用sora做业务内容了。 但限制很多,可是从我们对模型理解来说, 开源模型是技术瓶颈, 但是对于sora这些模型,有些业务细分, 不应该是这个模型的瓶颈。 举个简单的例子,让柯南从空手到拿一枝花没有问题。 但是你让一个手办,手上多一个东西却非常难。 从业务的角度讲,这件事其实一点不难。 可sora就是不给你优化, 是技术不到位吗?MJ那么简单的操作,实现不了吗? 完全就是对业务理解的偏差。 那么我们再举一个MJ的例子, 这个模型的审美水平强不强? 说实话,一年以前, 我们就可以用这个模型来实现多视角服装模特了。 还有仿真人的虚拟真人角色创建。 但是技术实现上非常讨巧, 至今可能没人能做到, 我们也不愿意把这些东西传播出去。 但大多数人的视野里,是看不到MJ模型本身的能力的。 MJ公司追求的什么我也不知道, 就知道他们在不断的做,跟业务贴边的东西, 就是不好好优化,导致这个模型的二次修正特别多。 我再说一遍,上面两个问题,不是模型能力不行, 就是公司对各行各业需求的业务不理解。 谷歌证明给你们看了,谁也不需要反驳, 站着挨打就完事了。