Yangyi
1年前
很多人说,大模型时代创业很容易死。其实这也分怎么做,非要去跟openAI卷,那确实是容易死。 AI时代你只要搞明白,输入端和输出端,至于里面的黑盒技术怎么变化,无关紧要。 这就意味着,如果你是从底层往上做,盒子随便换,表现层也可以随便换,但本质从没发生过改变 我举个例子,比如invideo AI,他做的事情是: 1、输入一段想法 2、他将想法拆解成了分镜头脚本 3、依靠脚本去视频素材库找素材,然后返回回来 4、拼装在一起,让用户可以进行微调和替换 5、输出视频 好了,他这个框架其实很简单,看一眼就知道是通过RAG做的:把一个prompt理解成一个question,然后对这个question做了sub-question,最终通过sub-question的query去检索回片段。 那soraAI来了能干死他么? 显然不能,因为他的优势在于工程化,而不是AI。 他只需要把API从RAG替换到Sora,就能瞬间起飞。 因为当其他人还在一个输入框生成一个视频片段的时候,它已经可以定制化生产优质视频了。 这个例子就充分说明,Sora是给他赋能的,而非卷死它。 那卷死的是谁?或许是Pika和Runway。 但Pika怕死吗?它本身就是个资本产物,股票都套现完了,最终收场不了的是持有股票的韭菜,至于Pika,死不死的又能怎样? 可这和普通人有什么关系?独立开发者创业,能搞个SVD套壳都已经是大牛了。 回归正题,如果你正在做SVD套壳,你要怎么避免灾祸?也简单,把工程化做好。生产流程是符合用户需要的,这就够了,至于说AI能力,谁牛接谁。 从深度上讲,抓住底层就是抓住工程化,抓住对用户使用体验的理解。 在一个场景不断去深化用户的使用路径和使用体验,而不是优化AI本身,AI交给时间,对用户在意的功能理解把握住就好。 从广度上,也可以抓住底层。 比如你是做图像生成的。不论你是做什么类型的图像,是头像也好,是证件照也罢,甚至肖像,写真,宠物照片。到头来不也是一个input进一个黑盒,最终给照片吗? 那黑盒是谁也不重要。所以你应该想办法封装隔离好生成能力,把工程问题和生成问题拆解开。 从这个维度上讲,你应该多做场景,而不是深挖生成能力。因为生成能力永远在不断迭代,但场景依旧还是那样。 比如你接了midjourney API,你可以用他做可爱婚纱照,你也可以用他做宠物头像,这些都可以卖钱。那为什么不做广度而是不断去深度优化一个API的提示词呢? 从这个意义上讲,底层意味着一套快速搭建业务场景的能力。如果你能快速搭建各类型的生图场景,你就赢在工程上了,哪怕突然有一天,dalle也超越了mj和sd,你依旧可以活的潇洒。
Yangyi
1年前
如果去做天使投资,你现在会看什么类型的项目? 天使投资是最难做的,很多基金DPI都小于1,投不好基本就融不到钱了。所以如果是你,你会怎么选择? 我请教了一个朋友,朋友讲了一个技术变革周期的故事。 从上一轮苹果开始,先是科研人员有了一些成果,促使底层技术有了革命性进展。 然后出现了iphone时刻。 之后伴随着一路网络基础设施建设,以及一些底层开发生态的建设,把原来web时代的场景,迁移到了移动终端上。 当越来越多的场景迁移完成,开始卷不动了,人们就开始去做新场景的创新,出现了抖音,拼多多这种巨头。 应用侧没的卷了,就开始卷内容,无数多的人挤进去做内容创新。 这个路线,放到AI上也一样可以借鉴的。 新技术变革就像GPT3.5出现时一样,前期也是在卷模型,RAG,infra,所以这种做底层基建的,是会考虑投入的。因为长期来看,生态需要它。在每个赛道总是能跑出1,2个头部并持续发展下去的。 然而目前我们还没进入旧场景迁移的时候,目测现在的应用层还远远达不到真正实用的要求,所以暂时也不会考虑投入。很可能技术的势头一到,重新做旧场景迁移,会比现在快的多。 那现在创业者做的事情,往往就会成为技术债务,船大难掉头。所以目前不会投这块的项目。 我感觉大家思路都差不多,我考量的是AI应用不成熟,所以会选择做AI流量直接变现,或者toB去做服务解决方案,而不是自己做个东西。 但其实AI应用里也会拆分,往往也有底层的应用范畴。比如和infra层对接比较紧密的,抽象能力足够强以至于可以应对变化的这种项目,也是值得看的。 这个思路其实也适用于visionOS带来的空间计算变革,只是感觉visionOS才刚刚走到新技术变革--->底层基础建设 这块.