初码
9个月前
在这除夕夜里,来聊点全世界唯一首发的重量级干货吧,看问题需要看本质,今天带大家读懂奥卡姆剃刀下DeepSeek一炮而红真正的原因,那就是“工程的胜利”与“这依然是个达尔文的世界”,这是人类自我迭代道路上的又一次精彩的自发性纠错。并且,在最近20年的科技发展史上,已经不止一次重现了这样的精彩过程,虽说世界是残酷的达尔文,但这种迭代过程下所展现出的协作能力,也向我们证明了达尔文与人文的共存法则,下面详细说说: 一、DeepSeek揭示了一个残酷的事实,天才永无上限,人与人差距巨大 具体技术细节的东西,就不多赘述了,即使外行人,这几天通过看新闻和各类大神的帖子,应该也能模糊理解出一个大概,即这次DeepSeek在工程和思维模式上实现了一些突破,也在低成本要求下探索出一些巧思。 那么这种大浪淘沙下进步的核心因素,就是幻方不缺钱的背景,以及最重要的一件事:他的人才储备机制。特别是后者,这相当重要,这相当重要,这相当重要,一定要重复三次。国内头部量化公司,大抵上都爱招聘IOI、MOI、NOIP、ACM的获奖人才,甚至ACM这种偏业务建模向的人才会面临被瞧不上的风险,这不是玩笑,而是严肃的智力等级差异。 很多人会觉得,难道META、谷歌、微软、阿里、腾讯这些大厂的高端人才就不行吗?老实说,还真就不行,这里有多个角度上的差异。 首先大厂有一些他固有的规矩和世俗,哪怕谷歌微软这样众所周知的技术纯粹向的大厂也做不到完全自由开放的研发环境,这和学界众多的学阀故事有着异曲同工之妙。 而幻方恰恰是在这方面实现了一定程度的降维打击,量化机构的决策机制特别个人化或者小团队化,而在建模能力和最终策略的绩效考核上,也和能力强挂钩,特别有趣的一点是,全世界最没心没肺爱拿老板的服务器烧钱测试自己的模型和策略的,就属量化工程师了。所以这就造就了一个天然的、特别适合的,用来做数学向、算法向创业的人才土壤环境。 再者,大家低估了对于固定范式挑战的难度,说一个更听得懂的通俗的例子,在大家都用Python做AI产品、金融分析的时候,突然跳出来一个人大叫一声说,Python是垃圾的动态语言,想要更上一层楼,一定要提高行业入门门槛,基于更加适合工程化的大型静态语言才能实现更牛逼的应用。不好意思,对于发出这么一声大叫,真的很难很难很难,不仅需要面临对范式的挑战,更要求发声者有着深厚的软件工程理解、强大的心理素质以及无比厉害的思想实验深度,而如果他不是行业大佬,还只是个新人,那么他能做的只有默默研发,等真正基于他的想法做出好东西的时候,才能得到认可和理解,否则一定无人问津。 这个例子换到DeepSeek上也是如此,纵观整个大模型研发的过程,别说软件工程了,涉及核心原理神经网络相关的数学工程、涉及高维数据处理的数学工程、涉及训练过程的算法工程、涉及性能处理的算法工程等等。在这些方面,一般的大厂的高级架构师和核心主程甚至光是看明白原理都已经够吃一壶了,在老板的目标压力下,能做的也只有在依葫芦画瓢下夹缝创新了。 所以说到这,不知道你是否稍微能理解为何AI的成功首先出现在美国,而之前中国各大厂除了追赶也只能追赶,这背后的因素,除了土壤,还是土壤。 实际上,一切的一切也才刚刚开始,我们甚至可以说,在大模型领域,连工程都谈不上,目前还只是方法、函数与过程的阶段,哪怕你说这也算工程了,那么也只是数学工程、算法工程上的小架构和小进步,至少这次DeepSeek,还没看到任何软件工程、业务工程、管理工程上的明显突破性进展。作为一名资深软件架构师,请相信我的判断,我能够大胆的说一句,到目前为止,就我个人长期的体验来看,目前大模型世界的所有软件产品背后的业务建模和产品产出(包括各端),除了WebUI好看外,都还是草台班子,是巨大的草台班子,是全行业全员草台班子。不用看代码,只看产品体验就完全感受不到背后对业务建模的深度理解和渴望,即使版本频发也只是功能的迭代而非架构的解耦和重构,换言之,有相当数量的非软件专家在从事AI产品的开发工作,比如就我自己比较多看过的SD的核心和UI,一个字,惨不忍睹,赶紧来个人重构下吧。。 但不管如何,这既是迭代过程的无奈和必须,也是未来的巨大机会。今天我们所讨论的是工程的胜利,而工程这东西,本质上就是各行各业的金字塔尖的一群人,在所属领域内的智慧涌现,这种涌现,很多时候不是循序渐进,而是突然转向的,当你看清楚这个事实的时候,就会知道我们现在需要的是什么,不是人才而是天才: 是思维深度比别人强10倍的天才! 是光通过思想实验就能建立起迷之自信的天才! 是对重构、对解耦有着极致追求和快感的天才! 是在重大决策上可以一眼万年的天才! 是绝对的超级天才! 在这里,我也歪个楼说一段题外话,前段时间我说准备在春节期间好好讲讲川普和左与右的事情,今天先说一小段,对于川普本人,每个人都有自己的评价,但不管如何,在这次的大选,他与马斯克对于美国,对于全世界,最大的贡献,就是将这个世界恢复正常,重新回到残酷的达尔文普世价值中来,对的,这个说法,左派不敢提、不敢想,一往深说就如丧考妣,但很遗憾,这才是正常的世界样貌,这才是正确的世界走向。如果说中国共产党在过去50年做对了什么,那么高考制度一定是其中一件,再看看美国的高校和大厂在搞啥,DEI?不要以为这东西清除了就没有后遗症,真正劲大的还在后面,至少延迟5-10年的长期影响。 这个世界,在过去的200年,每一项重大的科技革命和突破,都是厚积薄发的必然加上个别天才的偶然。没有爱因斯坦,狭义相对论大家伙都差临门一脚,但广义相对论可能要延迟至少50年。如果只有富兰克林的数据和思维,没有沃森和克里克超强的想象力和洞察力,10年也未必解读出双螺旋结构。如果没有香农构建出信息熵的世界观,那么通信时代和计算机时代,很可能要等热力学的老大爷们再折腾几十年才能步入正轨。类似的例子实在太多了,我们必须承认,这个世界的进步属于天才。 二、但庆幸的是,在近20年,人类已经建立起一套天才与普通人有效协作的机制 我们无比悲观的是,天才的涌现是偶然的,因为这依赖全人类突突突生育下的基因突变(目前我还不能理解这种随机,也许有一天能够发现涌现天才的必然性原理和机制),但同时非常开心的事情是,在过去的20年,天才与普通人的协作机制已经越来越纯熟。 前面我说过一个东西,那就是GitHub奇迹,详细可以看这篇帖子:。原文中我总结道:“Github奇迹,也可以理解为,一帮原本没有展示自我机会的中上游开发人员,通过Github崭露头角,带领着千千万万的中下游开发人员,浪里淘沙、百里挑一,成就了一个又一个新的软件奇迹”。 而原文中没有补充说明的是,这种GitHub所给予的机会,是需要天才适时来纠错的,在这里,就不得不再此搬出安大神(Anders Hejlsberg)-这位全世界最科班、最静态、最深度、最抽象、最解耦、最重构的超级程序员、超级架构师。 当这种绝对天才级人物,发现全世界这么多受益于GitHub奇迹的前端程序员或者低端程序员们,始终受困于javascript那不堪一击的工程能力时,是的,他出手了,捣鼓出了TypeScript,直接将相关软件生态的工程能力,拉升到了一个全新的高度。 这就是天才和普通人之间的协作,你可以说这种协作是偶然的,比如PHP也经历过相当的繁荣,但至今看不到谁来拯救。但也可以说这种协作是必然的,用整体的熵增换取局部的熵减,这是人类至今为止的发展规律,特别是经历了PC互联网时代、全球化时代、移动互联网时代后,直到现在的GitHub、arXiv时代。我们越来越能感受到,“全民大力出奇迹”和“坐等天才涌现”这两件事在各行各业中持续贯彻和发展。 三、恐怖的自迭代和工程爆炸 在过去的2年里,当我第一次领略到ChatGPT能做什么时,我的脑海里就已经涌现出“永生”二字,很多人觉得我在开玩笑,但我深深的知道,这是一种“在必然中等待偶然”的必然。其背后的思考,就是AI时代,自迭代的恐怖和对工程能力的爆炸级促进。 也许下面这个例子的类比不太恰当,但差不多可以帮助思考,这次DeepSeek除了整体的工程进步外,也在调教AI的自迭代能力,也许人文领域不使用RLHF与人类对齐会造成很奇怪的结果,但在纯逻辑领域已经有所顿悟。那么未来的一天,如果能够持续的在思考上自我迭代,这会产生多少无法预料但又十分可观的涌现。 其实对于AI自迭代这块的思考,我的知识储备和知识结构还不足以支撑我去深度思考和理解这个领域的走向,但从一个大的方向看,信息与计算,在物理上的本质已经慢慢被揭示,相互之间的同步感越来越强烈,过去200年,我们搞清楚了物理的世界,就像研究粒子为何自发的运动,在未来的100年,信息的规律也会逐层揭开。你要说未来的AI不能自迭代,我是不信的。 那么再回到工程爆炸,其实这条路径,早就有了十分具象化的清晰画像,通俗的说,哪怕GPT就停留在2025年初的水平,那么他也能帮助全球所有领域所有工程人员提升工程效率,这种提升,是一种肉眼可见的能够量变产生质变的级别。比如软件开发,AI已经切实的减少了至少一半以上的工作量,最重要的是,AI还能实现更加靠谱的自动化测试,甚至能主动提出设计模式、全盘性的对架构提出切实有效的重构建议。没搞过软件工程的人可能无法理解这其中的疯狂所在,这对产业来说,就是光速促进,唯一欠缺的就是各位软件公司的老板,应该好好想想如何能强迫、强制自己的程序员把AI全面应用到工作中来。而软件产业,也已经成了所有产业的底层基石,当基石都在疯狂加速的时候,对上层产业和学科的促进可想而知。 我们能想到所有的学科领域,都会在未来的5-10年里,在一种必然的工程爆炸下,慢慢进入到一些很神奇、很微妙的类似AI自迭代的过程,在观察中你会慢慢发现,人类开始跑步迈向永生了,这不是纯粹生物学的事,这是全部学科的共同进步所带来的真正的天方夜谭。 其实这次DeepSeek事件里,我本人是非常激动的,作为一个喜欢正本清源的纯粹架构师,看我的BIO就能知道,我在软件领域里是小众,当所有的大厂架构师都在吹嘘自己如何知晓云原生,如何构建超大规模基于云的系统时,其实真正的天才架构师一定会建立高效而靠谱的物理机架构,云原生唯一的价值只是去耦合那不得不用他的CDN等场景,而StackOverFlow就是类似DeepSeek的天才。 现在,一个DeepSeek天才勇敢的站出来,给大家指明了方向,那么未来,我看真的不远了!
初码
9个月前
川普发币,MAGA拥趸们出钱出力收获了开心奉献的情绪价值,川普集团和庄家挣得盆满钵满收获了大量资产,大家都拥有美好的未来,不知道为啥要吐槽这种市场化的行为。真正该批评的不应该是那种扭捏的“我不是为了挣钱”、“我承诺不减持”但却始终不公开地址的XX巨头吗?好了,也简单分析一下川普发币吧: 1、川普不是第一次发币,也不是第一次割韭菜,前面的NFT早就归零了,这次稍有区别的是,成为了现象级行为,并且川普还有4年任期,所以本次归零可能会经历漫长的过程。同时值得注意的是,本次发币友共识出现的苗头,币圈的基本面就是共识,一旦这种苗头持续放大,那么TRUMP可能会避免归零路径,一跃成为超越DOGE的第一稳定MEME的存在。 2、那么普通人最关心的就是,既然TRUMP有企稳的可能性,那值得投资吗?答案是否定的,在此再次重复金光闪闪的4字定律:盈亏同源。币圈的市场,只有交易机构(CEX、DEX、各类DAPP以及其商务员工)、庄家(发币方、操盘方)、白色科学家(资深交易员、量化专家)、黑色科学家(黑客、内鬼)、专业机构(量化公司、技术服务公司)等在赚钱,这些必定赚钱的实体,在一个长的周期内,会以专业技能和信息差为基础,持续的通过手续费、佣金、服务费、一次性盗窃等方式去掏空其他所有人的钱包。如果你发现身边有NewFish通过运气在TRUMP上赚到了大钱,除非他是那万中挑一的自律人中龙凤,如果不是,那么毫无疑问的,这些赚到的钱,一定会在他后续的几个月内,通过现货反复换手阴跌或者合约爆仓的方式全部损失掉,甚至大概率还要倒贴钱。这个路,也是目前X上99%的币圈大V曾经走过但是永远不会对外承认的路。你如果想投资,先问一下自己是人中龙凤吗?是币圈大V吗? 3、这次发币,引来了上一段里所说的那些其实一直在亏钱甚至都都要卖屁股的币圈大V们(不分中外)的狂欢,那么未来数字货币的走势在川普任期内真的会乐观吗?答案也是否定的,甚至是极度悲观的。下面我稍微论述一下,比较难懂,但是如果你看不懂也没关系,就老实听着就好了,别叽歪,叽歪越多,吃亏越多。 在川普的上一个任期,经验不足导致上了很多建制派的当,各怀鬼胎,治理结构一塌糊涂。而这次得到了以马斯克为首的更加团结、更加科学规律、也更加铁腕的保守派的帮助。这是真正的右派,要观察政策的走向,一定要理解这样的右派内心深处真实的想法和价值理念,才能做出正确的判断。 那么这样的右派对于币圈到底是怎样的认知逻辑呢,总结有如下: 1)赞同金融自由的权利,CEX、DEX、DAPP,这些都是天赋人权的创新自由。 2)强调法治与合规,任何币圈的行为,都要遵守法律,都要业务合规、税务合规、证券合规。 3)了解币圈当下只有金融功能但无实体业务挂钩的虚无,但出于对未来AI、脑机等技术的涌现,以及可能出现的社会治理结构的大变化,对币圈保留那么一份宽容和探索。 所以当你深刻理解以上逻辑后,你就能理解,为啥马斯克会支持比特币支付、热情时会喊单狗狗币,但当川普币有点疯狂失控时并没有来凑这个热闹。 一个没有实体业务的币圈,一定无法获得纯正右派的持续支持,一个引导赌博、牛皮、谎言、欺诈的市场,一定会收到纯正右派的治理铁拳。川普可以赚钱,但第二任期内更加靠谱的团队会约束他的行为,也一定会对不受控的数字货币世界开展深度整治。
初码
9个月前
对价值的分析真的是一件有意思的事情,看到很多牛鬼蛇神的股评人、金融分析师、行业观察员竟然看衰今年的英伟达,真是笑了,倒不是嘲笑,而是对价值的透彻理解和表达真的是一件很有快感的事情。再来复盘一下AI和英伟达吧: 1、到现在还没看懂AI是啥,AI在干啥,AI会导致怎样社会变化的人与已经看懂的人会形成大相径庭截然相反的两种价值趋势判断,前者认为AI有泡沫、大模型到头了、训练不产生价值等等,而后者则知道,一切才刚刚开始。当然了,后者才是真理,前者有很多金融圈的分析员自以为还能用对行业的分析方法来分析AI,实际上AI已经不是一个行业了,已经上升到社会结构的组成部分,只有在技术原理上、在工程发展规律上、在社会变革维度上认识到这种变化,才能真正看清楚英伟达的走势。 2、顺着上一段继续说,AI在2025年,在业务层面,大家一定会看到,无论是超级大模型也好,还是细分各层级的差异化产品也好,都会从高高在上的新鲜玩具,逐级渗透进所有行业、所有人的工作和生活中去,变成一个人人都需要的刚需。同时也随着越来越多的资金背后的智囊看懂了AI到底是啥,全球总投资额会持续增长,从我能touch到的直接采购方的反馈来看,中国市场今年就有3-5倍的增长,全球趋势大致也是如此,背后的最大直接受益方就是英伟达和台积电。 3、再说回英伟达,H100虽然可能会停产,订单下降,但基于Hopper的H200才刚刚开始大面积出货,这是Blackwell彻底成熟之前的完美过渡。同时H100的售后、生产加工、DIY市场,则会继续夯实Hopper的零配件的生产供应量。 4、很多人担忧Hopper的疲软,会导致定价下降以及利润的下降,这就是对市场结构的完全不了解。在过去的5年,英伟达用20、30和40系游戏显卡证明了一件事,那就是在强大的技术和经验碾压面前,绝对的卖方市场是存在的,定价权和利润权完全掌握在卖方手上。至于所谓的更新换代的利润下降,那也是下游品牌方受影响更大一些,比如4系游戏显卡,英伟达原厂给华硕、七彩虹等AIC工厂的芯片价格原本就不高,比如4090的芯片一直就在500-700美金之间,就算终端4090游戏显卡的价格上下波动5000块,影响更多的也是AIC的收入和利润,英伟达完全稳坐钓鱼台。 看懂的,恭喜你,已踏上未来之船!
初码
9个月前
想到前几天在群里聊到的一个话题,一个人,能认识到自己的不行,这才是最牛逼的,承认自己的平庸,是走向更成功必经的一道坎。说个自己的事,在上学的年纪时,初三夏令营就能有样学样用幂级数展开独立推导欧拉公式,老师也说牛逼,从小到大周围人都说是天才,但当时在学习几何、拓扑类题目的时候,总觉得把握不好空间感,那种感觉难以言说,此后10多年一直纠结于此,似乎是学习不得要领,又或是不够努力。直到工作后有一天,我终于醒悟过来了,这尼玛哪是什么方法问题,这就是智商问题,在纯数学上,自己哪是什么天才,就是个普通人,和其他都没有关系,本质上是智力的欠缺导致逻辑深度不足,难以思考复杂的空间结构。当我意识到这一点时,一下子就轻松解脱了,因为这不再是一个主观问题,而是客观上的大脑物理差距。 再说个有趣的事,比如在知乎,就说清华北大各类985的本硕博挺多的吧,就单在一个物理话题上,每天在相对论、量子力学话题下回答问题的大V很多,但如果对天才的定义是:“不照本宣科独立思考,独自达成与理论相同的理解,在知识深水区、关键区内具备属于自己的、非教材的叙述语境和思考逻辑,日常能够在非事务性研究中实现创新,可以设计自己创新思路下的完整工程架构”,那么很遗憾,在整个知乎里,可能都找不出5个来,常见的大V,比如赵泠、王清扬等,很遗憾都不属于此列。说的更刺耳一点,他们相比普通人可能还挺聪明的,但与真正的天才比较,就只剩下勤奋二字了,只是刻苦学习而已。说3个我看到的有天才倾向的知乎物理用户,“洗芝溪”、“阿布大树”、“长尾科技”。 那么真正的天才到底是啥样子的呢,去看看杨振宁的公开演讲就知道了,那种在世界认知、物理认知上的轻描淡写但又力量十足的对底层逻辑的理解和阐述,真的就是天才般的存在,就那种言语背后对世界结构与奥秘的知道和不知道,这种斩钉截铁真不是做题能做出来的,这是一种天赋下的强大自信。