向阳乔木
20小时前
AI在重新定义芯片该长什么样。 芯片也在决定AI能走多远。 有三个趋势: 1. 从通用走向专用。 以前大家都用通用GPU跑AI。 但现在会发现,针对大模型推理、训练、端侧部署。 芯片的设计逻辑完全不一样。 未来3-5年,我觉得会出现更多专用AI芯片。 比如说,训练芯片要堆算力,推理芯片要省功耗,端侧芯片要低延迟。 英伟达现在也在分化产品线,H系列做训练,L系列做推理。 国内像壁仞、燧原这些公司,也在找差异化定位。 未来不会一家通吃,会形成 "训练有训练的王者,推理有推理的霸主,端侧有端侧的玩家" 这样的格局。 2. 存算一体突破,解决内存墙问题。 现在大模型最大的瓶颈不是算力,是数据搬运。 芯片要不停地从内存读数据、算完再写回去,这个过程太慢、太耗电。 存算一体就是把计算和存储放在一起,数据不用来回搬了。 技术如果突破,对AI的影响巨大。 清华、中科院、还有一些创业公司都在做这个方向。 未来3-5年,如果存算一体芯片能量产。 让大模型的推理成本降低一个数量级,很多现在做不了的应用到时就能做了。 3. 芯片和算法一起优化。 以前算法工程师写代码,芯片工程师做芯片,两边各干各的。 但现在很多公司在做联合设计。 算法知道芯片的特性,芯片针对算法做优化。 苹果就是,他们的神经网络引擎和iOS的AI功能是一起设计的,所以iPhone上跑AI模型很流畅。 特斯拉的FSD芯片也是这样,针对自动驾驶算法定制的。 国内觉得华为在这方面做得比较好。 昇腾芯片和盘古大模型、鸿蒙系统是打通的。 未来这种软硬一体的能力,会成为核心竞争力。
Stable Diffusion背后的秘密:原来一直在去噪,不是在画图! --- 你可能用过 Stable Diffusion。 当输入"一只猫坐在沙发上"。 然后,你看着进度条,一点一点往前走。 10%... 20%... 30%... 图像慢慢从模糊变清晰。 一开始,全是噪点。 然后,隐约能看到一些形状。 再然后,能看到猫的轮廓。 最后,一张清晰的图出现了。 你有没有想过,它到底在干什么? 答案是:去噪。 它不是在"画"图。 它是在"去噪"。 一开始,给它一张纯噪声图。 就是那种电视没信号时的雪花屏。 然后,它一步一步把噪声去掉。 每去掉一点,图就清晰一点。 去了 50 步,图就清晰了。 这就是 DDPM:Denoising Diffusion Probabilistic Model。 (去噪扩散概率模型) 听起来很复杂,但核心就是两个字:去噪。 但这里有个神奇的地方: 它怎么知道该去成什么样? 我是说,同样是一堆噪声, 你可以去成猫,可以去成狗,可以去成车。 它怎么知道你要的是猫? 答案是:你告诉它的。 你输入"一只猫坐在沙发上"。 这段文字,会被变成一个向量。 然后,在每一步去噪的时候, 模型都会看这个向量, 知道:哦,你要的是猫,不是狗。 所以,它去噪的方向,是朝着"猫"去的。 这就是为什么,你输入不同的文字, 会生成不同的图。 因为去噪的方向不一样。 而这一切,都建立在一个简单的想法上: 生成,就是反向去噪。 你先学会怎么加噪声。 然后,反过来,学会怎么去噪声。 去噪的终点,就是生成的结果。 注意,这是 2020 年的论文突破。 从那之后,所有最好的图像生成模型, Stable Diffusion、Midjourney、DALL-E 2, 全都用这个思路。 不是 GAN,是 Diffusion。 因为 Diffusion 更稳定,更可控,生成的图更真实。 另外,你玩Stable Diffusion时,可能调过下面参数: Steps: 50 CFG Scale: 7.5 Sampler: DPM++ 2M Karras 代码跑通了,图生成了。 但你可能不知道这些参数是什么意思。 Steps 是去噪的次数。 Stable Diffusion 不是一次性生成图。 它是一步一步去噪。 Steps = 50,就是去 50 次噪。 每去一次,图就清晰一点。 Steps 越多,图越清晰,但也越慢。 Steps 越少,图越模糊,但也越快。 一般来说,50 步够了。 CFG Scale 是文字引导的强度。 CFG 是 Classifier-Free Guidance。 意思是:你输入的文字,对生成的影响有多大。 CFG Scale = 1,文字几乎没影响,模型随便生成。 CFG Scale = 20,文字影响很大,模型严格按照文字生成。 CFG Scale = 7.5,是一个平衡。 既听文字的,又有一点创造性。 太低,生成的图和文字不匹配。 太高,生成的图太死板,没有惊喜。 Sampler 是去噪的方法。 DDPM 说的是"去 1000 次噪"。 但 1000 次太慢了。 所以,后来有人发明了更快的方法。 DPM++、Euler、DDIM... 这些都是"怎么更快地去噪"。 有的方法,20 步就能达到 1000 步的效果。 有的方法,更稳定。 有的方法,更有创造性。 你选哪个 Sampler,就是在选"怎么去噪"。 这就是这些参数的意思。 Steps:去几次噪。 CFG Scale:文字影响有多大。 Sampler:用什么方法去噪。 ---- AI生成好读的科普文,很适合学习复杂的概念。
Grok 4.1写故事还挺强,写一个黑帮故事前传。 《潮联·前传:城寨的鲨鱼仔》 1976年,黎皓龙出生在九龙城寨三不管的荣昌街13号天台铁皮屋。 他妈苏婉芬,二十岁,本来是潮州人,来香港想做歌星,结果被14K的小头目骗光钱,怀孕后被扔在寨里。 他爹黎灿,外号“生番灿”,14K最扑街的马仔,四十岁了还在街头替人看水表收保护费,一天赚不到一百块。 铁皮屋只有八平米,夏天热得像蒸笼,冬天漏风像冰窖。 黎皓龙三岁就学会爬水渠,捡别人丢的烟头、饭盒、可乐罐。 五岁,他已经能在寨里最黑的暗巷里来去自如,替人送“白粉信”(用蜡封好的海洛因小包),一封赚五块钱。 送货时,他总是把钱咬在嘴里,怕被人打劫。 有一次被新义安的小孩堵住,十几个比他大的围上来抢钱。 他把五块钱吞进肚子,宁愿被打到吐血也不吐出来。 那天回家,他妈用盐水给他擦伤口,哭着骂他:“你想死啊?” 他把血吐在手心,抹在墙上,咧嘴笑:“妈,我要他们以后怕我。” 七岁,他第一次杀人。 不是故意的。 寨里有个独眼变态,专挑小男孩下手。 那天晚上,黎皓龙被堵在厕所,独眼拿刀划他脸。 他摸到地上半截生锈铁枝,照着独眼脖子就是一下。 血喷了他一脸,独眼捂着喉咙倒下去,眼睛瞪得像要吃人。 黎皓龙吓得腿软,但还是把铁枝又捅了十几下,直到对方不动。 尸体被他拖进粪坑,用石灰盖上。 第二天没人报警,寨里这种事太常见。 但从那天起,寨里所有小孩都怕他,背地里叫他“鲨鱼仔”。 他把那半截铁枝磨尖,绑在木头上,做了人生第一把武器。 九岁,他爹第一次带他去“见世界”。 黎灿喝醉了,抱着他说:“阿龙,爸爸是14K,你长大也要做14K!” 然后带他去寨里一间暗娼寮,看他爹跟一个越南妹做那事。 黎皓龙坐在门口,数天花板上的水渍。 十一岁,他妈病了,肺病,咳血。 没钱看医生,只能喝盐水。 黎皓龙每天半夜爬进启德医院后门,偷医生丢掉的抗生素、止痛针。 有一次被保安狗追,翻墙摔断了两根肋骨。 回家把药喂他妈吃,自己疼得满头冷汗也不吭声。 他妈摸着他头说:“阿龙,妈拖累你了。” 他把脸埋进他妈怀里,第一次哭,哭得像头小兽。 三个月后,他妈还是死了。 死前把最后十块钱塞进他手里:“买个新书包,好好读书。” 他拿那十块钱买了半斤石灰,把他妈的尸体埋在寨里废弃的水井。 埋完那一刻,他把眼泪擦干,从此再没流过。 十三岁,1989年1月17日。 那场火。 他亲眼看着他爹被浇汽油点成火把。 他爹爬到他面前,把牛角柄匕首塞进他手里,最后一句话是: “阿龙……记得……烧回去……” 火光吞掉他爹最后一口气。 黎皓龙把刀贴在胸口,用滚烫的刀身烙下第一条鲨鱼。 疼得他眼前发黑,却一声没吭。 那一刻,十三岁的黎皓龙死了。 从灰里爬出来的,是后来让整个香港发抖的疯龙。 多年以后,有人问他: “龙哥,你小时候怕过什么?” 他叼着烟,淡淡吐出一句: “我只怕过一件事: 怕我妈死的时候,我不在她身边。” 说完,他把烟头按灭在手背上。 烫出一个新的疤,盖住旧的疤。 像鲨鱼,一层层长出更硬的皮。