时政
财经
科技
虚拟货币
其他
登录
#存储
关注
ariel reyez romero
4天前
google今天这篇2025年4月的论文居然引发了存储的下跌,那我们就再重读一下: KV cache 一直是大模型推理里的最大内存消耗来源。论文的做法,本质是用信息论最优的方式去压缩这些数据。不是简单地降低精度,而是重新分配信息密度。普通部分用极低比特表示,异常值单独保留更高精度。同时不再逐元素处理,而是以向量为单位编码,因为 attention 本身就是内积结构。 关键的是,它的误差已经贴近信息论下界(香农极限),也就是说压缩效率已经非常接近理论极限。论文里给出的结果,大致是 4 到 4.5 倍的压缩,性能几乎没有明显损失。效果很明显,但后续再压缩而不损伤性能的可能性已经很小。 基于大科技的内部研发流程,论文的方法及可能对模型产生的优化效果很可能已经被工程分阶段吃掉了。 比方说,低比特量化早就被用起来了,从 int8 到 int4,再到更低精度,主流模型在推理侧基本都在用。异常值单独处理这件事也不是新东西,SmoothQuant、AWQ 这些方法本质上都在做类似的事情。KV cache 本身的压缩、滑窗、分层缓存,在大模型里也已经是常规配置。 真正还没完全落地的,是论文里更极致的那一部分,比如向量量化,以及更接近信息论极限的编码方式。这些方法的问题不是原理,而是工程实现,GPU 不友好,延迟控制难,稳定性和泛化也更复杂,所以可能需要更长时间实现。 如果一定要拍脑袋猜一下论文已经落地和还没落地的部分可能有多少的话,大致可能是这么个情况:最早的 KV cache 是 1 倍成本,简单量化之后可以做到 2 到 3 倍压缩,加上异常值处理可以到 3 到 4 倍,论文再往前推一点,大约到 4 到 4.5 倍。也就是说,大部分红利已经被拿走了,剩下的提升空间不大,而且代价越来越高。 这背后的原因也很清楚。前期压缩是在去掉冗余信息,后面面对的是有效信息,再压就会直接影响模型能力。误差不再是平滑变化,而是到某个点之后快速恶化。实现难度也不是线性增长,而是明显抬升。 从模型表现可以反推,现在的主流模型已经在用这些技术。长上下文能力、推理成本下降、性能稳定,这些现象本身就说明 KV cache 的效率已经被大幅优化。像 Google 这种级别的团队,大概率已经实现了低比特量化、异常值处理和一部分 KV 压缩。 也就是说,如果说google的这篇论文对存储可能有影响的话,其大部分的影响已经被体现了出来,还没体现出来的部分,其实施难度也会较之前更大。 更重要的是,这篇论文的意义不在于多省了多少内存,而在于给出了一个边界。KV cache 压缩这条路已经接近极限,剩下的提升空间很有限。接下来真正能带来变化的,不太可能再来自压缩本身,而是需要找到其他的路径。
#谷歌
#论文
#存储
#kv cache
#大模型
#内存消耗
#信息论
#数据压缩
#精度
#向量编码
#attention
#误差
分享
评论 0
0
rick awsb ($people, $people)
1周前
这就是为什么,存储仍然如此低估 这就是为什么,存储可能将迎来戴维斯双击
#存储
#存储行业
#戴维斯双击
分享
评论 0
0
Nathan
2周前
Seed dance2.0出来直接利好英伟达,字节现在明显算力不够,agent时代,英伟达、存储、IDC、能源等还有很大空间。
#Seed dance2.0
#英伟达
#算力
#Agent时代
#存储
#IDC
#能源
分享
评论 0
0
Andy Stewart
4个月前
嗯,我悟了,以后得把代码先存到卡纸里 然后我写代码的时候,一直摇就可以了 再想想哪里不对?🤔
#代码
#卡纸
#摇
#bug
#存储
分享
评论 0
0
XinGPT🐶
4个月前
Woody 老板一个月前布局SNDK 美光,在存储大周期赚了个盆满钵满,资产天天新高。炒币的兄弟们饭都快吃不起了。 选择大于努力啊。还是要选对赛场梭哈。
币圈“1011”六倍崩盘:高杠杆爆仓潮,谁在裸泳?· 6476 条信息
#Woody
#SNDK
#美光
#存储
#资产新高
分享
评论 0
0
Fiona ❤️& ✌️
4个月前
芯片狂潮向存储蔓延,美光新高,闪迪暴涨,NAND涨价...等接连占据新闻头条。 虽然太多太多人鼓吹记忆体超级牛市通常是顶部标志,虽然确实有很多行业冥灯买入记忆体股票。但是作为一个永远在学习的平民,了解一下“记忆体”是什么? NAND Flash和DRAM 又究竟都是什么?最近说的减产涨价又是为什么? 学无止境,那我们就作为普通人,来学习一下记忆体的基本概念,帮助大家知识拓展/新闻阅读。小白科普文,大神可跳过。 1️⃣到底什么是“记忆体”?(Memory/Semiconductor Memory) “记忆体”在半导体产业中指用来存储数据的芯片或电路。 🌟没错,会看主语的朋友已经发现了,记忆体(Memory)本质上就是一种芯片。 📖它大致可分为两类: 易失性 (Volatile) 记忆体:断电后数据会丢失。典型代表是 DRAM(动态随机存取记忆体)等。 非易失性 (Non-volatile) 记忆体:断电后仍能保留数据。典型代表是 NAND Flash 、 NOR Flash。 事实上,根据摩根士丹利的分析,半导体行业,尤其是内存领域,正处在一个关键的周期转折点。AI引发的芯片狂热正从GPU等逻辑芯片,迅速蔓延至存储芯片领域。存储市场,特别是闪存(NAND),正处于一个持久上升周期的“早期阶段”。 2️⃣记忆体都用在哪里呢? 根据前面的分类, 🧐DRAM:提供计算机/服务器中处理器运行时所需的临时数据存储。读取-写入速度快,但断电后数据消失。 🧐NAND Flash:常用于存储设备如 SSD、USB 盘、手机存储。断电后仍可存数据,容量大但相比 DRAM延迟高。 🧐HBM(High Bandwidth Memory):一种专为高性能计算/AI 设计的高带宽记忆体,通常采用堆叠结构,用于 GPU、服务器等。 目前市场上所谓“记忆体需求大增”,主要并不是所有类型的 memory 都一起涨,而是集中在 AI 驱动的高带宽、高速类记忆体。 🌟当前最火的主角:HBM(高带宽记忆体),AI的核心获益者 它是为 AI GPU/高性能计算芯片 专门设计的堆叠式记忆体。通过垂直堆叠 8 ~ 12 层 DRAM 晶粒,并使用“硅通孔(TSV)”实现超高带宽传输。 🌟供不应求且频频涨价的NAND NAND短期需求井喷 云服务提供商(CSPs)因AI推理业务和机械硬盘供应受限,提前数月便开始为2026年的存储需求进行谈判。这一订单热潮直接导致闪存相关公司股价飙升,截至9月23日,SanDisk股价已暴涨95%,KIOXIA上涨75%,远超同期SOX指数10%的涨幅。 驱动这轮狂潮的核心力量,是超出预期的近线企业级固态硬盘(NL eSSD)订单。尽管市场对“重复下单”存在担忧,但大摩认为,即便在其最乐观的模型中,假设2026年市场仍将面临7%的供应缺口。 而和需求暴增同时出现的是,产能供应的不足。NAND市场有四巨头,他们分别是:铠侠、闪迪 #sandisk 、 $Samsung 和SK海力士 。 过去两年全球 NAND 市场经历严重价格崩跌(ASP 下跌超 60%),厂商利润大幅压缩甚至亏损。👉 现在,厂商通过减产企图“修复价格”与“回到盈利区间”。 闪迪管理层现在认为,在全行业参与者审慎控制供应增长的背景下,NAND产业的供不应求状况将持续贯穿整个2026年。 这一判断与市场观察高度一致。由于AI服务器对DDR5和HBM等高端内存的需求激增,各大芯片厂正优先将产能分配给这些高利润产品。这直接导致了用于消费级SSD和主流设备的NAND闪存及DDR4内存供应短缺。 闪迪已将11月NAND闪存合约价格大幅上调 50% ,DRAM内存价格同比飙升171.8%,三星和SK海力士等巨头仅能满足约70%的订单。 高盛认为,只要NAND市场的竞争对手继续保持供应纪律,价格的上涨趋势就将持续,这种有序的供需格局是支撑闪迪股价和利润率持续走高的最关键因素。 研报称,供不应求直接转化为定价能力,最终体现在利润率的飙升上。 相关链接:
#芯片
#存储
#NAND涨价
#AI
#闪迪
分享
评论 0
0
川沐|Trumoo🐮
4个月前
存储都长这么多,现在调价幅度依然这么离谱的,直接50%调. 闪迪调涨11月NAND价格:11月7日消息,美国NAND闪存供应商SanDisk通知客户,11月合约价格上调50%。
#闪迪调价
#NAND闪存
#价格上调50%
#11月合约
#存储
分享
评论 0
0
砍砍@标准件厂长
4个月前
算了算貌似 32G 就够用了
#32G
#够用
#存储
#手机
#中性
分享
评论 0
0
Rocky
5个月前
涨幅相当不错!! #AI 存储超级周期!😊
英伟达市值破四万亿,AI芯片霸主地位稳固?· 216 条信息
#AI
#存储
#超级周期
#涨幅
#积极
分享
评论 0
0
凤凰网-凤凰网综合
6个月前
微信存储一下少了10G!亲测有效
#微信
#存储
#10G
#亲测有效
分享
评论 0
0
空空 🌟 狞猫世界第一可爱!
6个月前
看到好几个果蛆在为256G的“大容量”欢呼,但我三年多前买的手机已经是521GB了,下台肯定上1TB.
#手机
#大容量
#果蛆
#1TB
#存储
分享
评论 0
0
Baye
7个月前
旅居期间最大的一个问题是存储不够,准备组一个大容量全 SSD 便携 NAS,大家有什么推荐或者避坑建议吗?
#存储
#SSD
#便携NAS
#避坑
#求推荐
分享
评论 0
0
Geek
8个月前
哪个NAS佬禁不住这样的考验
#NAS
#存储
#数据
#考验
分享
评论 0
0
蓝点网
9个月前
苹果推出苹果稀疏映像格式 (ASIF),提供接近原生的读写性能可以显著提高虚拟机的整体性能。 #ASIF 格式不依赖于主机系统的功能,苹果建议将虚拟机存储映像从 RAW 切换到 ASIF 以提高性能,不过这还需要虚拟机开发商进行适配。 查看全文:
#Apple
#ASIF
#虚拟机
#性能提升
#虚拟机开发商
#存储
分享
评论 0
0
Lex Tang
9个月前
TF 卡好像买大了,收到才发现这行车记录仪自带 47G 内置存储
#TF卡
#行车记录仪
#内存
#存储
分享
评论 0
0
蓝点网
10个月前
#Linux Kernel 6.15 正式版发布,本次更新依然是以稳定性和小规模错误修复为主,解决驱动程序、网络核心、存储等多方面的各种问题。 接下来各大 Linux 发行版会陆续适配新内核,但如果用户着急的话也可以自行前往 Kernel 网站下载源代码编译。 查看全文:
#Linux
#KERNEL
#内核更新
#稳定性
#错误修复
#驱动程序
#网络
#存储
#发行版
#编译
分享
评论 0
0
个人主页
通知
我的投稿
我的关注
我的拉黑
我的评论
我的点赞