#GPU

1天前

黄仁勋（Jensen Huang）解释 AI 与传统软件的区别，以及为何 AI 没有泡沫传统软件是预编译的，也就是说，它是一次性构建、存储，然后可以反复执行，几乎不需要持续计算。开发完成后，它不需要高性能处理器持续运行。用户只是将完成的程序当作工具来使用。 AI 则完全不同，它是实时生成的。它必须在使用的瞬间处理上下文、进行推理，并即时产生智能——不是提前准备好的。这意味着每一次请求都需要持续计算。正因如此，AI 系统依赖持续的 GPU 算力来“制造”输出，就像工厂生产 token 一样。因此，AI 不是静态的软件工具，而是一个活跃的计算过程，需要大规模、常开的基础设施来动态创造智能。

英伟达市值突破5万亿，科技巨头再创历史· 25 条信息

#黄仁勋 #AI #GPU #实时生成 #持续计算

𝙩𝙮≃𝙛{𝕩}^A𝕀²·ℙarad𝕚g𝕞

1天前

看看这AI （Large Computational Engineering Model）设计的超高音速空气冷却器！加上全金属3D打印，哪一天AI能自己设计GPU了，NVIDIA岂不挂了？

#AI #超高音速空气冷却器 #全金属3D打印 #GPU #NVIDIA

2天前

一向老实保守的苏妈给出了三年内EPS破20美元、毛利到58%的指引；黄教主看到了客户们对token的需求如狼似虎，放出nvda十万亿市值的豪言 AI教主们看到的都是token端需求爆炸式的增速增长，需求端的爆炸导致GPU的供应端供不应求，有多少买多少，合同一签就是3-5年 AI基建毫无泡沫，只有散户觉得有泡沫

英伟达市值突破5万亿，科技巨头再创历史· 25 条信息

#苏妈 #黄教主 #AI #GPU #token需求

4天前

李飞飞团队的世界模型 Marble 上线了一张图解锁一个小宇宙有点酷，特别适合 VR 设备玩这个太烧 GPU了，我的电脑有点烫手。。。也许 Apple 应该收购他们

#李飞飞 #Marble #世界模型 #VR设备 #GPU

1周前

#每日推荐 GPU Glossary中文版 Modal公司推出的GPU术语词汇表项目，想学习LLM的同学可以看看

#GPU #LLM #Modal公司 #术语词汇表 #学习资源

1周前

很多人把今天的AI基建类比成2000年左右的互联网泡沫光纤大基建，他们有很多相似之处，但也有一些不同相似之处就不必多说了，最大的相同在于在应用层出现killer app大范围盈利之前，就花了大笔资金投资基础设施的建设。当时是光纤，现在是数据中心但不同之处也有很多，这里举几个比较明显的地方第一：光纤的技术含量不如GPU，特别是GB300以及下一代AI芯片，全世界只有一两家公司能做。硬件的集中度特别高第二：数据中心不仅需要GPU，还需要电能。因此连带将泡沫扩散到了和2000相比的更多领域第三：即便在应用层，2000年的互联网泡沫催生了无数没有营收的.com公司，但2025年的AI基建泡沫却紧紧围绕在OpenAI等少数三家模型公司周围，软件集中度也特别高第四：数据中心投资特别大，周期特别长。为了避免账面债务甚至以后的烂尾风险，大科技公司逐渐把建设数据中心的任务外包给第三方（也就是NeoCloud）。这在互联网泡沫中是没有出现过的事情。因为这些特点，本次AI泡沫出现了上涨幅度巨大，但收益股票特别少的特点。延续了疫情以来Mag 7一枝独秀的趋势可以说，也正因仅在几家大科技公司之间膨胀，AI泡沫破裂的条件更高，也更容易通过财务措施控制——只要大科技公司的盈利能力不出问题，这种泡沫持续的时间可能会超过2000年。而且一旦破裂，也不会和2000年一样，影响几千家互联网公司——因为本来也就没有几家AI上市公司谢谢大家

英伟达市值突破5万亿，科技巨头再创历史· 25 条信息

#AI基建 #数据中心 #互联网泡沫 #GPU #科技公司

2周前

很多投资AI硬件公司的人，其实并不真正理解“训练（Training）”和“推理（Inference）”在算力需求上的巨大差异。普通用户在使用AI应用时，实际消耗的算力极少，远远低于模型训练阶段。大模型（如 GPT-4、Claude、Gemini 等）在训练时，需要数千甚至上万张 H100 显卡并行运行数周。而进入推理阶段后（也就是你在手机上向ChatGPT提问时），只需几张 GPU 的部分算力，有时甚至仅靠 CPU 或低功耗芯片即可完成。就是说每次调用 GPT、Midjourney、Claude 等应用时，所消耗的算力仅为训练期的百万分之一到千分之一。

#AI硬件投资 #训练与推理差异 #算力需求 #大模型训练 #GPU

2周前

有个很大的差别是海底光纤你20年前建的，20年后照样可以用，不太需要太多的升级，运营成本也极低。是类似于地租类产品。但是你23年巨额投资的GPU 到26年就是渣渣了，残值几乎为0。你说算力还是算力，为啥到26年就没有价值了呢？因为GPU还有极大的运营成本，电能。 26年的芯片，同等算力的功耗，要比现在小很多。那么到时候，老的DC毫无竞争力，开一天赔一天。所以，很难说这批泡沫下来还剩什么？

币圈“1011”六倍崩盘：高杠杆爆仓潮，谁在裸泳？· 6098 条信息

#海底光纤 #GPU #运营成本 #技术迭代 #残值

2周前

#每日推荐 CPU、GPU、TPU、NPU傻傻分不清

#CPU #GPU #TPU #NPU #硬件

2周前

#每日推荐 #AI #GPU AI三件套：数据、算法、算力

懒猫家族新成员亮相，AI算力舱引发热议！· 106 条信息

#AI #GPU #算力

2周前

#每日推荐 #GPU 什么是CUDA

#GPU #CUDA #每日推荐

2周前

#每日推荐 #GPU GPU 核心技术栈深度剖析

#GPU #核心技术 #技术分析 #硬件 #科技

2周前

#每日推荐 GPU 体系结构核心剖析为什么没看到有人搞GPU知识及使用相关的培训的，是因为比较难么？还是环境有限?

#GPU #体系结构 #培训 #技术难度 #行业环境

李老师不是你老师

3周前

10月23日，据央视报道，北京大学人工智能研究院孙仲研究员团队联合集成电路学院研究团队，成功研制出基于阻变存储器的高精度、可扩展模拟矩阵计算芯片，首次实现了在精度上可与数字计算媲美的模拟计算系统。该芯片在求解大规模MIMO信号检测等关键科学问题时，计算吞吐量与能效较当前顶级数字处理器（GPU）提升百倍至千倍。相关论文于10月13日刊发于《自然·电子学》期刊。

#北京大学 #人工智能研究院 #孙仲团队 #阻变存储器 #模拟矩阵计算芯片 #《自然·电子学》 #MIMO信号检测 #GPU

3周前

AMD的投资逻辑 1. CPU市占率提升：Zen架构下，EPYC服务器份额从<5%升至~25%，Ryzen消费端超40%，持续蚕食Intel 2. AI算力爆发：MI300/350系列GPU单卡性能逼近H100，2024年AI收入目标75亿美元，2025年或超100亿 2.1 AMD与OpenAI签署多代GPU协议，部署6GW计算容量（首年1GW于2026下半年启动，使用MI450系列），价值数百亿美元；AMD获10% OpenAI股权权证选项。该协议标志AMD进入顶级AI玩家供应链，预计2026-2027年贡献数十亿营收，推动数据中心业务翻倍增长 2.2 AMD通过MI450/MI355系列GPU（性能逼近H100/H200，成本更低）侵蚀NVDA AI霸权；OpenAI转向AMD采购（类似其10GW NVDA协议），凸显 hyperscalers 分散供应链需求；预计2025年AMD数据中心GPU市占升至10%+，2026年加速蚕食NVDA 80%+份额，受益于AI训练成本上升 2.3 AMD稳居AI计算第二龙头（仅次NVDA），凭借Instinct系列加速器覆盖训练/推理；与Meta/Oracle/AWS/Coherent等合作深化生态；2025年AI营收目标超100亿，市占扩张中受益AI基础设施建置浪潮，估值更具吸引力（P/E 25x vs NVDA 40x+） 3. 供应链+制程：台积电3nm/2nm加持，毛利率回升至54%+，成本优势扩大 4. 并购协同：Xilinx（FPGA）+Pensando（DPU）构建全栈AI生态，数据中心一站式解决方案

英伟达市值破四万亿，AI芯片霸主地位稳固？· 177 条信息

#AMD #AI算力 #OpenAI合作 #数据中心 #GPU

日月小楚｜Building AI Agents

4周前

比起经常“逆天”，“颠覆”的大模型小而专才是我的最爱刚训练了一个针对推特分析的小模型结果超过claude 4.5 和gpt 5 关键是我的小破GPU也能跑的贼溜

MiniMax M1发布：开源长上下文推理模型引发AI领域震动· 23 条信息

#小模型 #推特分析 #GPU #Claude 4.5 #GPT 5

1个月前

Oracle宣布自2026年第三季度起，将在其云基础设施（OCI）部署5万颗AMD Instinct™ MI450系列GPU，构建全新AI超级集群，并计划持续扩容。此举标志着AMD与Oracle的合作迈入新阶段，也被视为AMD在打破英伟达长期主导的AI算力生态中的又一关键突破。

英伟达市值破四万亿，AI芯片霸主地位稳固？· 177 条信息

#Oracle #AMD #AI算力 #GPU #云基础设施

✧ 𝕀𝔸𝕄𝔸𝕀 ✧

1个月前

看到这张拍摄于SpaceX的照片，黄仁勋把最新GPU交到马斯克手上，我直接一整个人的内啡肽就起来了

#SpaceX #黄仁勋 #马斯克 #GPU #科技

1个月前

$AMD 拿出10%股权换取OpenAI的订单 $NVDA 又向OpenAI投资了1000亿美元这一波循环交易下来是不是意味着英伟达也成了AMD的股东？毛估估GPU龙二接下来的走法应该和英伟达类似，先涨到10000亿，然后拆股。

英伟达市值破四万亿，AI芯片霸主地位稳固？· 177 条信息

#AMD #OpenAI #NVDA #GPU #股票

1个月前

USDAI 今天晚上又要开一轮存 USDC 的额度，不知道能不能抢到。我对于 USDAI 的心态是非常矛盾的...它作为一个类稳定币，居然底层资产是 GPU 😅 如果真的如他所说，全是 GPU 的话，我是一分钱也不愿意存，但是它自己偏偏没有全面执行。目前底层资产 99% 是美国国债，只有象征性 0.2% 的 GPU 😂所以反而敢存了。尤其是也就 1 个月。

#USDAI #USDC #GPU #美国国债 #类稳定币

Tigris 会讲课教授是好老师

1个月前

据说这是最火的Sora 2 视频：Sam去偷GPU。说实话话，看到 OpenAI发布那一刻我不是兴奋，“AI内容洪水来了” 这是创造？其实大部分只是把旧任务备忘录点子段子，用10倍的电力包上一层视觉糖衣，再扔出来骗一眼播放。问题不是AI不会创造，而是我们正在拿最强的技术，干最没意义的事。你看得懂它的画面，却看不懂这段视频到底为什么要存在。这不是未来，这是算力电力资源驱动的注意力浪费系统。技术进步没错。错的是我们太急着让AI去生成，根本没想清楚：我们要的到底是内容，还是价值？

OpenAI GPT-5发布引发用户不满，阿尔特曼回应质疑· 142 条信息

#Sora 2 #Sam #GPU #OpenAI #AI内容

1个月前

周五软件分享 - gpu-kill（图一）：在浏览器展示 GPU 实时信息 - RustNet：监控网络流量的终端工具 - PortNote：一个自托管的仪表盘，列出被占用的本地端口更多软件 #科技爱好者周刊（第367期）

#GPU #RustNet #PortNote #软件分享 #科技

1个月前

OpenAI 投甲骨文 1000 亿建立计算中心甲骨文投 1000 亿给英伟达买 GPU 然后英伟达又投了 1000 亿给 OpenAI 😂 问最后谁赚了？但是好像这1000亿是来自软银的🙃

#OpenAI #甲骨文 #英伟达 #软银 #投资 #GPU

𝙩𝙮≃𝙛{𝕩}^A𝕀²·ℙarad𝕚g𝕞

1个月前

有空也要看看TPUGPU到底在干啥

#TPU #GPU #技术 #研究 #硬件

1个月前

英特尔与英伟达的合作不会改变英特尔 GPU 路线图，英特尔将继续推出自有 GPU 芯片和 Intel Arc 锐炫独立显卡。英特尔官方发言人称此次合作是对英特尔路线图的补充，英特尔也会继续提供 GPU 产品，所以 Arc 显卡应该还不至于这么快被砍掉。查看全文：

#英特尔 #英伟达 #GPU #合作 #Arc 显卡