这次的NV也是大失所望还在玩5070(+dlss4)=4090(gaming)这种低级文字游戏，cuda数2w的5090比4090快30%这不是废话吗？功耗也涨了40%，结果是性能倒吸最关键的是2000刀的显卡居然只给了32G显存，现在二手A100都只要2500了整个发布会就只有DLSS4能看，还是50系专属，40系是跑不动transformer吗？

#NV #性能提升 #DLSS4 #显卡发布会 #显卡价格 #32G显存 #A100 #50系显卡 #transformer

相关新闻

铁锤人

22小时前

最近基于这个仓库的代码刷屏了普通人可能不太清楚为什么？就是之前页面每一次修改文字布局消耗的性能很高，这个库解决了这个问题。所以今天你看到很多程序员做了很多围绕文字的Demo。对于普通人这个不是很重要的信息，你生活中百分之99的事情都没有改变。

蓝点网

1天前

三星最新推出的 #BM9K1 固态硬盘采用基于 RISC-V 开源指令集架构的主控芯片，三星称这款主控芯片是团队自研的新控制器。这款控制器比传统的 Arm 架构提供更加精细化的控制，这使得 BM9K1 性能比前代产品提升 23%，不过要强调的是 BM9K1 基于 QLC 闪存颗粒。查看全文：

Andy Stewart

2天前

对了，刚才根据用户需求新增功能的时候，发现第一句话和第二句话之间的听书有一点延迟。研究了下算法，顺手修复了。强迫症开发者一定要把性能拉到极限才满意😎

Gorden Sun

1周前

Mamba-3：新一代Memba架构 Mamba-2从训练场景出发，为训练速度做了大量简化；Mamba-3从推理场景出发，在不增加推理延迟的前提下显著提升模型质量。Mamba与Transformer混合使用效果优于纯模型，未来还是以混合使用为主。博客：

Gorden Sun

2周前

在Transformer内部造一台计算机一篇充满争议的文章，Percepta AI把WebAssembly解释器编译进Transformer权重，让模型的前向传播本身就是程序执行，不依赖任何外部工具就能进行数学计算。流程是：C代码→WASM→将WASM解释器编码进权重→前向传播逐token输出执行轨迹争议的点在于：权重不是训练出来的，而是直接编译进去的，更像“用一种奇特方式写了个程序”，不是