速报，寄了嗷，NVIDIA Project Digits 内存带宽只有 275GB/s. 意味着跑 70B-int4 速度只能到 6.8 token/s. 如果跑 DeepSeek-R1-Distill-Qwen-32B-Q5_K_M, 大概是 12.5 token/s. 就是个更便宜的 MacMini M4 Pro。如果信了老黄的说法，用这个跑200B的大模型，一分钟也就能吐出来2句话。

#NVIDIA #内存带宽 #Project DIGITS #DeepSeek-R1-Distill-Qwen #MacMini M4 Pro #大模型

相关新闻

看不懂的sol

15小时前

喜欢玩美股的兄弟们又有福了！ Bitget携手热门美股交易赛来袭！前端时间很兄弟来咨询关于美股投资的问题，我这边给大家推荐了Bitget交易所的美股现货，因为其方便快捷而且没有什么出入金的麻烦而让使用的兄弟反馈都还是不错的！最近Bitget「链上美股」这块真的火力全开！超过 100 种热门美股代币都可以0交易手续费体验！还能0撸参与交易赛，领单人最高500 BGB猪脚饭。

初码

3天前

国内大模型领域的行业Benchmark（偏硬件+测评）一定会出现一个现象级的KOL或者矩阵，我有强烈的预感，这个组织会不会是我？

今日澳洲App

5天前

Nvidia CEO黄仁勋在台湾接受记者采访时，否认曾说过“中国将在AI竞赛中击败美国”，“这不是我的原话，我的意思是，中国拥有非常优秀的AI技术…全球50%的AI研究者都在中国…美国必须继续保持极快的发展步伐。” #Nvidia #AI #JensenHuang

在悉尼和稀泥

5天前

现在各种大模型你追我赶，有的历史对话和上下文需要从一个模型迁移到另外一个模型。Dia 官方提供了一个“导入记忆”的功能，帮助用户把 chatgpt 的记忆导入到 Dia 浏览器，这个本质就是一个提示词，可以用来给自己用的大模型们进行“记忆”同步。 --- I want information about myself and my preferences. First, retrieve and

dontbesilent

6天前

大模型的 Temperature 不仅是技术参数，它是对「自由」的形式化。如果：人的自由 ≈ temperature 那么：自由不是神秘的「灵魂」，而是可测量的「概率分布宽度」。这是启蒙的终极胜利：连「自由」都被去魅化了。但同时，这也是启蒙的终极悖论：如果自由可以被参数化，那它还是「自由」吗？或者说：真正的自由，就是意识到自己的「temperature」，并选择调整它。