karminski-牙医

karminski-牙医

0 关注者

7个月前

速报,寄了嗷,NVIDIA Project Digits 内存带宽只有 275GB/s. 意味着跑 70B-int4 速度只能到 6.8 token/s. 如果跑 DeepSeek-R1-Distill-Qwen-32B-Q5_K_M, 大概是 12.5 token/s. 就是个更便宜的 MacMini M4 Pro。 如果信了老黄的说法,用这个跑200B的大模型,一分钟也就能吐出来2句话。

#NVIDIA #内存带宽 #Project DIGITS #DeepSeek-R1-Distill-Qwen #MacMini M4 Pro #大模型

相关新闻

placeholder

wend4336

2小时前

AI的意图识别越来越强。你投射的意图越清晰,纬度越高,大模型反射给你的叙事(plot)就越清晰、越深刻、越全面。即使有幻觉,也值得去验证,是幻觉,还是创意?!

placeholder

𝙩𝙮≃𝙛{𝕩}^A𝕀²·ℙarad𝕚g𝕞

8小时前

“本体”投射是不是与大模型的交互范式的最终解药,我不知道,但肯定是一种解释。 语言是应智能演化进入societal阶段的必然,LLM则是智能进入artificial 阶段的关键标志。 一个形式语言与自然语言嵌套的智能演进新范式。

placeholder

Olivert

13小时前

数据科学这么火?是因为跟大模型相关吧?

placeholder

李继刚

23小时前

互联网时代,世界的接口是代码,精通代码者获利。 大模型时代,世界的接口是语言,精通语言者获利。

placeholder

katon

1天前

一个万能公式,送给你: 任意大模型 + Midjourney = 独一无二的氛围感手机壁纸 可以用这个方法玩壁纸类项目,这四张是我刚制作的,提示词在 ALT。 这套方法可以制作类型/风格壁纸,一键三连不迷路,下面是方法👇

© 2025 news.news. All rights reserved. 0.07796 秒. v1.0.46
我的评论