新的希望2025-02-12 19:13:24清华团队ktransformer项目,可以把DeepSeek的推理成本急剧降低,4090单卡就能跑满血版DeepSeek-R1, 相当于把【GPU】的一部分运算挪到【CPU+内存】上。 如果这个方案迅速落地,就能把原本需要至少200万元才能享受的服务,现在20万元绰绰有余。 说明AI逐渐平民化,另外内存的股票可以先找起来。
倪爽2025-01-04 22:05:43GPU 和 CPU 的差别 2008年(?)Mythbusters / 流言终结者 团队应 NVIDIA 邀请,公开演示了串行处理的 CPU 和并行处理的 GPU,速度到底差多少 GPU 演示用了 1100 支彩弹枪,1/4 秒内完成了蒙娜丽莎肖像🤣 #设计参考