2025-04-16 01:12:11
清华团队ktransformer项目,可以把DeepSeek的推理成本急剧降低,4090单卡就能跑满血版DeepSeek-R1, 相当于把【GPU】的一部分运算挪到【CPU+内存】上。 如果这个方案迅速落地,就能把原本需要至少200万元才能享受的服务,现在20万元绰绰有余。 说明AI逐渐平民化,另外内存的股票可以先找起来。
2025-04-16 01:12:11
2025-04-15 22:25:40
2025-04-15 14:00:11
2025-04-14 17:42:40
2025-04-12 09:28:51
2025-04-11 21:23:39