2025-02-23 22:07:00
清华团队ktransformer项目,可以把DeepSeek的推理成本急剧降低,4090单卡就能跑满血版DeepSeek-R1, 相当于把【GPU】的一部分运算挪到【CPU+内存】上。 如果这个方案迅速落地,就能把原本需要至少200万元才能享受的服务,现在20万元绰绰有余。 说明AI逐渐平民化,另外内存的股票可以先找起来。
2025-02-23 22:07:00
2025-02-23 20:22:58
2025-02-23 20:11:51
2025-02-23 19:47:13
2025-02-23 19:10:24
2025-02-23 17:28:18