karminski-牙医2025-02-26 09:13:05DeepSeek 开源周的3号炸弹来啦!DeepGEMM! 这是个FP8 通用矩阵乘法库,该库用 CUDA 编写,安装时无需编译,并且内置了JIT(真的牛逼)!官方数据最大性能获得了2.7倍的提升。 要知道在早些年高性能的BLAS库可是要收费的,并且卖得很贵。 地址: #DeepSeek #DeepSeek#DeepGEMM#FP8
PW2025-02-02 13:05:33DeepSeek主题投资:在R3的助力下,手搓算子,汇编算力完全有时间和经济上的可能,于是$NVDA的CUDA护城河不在。于是乎疯狂的结论:空$NVDA,多$INTC, $AMD; 空台积电,多中芯国际。#DeepSeek#R3#CUDA