时政
财经
科技
登录
#高性能计算
关注
karminski-牙医
4个月前
DeepSeek 开源周的3号炸弹来啦!DeepGEMM! 这是个FP8 通用矩阵乘法库,该库用 CUDA 编写,安装时无需编译,并且内置了JIT(真的牛逼)!官方数据最大性能获得了2.7倍的提升。 要知道在早些年高性能的BLAS库可是要收费的,并且卖得很贵。 地址: #DeepSeek
#DeepSeek
#DeepGEMM
#FP8
#矩阵乘法
#CUDA
#JIT
#高性能计算
#开源
#BLAS
分享
评论 0
0
勃勃OC
4个月前
DeepSeek 推出了 FlashMLA,这是一款专为 Hopper GPU 设计的新解码内核,标志着其开源周的开始。FlashMLA 旨在提高 AI 模型的效率,支持 BF16,采用 64 块大小的分页 KV 缓存,并在 H800 GPU 上实现 3000 GB/s 的内存带宽和 580 TFLOPS 的高性能。 该内核针对可变长度序列进行了优化,大幅降低计算需求,同时提升 AI 任务的速度和效率
#DeepSeek
#FlashMLA
#HopperGPU
#AI
#开源
#BF16
#H800GPU
#高性能计算
分享
评论 0
0
勃勃OC
4个月前
Supermicro $SMCI 已全面投产 NVIDIA Blackwell 机架级解决方案,该方案搭载 NVIDIA HGX B200。 这对 NVIDIA $NVDA 意义重大,因为它加速了 Blackwell AI 基础设施的部署,推动下一代 HGX B200 GPU 在数据中心的普及。 Supermicro 的大规模生产增强了 NVIDIA 的供应链,以满足 AI 和高性能计算的日益增长的需求。今天 $SMCI 上涨 8%,$NVDA 上涨 5.3%。 SMCI还没倒闭?还没被查? 奇怪。。。
#Supermicro
#NVIDIA
#生产
#机架级解决方案
#HGX B200
#AI基础设施
#GPU
#数据中心
#供应链
#高性能计算
分享
评论 0
0
勃勃OC
4个月前
超微半导体(AMD)公布了2024年第四季度财报,报告显示营收为76.5亿美元,超出预期,每股收益(EPS)为1.09美元,符合预期。 尽管财务数据表现强劲,AMD股价仍出现剧烈波动。公告发布后,股价一度上涨5%,但随后在盘后交易中下跌4%,最终从高点回落10%,导致市值波动达300亿美元。 这种波动反映出市场对AMD在人工智能和高性能计算领域未来发展的不同看法。关键增长领域包括数据中心业务收入增长69%,客户端业务收入增长58%。 然而,尽管公司业绩亮眼,AMD股价仍跌至25个月低点
英伟达财报:狂飙营收难掩毛利下跌?· 17 条信息
#AMD财报
#股价波动
#人工智能
#高性能计算
#数据中心
分享
评论 0
0
个人主页
通知
我的投稿
我的关注
我的拉黑
我的评论
我的点赞