karminski-牙医

karminski-牙医

0 关注者

7个月前

DeepSeek 开源周的3号炸弹来啦!DeepGEMM! 这是个FP8 通用矩阵乘法库,该库用 CUDA 编写,安装时无需编译,并且内置了JIT(真的牛逼)!官方数据最大性能获得了2.7倍的提升。 要知道在早些年高性能的BLAS库可是要收费的,并且卖得很贵。 地址: #DeepSeek

#DeepSeek #DeepGEMM #FP8 #矩阵乘法 #CUDA #JIT #高性能计算 #开源 #BLAS

相关新闻

placeholder

WY

10小时前

DeepSeek又一次引领世界 前几天DeepSeek发布了V3.2-Exp实验性模型,虽然这次的发布没有引起太大的声量,但我仔细研究了一下,觉得实际上是又一次重大突破,很可能DeepSeek再一次在大模型高性价比技术上引领了世界。 通过全新的DeepSeek Sparse Attention(DSA)稀疏注意力机制,V3.2-Exp将大模型的推理成本从平方级直接降至接近线性。传统注意力机制的

placeholder

Geek

12小时前

中转站管理器 - All API Hub 一个开源的浏览器插件,聚合管理所有中转站账号的余额、模型和密钥,告别繁琐登录。

placeholder

𝙩𝙮≃𝙛{𝕩}^A𝕀²·ℙarad𝕚g𝕞

1天前

之前就判断deepseek下个版本会在长上下文上突破,估计有戏

placeholder

bmwmengwei

1天前

国行苹果电脑上用 DeepSeek 补齐 Xcode 26 的 AI 能力

placeholder

歸藏(guizang.ai)

2天前

Deepseek 又有更新,更新到了 3.2 Exp 主要的更新内容就是降价,再次降价超过 75%,输入输出都快要一样价格了,真离谱啊 原因是实现了细粒度的超稀疏注意力机制,在不降低模型输出质量的前提下实现了训练推理成本的大幅下降

© 2025 news.news. All rights reserved. 0.14788 秒. v1.0.46
我的评论