小径残雪

小径残雪

0 关注者

7个月前

这几天在倒腾把Deepseek 7b模型装到本地的M1上,感觉token吐得有点慢,效果也比较差。今天看见清华的ktransformer,大幅提升推理速度,搞不好能直接单机运行DS满血版。等高手跑通以后搞一搞。

#DeepSeek #模型优化 #清华ktransformer #M1 #推理速度 #单机运行

相关新闻

placeholder

WY

7小时前

DeepSeek又一次引领世界 前几天DeepSeek发布了V3.2-Exp实验性模型,虽然这次的发布没有引起太大的声量,但我仔细研究了一下,觉得实际上是又一次重大突破,很可能DeepSeek再一次在大模型高性价比技术上引领了世界。 通过全新的DeepSeek Sparse Attention(DSA)稀疏注意力机制,V3.2-Exp将大模型的推理成本从平方级直接降至接近线性。传统注意力机制的

placeholder

𝙩𝙮≃𝙛{𝕩}^A𝕀²·ℙarad𝕚g𝕞

1天前

之前就判断deepseek下个版本会在长上下文上突破,估计有戏

placeholder

bmwmengwei

1天前

国行苹果电脑上用 DeepSeek 补齐 Xcode 26 的 AI 能力

placeholder

歸藏(guizang.ai)

2天前

Deepseek 又有更新,更新到了 3.2 Exp 主要的更新内容就是降价,再次降价超过 75%,输入输出都快要一样价格了,真离谱啊 原因是实现了细粒度的超稀疏注意力机制,在不降低模型输出质量的前提下实现了训练推理成本的大幅下降

placeholder

砍砍@标准件厂长

2天前

写了个脚本 把 Mac 上的 iOS/Xcode 项目打包映射进虚拟机去跑 claude 和 deepseek。yolo~

© 2025 news.news. All rights reserved. 0.19237 秒. v1.0.46
我的评论