这几天在倒腾把Deepseek 7b模型装到本地的M1上，感觉token吐得有点慢，效果也比较差。今天看见清华的ktransformer，大幅提升推理速度，搞不好能直接单机运行DS满血版。等高手跑通以后搞一搞。

#DeepSeek #模型优化 #清华ktransformer #M1 #推理速度 #单机运行

相关新闻

📦Acbox

1周前

发现中文社媒会对品牌名和现象有意混淆去年：llm发展很久了，但是因为deepseek是第一个走进大众层面的llm，所以LLM=DeepSeek 今年：Agent做很久了，但是OpenClaw是第一个走进大众层面的agent，所以Agent=龙虾

BITWU.ETH 🔆

1周前

Claude 被封的没脾气了，我也开始用 zenmux 相对来说比较稳定，而且选择余地多 OpenAI / Claude / Gemini / DeepSeek 等所有模型也不降智。懒得折腾贵就贵点吧，下面链接大家有需要自取：用的话可以帮你们省10刀费用，不用也随意。他们是随机开放名额的，我上午还不行刚看了下可以才注册的。

AB Kuai.Dong

1周前

没想到腾讯版的 Figma，也要来了。目前产品名为 Ardot，正在内测阶段。根据网站上的信息显示，相比于普通的设计软件，Ardot 引入了 AI 对话功能，从而让用户下指令给 AI，来完成生成模版、修改设计稿、调整细节的需求。该 AI 模型底层是 DeepSeek。

sitin

2周前

Hume AI 这次开源的 TADA，换了一个更务实的方向：先把不出错、够快、够轻这三件事做到极致。传统 LLM 做 TTS，一个很大的麻烦就是：文字信息很少，但音频帧特别多，最后就容易上下文爆炸、推理变慢，甚至模型越说越跑偏。 TADA 的解法很直接，就是尽量让文字和语音“一对一锁住”往前走。你可以简单理解成，它不是先想好一大段声音再慢慢往外吐，而是每读一个 token，就同步生成对应那一

猫神

2周前

#甄子丹这个废物，为了赚中国人的钱，毫无底线说deepseek好用，而且还是免费👎😂