沉浸式翻译 0 关注者 关注 2天前 一个人撑起半个开源社区!! 英国工程师 Tom Jobbins 做的事情很简单粗暴:帮你把这些模型全部量化一遍,做成 4bit、5bit 等低比特版本,再写好「一键跑起来」的说明书。通过量化技术压缩成消费级显卡能跑的版本。 他在 Hugging Face 上的个人空间,主页直接罗列了自己「最近 100 个模型仓库」,基本清一色是主流大模型的各种量化版本和不同格式打包。 1. 速度极快:新模型 前往原网页查看