来看这个神奇的项目——LMCache LMCache是一个面向大语言模型服务优化的高性能缓存系统，可以近似理解为给大模型加了个 Redis, 他通过 KV 缓存复用技术来降低首Token延迟（TTFT）和提升吞吐量。尤其是长上下文的场景优化效果非常不错。特性如下： - 支持跨GPU/CPU/本地磁盘的多级缓存存储 - 可复用任意位置的重复文本KV缓存（不限于前缀匹配） - 实现跨服务实例的缓

H.E. Justin Sun 👨‍🚀 🌞

8小时前

我的微信被盗了，正在紧急联络取回

李老师不是你老师

8小时前

11月30日，浙江省台州市温岭市，下洋林工业区，鞋厂大火。

李老师不是你老师

8小时前

11月30日，四川省成都市，八里庄地铁口火灾。

李老师不是你老师

8小时前

11月下旬，有网友称一河南洛阳小学学生趴桌子上午休要收费，每学期115元。教体局：爱心企业免费提供，学生可"自愿"选择。

のらいぬ

8小时前

日本人的心意慘遭中國人破壞！中國人為什麼要這麼做？？？為什麼！！！！明明拉了攔網做保護！！為什麼！！！！ 🤷🤷🤷