Mr Panda

Mr Panda

0 关注者

4天前

Taalas 成立两年半,24个人, 花了3000万美金, 开发了一个平台,可以将任何 AI 模型转化为定制芯片。由此产生的「硬核模型」比基于软件的实现快一个数量级,成本更低,功耗更低。 可以在官网体验:15585 tok/s,生成时间 24 毫秒,真正的毫秒级响应。 Taalas 的做法是把模型权重直接固化进芯片电路,存储与计算在物理上融为一体,彻底消除了传统 GPU 推理中的内存带

热门新闻