赖嘉伟Gary 0 关注者 关注 1个月前 Taalas 把 Llama 8B 直接写进芯片里了,实现了惊人的每秒 1.7 万 token,去 感受了一下,回复快得像是复制粘贴的……唯一瓶颈是人脑的处理速度了。 AI 发展的又一个里程碑。 前往原网页查看