kevinzhow 0 关注者 关注 3周前 为了测试 AI 现在真实的编程能力,我启动了一个 mlx on Vulkan 的项目,给 Apple 的 mlx 框架增加一个 Vulkan 的 Backend,两天时间驱动 codex 5.3 xhigh 在这个项目里研究,我用了多种方法引导他实现这个 Backend。 qwen3-0.6b-max-4bit 从 0.2 tokens/s 逐渐提升到现在输出 16 tokens/s ( olla 前往原网页查看