kevinzhow

kevinzhow

0 关注者

3周前

为了测试 AI 现在真实的编程能力,我启动了一个 mlx on Vulkan 的项目,给 Apple 的 mlx 框架增加一个 Vulkan 的 Backend,两天时间驱动 codex 5.3 xhigh 在这个项目里研究,我用了多种方法引导他实现这个 Backend。 qwen3-0.6b-max-4bit 从 0.2 tokens/s 逐渐提升到现在输出 16 tokens/s ( olla

热门新闻