0 关注者

3周前

为了测试 AI 现在真实的编程能力，我启动了一个 mlx on Vulkan 的项目，给 Apple 的 mlx 框架增加一个 Vulkan 的 Backend，两天时间驱动 codex 5.3 xhigh 在这个项目里研究，我用了多种方法引导他实现这个 Backend。 qwen3-0.6b-max-4bit 从 0.2 tokens/s 逐渐提升到现在输出 16 tokens/s （ olla

热门新闻