盐粒 Yanli 0 关注者 关注 1个月前 k2 在很多方面更接近于第一版的 r1,不算是很好的模型。qwen3.1 非常好,不仅拆分了 reasoning 模型(这在很多场景下是 trouble maker),质量上乘(趋近于 Gemini 2.5 pro),而且 MoE 架构+non-reasoning+Cerebras 可以非常快,甚至还很便宜 #K2 #R1 #qwen3.1 #reasoning模型 #Gemini 2.5 Pro 前往原网页查看