0 关注者

4天前

‘给 Qwen 请了个 Claude 风格的家教’，这有点像我早期最爱的缝合怪呢，有点想买显卡了。😍 拿 Qwen3.5-27B 当底座，再用“模仿 Claude Opus 风格的推理数据”去微调，让它更会一步一步想问题。 - 底座模型：Qwen3.5-27B - 训练方式：SFT + LoRA - 训练目标：让模型先按固定格式整理思路，再给最终答案 - 页面里说，它主要蒸馏了

热门新闻