Geek

Geek

0 关注者

4天前

‘给 Qwen 请了个 Claude 风格的家教’,这有点像我早期最爱的缝合怪呢,有点想买显卡了。😍 拿 Qwen3.5-27B 当底座,再用“模仿 Claude Opus 风格的推理数据”去微调,让它更会一步一步想问题。 - 底座模型:Qwen3.5-27B - 训练方式:SFT + LoRA - 训练目标:让模型先按固定格式整理思路,再给最终答案 - 页面里说,它主要蒸馏了

热门新闻