𝙩𝙮≃𝙛{𝕩}^A𝕀²·ℙarad𝕚g𝕞
1个月前
后训练less is more的精髓,是元认知范式的抽象,抽象得越好,泛化能力越高。 抽象得不好的话,模型生成的token就纠结了,谁让咱是个NTP生成器呢!
𝙩𝙮≃𝙛{𝕩}^A𝕀²·ℙarad𝕚g𝕞
1个月前
看懂meta对GPRO的优化就能搞清楚后训练的90%了吧
𝙩𝙮≃𝙛{𝕩}^A𝕀²·ℙarad𝕚g𝕞
1个月前
后训练LLM交互创新内化还要看中国
𝙩𝙮≃𝙛{𝕩}^A𝕀²·ℙarad𝕚g𝕞
1个月前
后训练大家都摸到门道了