时政
财经
科技
登录
#数据开源
关注
Gorden Sun
1周前
Multiverse:首个开源的非自回归并行推理框架 非自回归,能力相比AR模型保持的非常好,推理速度提升2倍,数据、模型、工具完全开源。 官网: Github:
#Multiverse
#非自回归
#开源
#并行推理
#AR模型
#推理速度
#数据开源
#模型开源
#工具开源
分享
评论 0
0
九原客
5个月前
用17K从DeepSeek R1 蒸馏的SFT数据,微调Qwen2.5-32B,效果非常不错。 与DeepSeek R1自家蒸馏的版本相比略逊一些,但是后者是800k sample,而且这17k数据以及合成脚本完全开源。 方法来自之前蒸馏QwQ的Sky-T1。 P.S. 7B的模型效果提升不佳,看来越小的模型需要越多的数据激活能力。 1/2
#DeepSeek R1
#SFT数据
#Qwen2.5-32B
#微调
#蒸馏
#Sky-T1
#模型效果
#数据开源
#17K数据
分享
评论 0
0
个人主页
通知
我的投稿
我的关注
我的拉黑
我的评论
我的点赞