时政
财经
科技
登录
#千问训练框架
关注
高级分析师
3个月前
今天才知道,为啥千问不训一个特别大的模型。原来是他们的训练框架有问题,训大的就崩了。 这和微软特别类似,微软的Phi只训练到最大14B的模型。the information就报道更大的模型训练了,效果却更差,幻觉多。
#千问训练框架
#大模型训练
#微软Phi
#the information报道
#模型幻觉
分享
评论 0
0
个人主页
通知
我的投稿
我的关注
我的拉黑
我的评论
我的点赞