sitin

sitin

0 关注者

3周前

面壁智能发布MiniCPM 4.1基座模型。模型在MiniCPM 4.0基础上新增8B参数的原生稀疏架构深思考模型,推理速度比同尺寸开源模型快3倍以上,综合能力达同级SOTA水平。 MiniCPM 4.1支持高效双频换挡,长文本用稀疏,短文本用稠密,推理效能高,长文本缓存锐减,端侧友好。 三大核心亮点 首个原生稀疏架构深思考模型 通过可训练稀疏注意力创新,代码、数学推理等任务推理速度比同尺寸

相关新闻