时政
财经
科技
虚拟货币
其他
登录
MiniMax M1发布:开源长上下文推理模型引发AI领域震动
MiniMax公司今日正式发布了其开源的长上下文推理模型MiniMax M1,该模型具有1M token的输入和80K token的输出能力,标志着开源AI模型的又一重大突破。MiniMax M1的训练成本仅为53.5万美元,性能超越了Qwen3和DeepSeek-R1,接近顶级闭源模型。新模型引入了Lightning Attention上下文优化机制,使其在处理10万tokens的生成任务时,计算量仅为DeepSeek R1的25%。此次发布不仅展示了MiniMax在开源领域的领先地位,也引发了对AI模型性能和训练成本的广泛关注,尤其是在与OpenAI O3、Gemini 2.5 Pro、Claude 4 Opus等模型的对比中,MiniMax M1展现出强大的Agentic Tool Use能力,进一步推动了人工智能技术的发展。
7
·
1周前
·
#OpenAI 发布开放权重模型 GPT-OSS-120B 和 GPT-OSS-20B,模型能力媲美 o4-mini 和 o3-mini。这些推理思维链模型可以在本地使用,例如在 M4 MacBook 上采用 20B 版甚至可以每秒输出 30~40tokens,高通也证实这些模型可以在搭载高通骁龙芯片的设备上使用。查看全文:
个人主页
通知
我的投稿
我的关注
我的拉黑
我的评论
我的点赞