MiniMax M1发布:开源长上下文推理模型引发AI领域震动

MiniMax公司今日正式发布了其开源的长上下文推理模型MiniMax M1,该模型具有1M token的输入和80K token的输出能力,标志着开源AI模型的又一重大突破。MiniMax M1的训练成本仅为53.5万美元,性能超越了Qwen3和DeepSeek-R1,接近顶级闭源模型。新模型引入了Lightning Attention上下文优化机制,使其在处理10万tokens的生成任务时,计算量仅为DeepSeek R1的25%。此次发布不仅展示了MiniMax在开源领域的领先地位,也引发了对AI模型性能和训练成本的广泛关注,尤其是在与OpenAI O3、Gemini 2.5 Pro、Claude 4 Opus等模型的对比中,MiniMax M1展现出强大的Agentic Tool Use能力,进一步推动了人工智能技术的发展。
7
 ·  1周前 · #OpenAI 发布开放权重模型 GPT-OSS-120B 和 GPT-OSS-20B,模型能力媲美 o4-mini 和 o3-mini。这些推理思维链模型可以在本地使用,例如在 M4 MacBook 上采用 20B 版甚至可以每秒输出 30~40tokens,高通也证实这些模型可以在搭载高通骁龙芯片的设备上使用。查看全文:
© 2025 news.news. All rights reserved. 0.03303 秒. v1.0.42
我的评论