MiniMax M1发布:开源长上下文推理模型引发AI领域震动

MiniMax公司今日正式发布了其开源的长上下文推理模型MiniMax M1,该模型具有1M token的输入和80K token的输出能力,标志着开源AI模型的又一重大突破。MiniMax M1的训练成本仅为53.5万美元,性能超越了Qwen3和DeepSeek-R1,接近顶级闭源模型。新模型引入了Lightning Attention上下文优化机制,使其在处理10万tokens的生成任务时,计算量仅为DeepSeek R1的25%。此次发布不仅展示了MiniMax在开源领域的领先地位,也引发了对AI模型性能和训练成本的广泛关注,尤其是在与OpenAI O3、Gemini 2.5 Pro、Claude 4 Opus等模型的对比中,MiniMax M1展现出强大的Agentic Tool Use能力,进一步推动了人工智能技术的发展。
27
 ·  1个月前 · 昨天晚点发了一篇关于 MiniMax 和月之暗面的长文。 感觉中国大模型创业公司是被夹在两块铁板中间。 一边是几千亿美金估值、几百亿美金预算的 OpenAI / Anthropic / xAI,另一边是有电商、广告、量化现金流喂模型的阿里、字节、腾讯、DeepSeek。 真不容易。 原文6000字,我文章一键转成了解说视频。
© 2025 news.news. All rights reserved. 0.0178 秒. v1.0.46
我的评论