#MiniMax

2个月前

昨天晚点发了一篇关于 MiniMax 和月之暗面的长文。感觉中国大模型创业公司是被夹在两块铁板中间。一边是几千亿美金估值、几百亿美金预算的 OpenAI / Anthropic / xAI，另一边是有电商、广告、量化现金流喂模型的阿里、字节、腾讯、DeepSeek。真不容易。原文6000字，我文章一键转成了解说视频。

MiniMax M1发布：开源长上下文推理模型引发AI领域震动· 27 条信息

#MiniMax #月之暗面 #中国大模型 #创业公司 #竞争压力

2个月前

晚点LatePost昨天发了一篇Kimi和MiniMax的近况报道，感觉现在也只有这家媒体还在关注「AI六小龙」了，自从巨头下场开始规模化投放之后，独立AI公司的生存空间已被蚕食殆尽了，月之暗面和MiniMax是其中尚且存有活路的两家，确实值得多写写。简单总结如下： - 月之暗面和MiniMax很像，都在全尺寸路线上摇摆过，Kimi成功之后，月之暗面尝试过复现Sora的视频效果，但一直没有达到预期，出海产品也相继关停，MiniMax想学字节做App工厂，推了Talkie、星野、海螺等2C产品，却不具备字节的工业化获客体系，于是这两家公司都承担了很高的试错成本； - 去年是中国大模型行业士气最低的时期，投资机构失去耐心，要求看到DAU的直观指标，倒逼创业公司进入了和豆包这种无限弹药的产品拼消耗的赛道，「打不过，但不能停」成了普遍心态，而投资人之间的议程也变成了卖股份，信心层面的亏空巨大； - MiniMax本来并不想主打视频模型，然而海螺生成视频的能力在海外爆火，反过来影响了管理层的注意力，开始变得「既要又要」——既要增长，又不要色情生成场景的流量——结果受困于审核力度的调整，「一健康就不增长」；😅😅😅 - 不夸张的说，DeepSeek救了整个行业，不只是因为它本身创造的增长奇观，更在于用无可辩驳的说服力，推翻了「只有买量才是唯一出路」的共识，月之暗面放弃在K1上继续雕花，毕其功于一役的开发出了口碑甚好的K2，MiniMax也用新模型M2重回舞台中央，而且K2和M2都选择了开源，为两家公司成功续命； - 亲力纠偏且初见成效的结果是让月之暗面和MiniMax回归了创始人依赖直觉的治理模式，在一定程度上能够抵御噪音，杨植麟会反思早期内部有员工提出长文本建议，但被以「这是工程的活儿，不是技术」为由否决了，直到Anthropic的Claude以50万上下文的处理能力震动行业，Kimi这才确定了长文本作为共识，所以杨植麟现在会特别重视能够新想法的员工； - 相比之下，MiniMax的创始人闫俊杰会更「严酷」一些，他说只要认为不是同路人的同事，自己会亲自请走，绝不容忍，MiniMax对齐业务的第一任负责人甚至因为和他激辩技术路线，直接被降职成了普通工程师，在如此管理风格下，MiniMax的早期一百名员工已经走了一半左右； - 如今，OpenAI在一级市场的估值超过了5000亿美金，xAI和Anthropic的估值也在2000亿美金上下，而月之暗面和MiniMax的估值都停滞在了40亿美金的量级，这让当初争论不休的那个问题——谁能成为中国的OpenAI——变得没有意义了； - 阿里曾经直接或间接的投资了「AI六小龙」里的五家，但在全力发展自家的大模型以来，这些战略投资都不重要了，类似的转变也发生在字节、腾讯等巨头身上，与其把钱交给创业公司去烧，不如自己供血内部消化，不再相信AI是一场代理人战争； - 月之暗面开了新一轮的融资，MiniMax要去香港上市，在解决掉短期的战略摇摆问题之后，它们依然逃不过缺钱这个长期的生存问题，需要的是可能十倍于当前公司体量的资本注入，才有机会进入下一轮竞争周期，但钱从哪里来、又为什么要给它们，会是一个相当复杂的自证过程。

MiniMax M1发布：开源长上下文推理模型引发AI领域震动· 27 条信息

#Kimi #MiniMax #AI #大模型 #融资

2个月前

MiniMax M2 国际站 Coding Plan 推出黑五优惠，首月2刀，相当于国内 Plus 套餐(49元/月)，感兴趣的朋友不妨留意一下。

MiniMax M1发布：开源长上下文推理模型引发AI领域震动· 27 条信息

#MiniMax #M2 #国际站 #Coding Plan #黑五优惠

Y11-杨继芸-靠谱找工作、找面试题、改简历、模拟面试

2个月前

很多人还不知道，最近minimax投放了好多面向27届的实习岗位，有人已经拿到实习机会了，而另一些人还没做好实习的准备，等到大四和研二再着急，就会很被动了。

#高招就业季#：志愿填报与就业攻坚· 267 条信息

教育部推出471.8万岗位，助力高校毕业生就业危机！· 145 条信息

#MiniMax #27届实习 #实习机会 #求职规划 #未雨绸缪

3个月前

记录下这篇文章的阅读笔记，关于 MiniMax 和 Kimi 在大模型注意力机制上的不同技术路线选择。 1. MiniMax 选的：全注意力 (Full Attention) 这是一种蛮力但最扎实的办法。它就像一个记忆力超群、但也最耗费精力的学生。当他读到小说第 500 页的某一个词时，为了彻底理解这个词，他会把这个词，和前面 499 页的每一个词，都重新对比一遍。优点：绝对的全面。他绝不会漏掉任何一丝线索，理解的质量是最高的。缺点：成本高到爆炸。文章越长，这种回头看的对比次数就呈指数级飙升。这会吃掉海量的内存和计算时间。 MiniMax 的选择是：我们先用这种最好的蛮力办法，一边等待未来的硬件变得足够便宜，来解决成本问题。 2. Kimi 选的：混合注意力 (Kimi Linear) 这是一种更聪明、更像人类的巧办法。 Kimi 知道蛮力在读长文时是行不通的。它就像一个更有效率的学霸，采用了 3:1 的混合阅读模式：在 3/4 的时间用一种「线性接力」的方式阅读。当它读到第 500 页的某个词时，它不会回头去看 499 页的全部内容，而是只看第 499 页最后传过来的那个摘要。它在摘要上补充新信息，再传给下一页。这就像我们正常读书，只需要记住一个不断更新的上下文概要。这非常快，而且极度节省内存。在 1/4 的时间里处理纠错，它也怕阅读摘要传久了，会忘掉第 1 页的细节。所以每隔 3 层接力后，它就停一下，用一种压缩过的「全局眼光」快速扫一眼全文的内容大纲，确保自己对整本书的理解没有跑偏。核心差别 MiniMax 全注意力是用蛮力换质量。它赌的是未来硬件会进步，能撑得起这种巨大的消耗。 Kimi Linear 是用巧劲换效率。它用一种 3:1 的混合架构，在大部分时间跑得飞快，再用小部分时间回头看大局。 Kimi 的突破还在于，它证明了这套巧劲，现在就能用低 75% 的内存和快 6 倍的速度，达到甚至超过了蛮力办法的效果。

#MiniMax #Kimi #大模型注意力机制 #技术路线选择 #全注意力 vs 混合注意力

3个月前

又一家“国货之光”：MiniMax M2模型 MiniMax官方宣布11月7日前可免费调用它的API，我把它加到了Free AI for Everyone中供大家免费使用👇

MiniMax M1发布：开源长上下文推理模型引发AI领域震动· 27 条信息

#MiniMax #M2模型 #国货之光 #免费API #AI

3个月前

MiniMax开源MiniMax-M2 230B总参数，10B激活参数，水平跟其他国产头部开源模型接近。模型：

MiniMax M1发布：开源长上下文推理模型引发AI领域震动· 27 条信息

#MiniMax #开源模型 #MiniMax-M2 #230B参数 #国产头部模型

4个月前

今晚和朋友们一起直播学习Trickle的用法。昨天手搓了一个案例，其实还想做一个给孩子用的英语学习工具。用上Seedream4生图、Minimax生成TTS、Veo3生成视频等，未来的AI编程工具一定是多模态的。

#AI编程工具 #多模态 #英语学习工具 #seedream4 #MiniMax

4个月前

测了一下Minimax最新的音乐模型Music 1.5，中文音乐的效果很不错，价格相比suno很划算，还支持API： 1.

#MiniMax #Music 1.5 #中文音乐 #API #划算

4个月前

使用minimax生成了一首关于的歌。

#MiniMax #歌曲生成 #人工智能音乐 #AI创作 #音乐

歸藏(guizang.ai)

5个月前

MiniMax 居然发了一个音乐模型 Music 1.5 试了一下真不错，解决了没有好用的音乐生成 API 的问题最长生成时间超过了四分钟；相较于之前的版本在人声、器乐、演奏和歌曲结构上都有优化；感觉跟 Suno 已经差不多了，而且价格比 Suno 便宜的多，C 端单价一首歌只需要一毛钱；支持简洁模式，也支持自定义歌词和歌曲结构生成；支持一些非常小众的民族乐器的生成；你可以选择 16种风格 × 11种情绪 × 10个场景这种丰富的组合来生成音乐； 👇下面有对应的测试提示词：

#MiniMax #Music 1.5 #音乐生成API #suno #民族乐器

5个月前

听了李诞采访邓紫棋的那期播客，邓紫棋说的自己投的 AI 公司是不是 minimax 🤔 有没有人知道，真的好奇

#李诞 #邓紫棋 #MiniMax #AI公司 #播客

澎湃新闻-科创101

6个月前

共拓AI+媒体新生态，澎湃新闻旗下派生万物与瑞壹投资、MiniMax达成三方战略合作

澎湃AI新闻合辑：未来科技与社会热点交锋· 112 条信息

#AI #澎湃新闻 #MiniMax #战略合作 #媒体

karminski-牙医

7个月前

MiniMax 开源周第二弹来啦！视频生成大模型—— Hailuo-02 这个模型支持文生视频，图生视频，甚至添加人物照片作为索引来生成人物在其他场景内互动的视频。从官方放出的数据来看，目前与 Veo3, 豆包-seedance-1.0-pro 处于排行榜前三的位置。我已经正在测试了，稍后给大家带来实测视频！（这个帖子中的视频是官方的）

#MiniMax #视频生成 #Hailuo-02 #开源模型 #排行榜 #Veo3 #豆包-seedance-1.0-pro

7个月前

MiniMax-M1：MiniMax开源的推理模型分80K和40K两个版本，这里的80K和40K是指推理消耗的最大token数。456B总参数，激活参数45.9B。评分超过旧版DeepSeek R1和Qwen3-235B-A22B。在线使用：模型： Github：

MiniMax M1发布：开源长上下文推理模型引发AI领域震动· 27 条信息

#MiniMax #开源模型 #推理模型 #DeepSeek R1 #Qwen3-235B-A22B #人工智能

7个月前

Minimax 也发布了自家的类 Manus Agent 产品⚡️ 伴随发布的是 Minimax M1，最强开源的 agentic 推理模型，配备超大上下文窗口以及极低成本的 RL 训练效率产品体验地址👉

MiniMax M1发布：开源长上下文推理模型引发AI领域震动· 27 条信息

#MiniMax #ManusAgent #M1发布 #开源模型 #agentic推理 #RL训练

7个月前

Minimax 开源世界首个长上下文推理模型 -Minimax-M1⚡️ - 1M token 输入，80K Token 输出 - 最强开源 Agentic 能力模型 - 仅 50 万刀 RL-based 训练成本效率

MiniMax M1发布：开源长上下文推理模型引发AI领域震动· 27 条信息

#MiniMax #长上下文推理 #开源模型 #AI技术 #agentic能力

7个月前

今天 MiniMax M1 发布并开源特色是两个： 1M 输入，80k 输出的超长上下文，以及 Agentic Tool Use 能力。官方正好列出了 M1 和 OpenAI O3、Gemini 2.5 Pro、Claude 4 Opus、DeepSeek R1 0528 的各项对比。 Gemini 和 Claude 可以说是各领风骚。 MiniMax 和 DeepSeek 在开源模型里是头部了，比 Qwen3 要好一档

MiniMax M1发布：开源长上下文推理模型引发AI领域震动· 27 条信息

#MiniMax #开源 #长上下文 #AI工具 #OpenAI #Gemini #Claude #DeepSeek #M1发布 #技术对比

9个月前

昨天AI产品蝗虫群，有朋友问有没有纳米 MCP的邀请。那必须有！😏 只是现在还在内测，还有不少值得优化的地方。既然有人想吃螃蟹，就先分享两个。邀请码： V6BES7 EBSP7U 优势呢，就是官方花钱内置了Firecrawl、Minimax等十多个常用付费API，一键添加就能用。初步体验，深度研究智能体还行。

#AI产品 #MCP #邀请码 #内测 #智能体 #Firecrawl #MiniMax #付费API

9个月前

终于有公司在解决 MCP 配置难的问题了。纳米AI出了个 MCP 万能工具箱，把100多个MCP 都配置好了，直接就能调用。甚至把常用的18个的key都内置了，连去各个网站找key都省了... 不管高德地图还是MiniMax生图、生音、生视频，想要什么就直接调用目前还是限制免费随便调用，也就说是纳米官方的key在支付账单，后续应该会收费，不然谁兜得住。

#MCP #纳米AI #AI工具 #高德地图 #MiniMax #生图 #生音 #生视频 #免费调用 #AI配置

9个月前

熬夜让AI给写了一个MCP server。方便把Minimax生成的语音图片等各种文件传到七牛云，并给访问URL。这样就能在AI生成的网页引用播放、使用。有空还可以写一个支持Cloudflare R2存储的MCP。项目已开源，地址见评论区

#AI #MCP服务器 #MiniMax #七牛云 #Cloudflare R2 #开源

新浪新闻-新浪新闻综合

1年前

国产AI“三英”战OpenAI：DeepSeek、月之暗面、MiniMax相继上新战况如何？

《科创板日报》1月21日讯（编辑宋子乔）OpenAI的GPT系列身后，国产大模型正紧追不舍。1月20日，DeepSeek正式发布DeepSeek-R1，并同步开_新浪网

#国产AI #OpenAI #DeepSeek #月之暗面 #MiniMax #科技竞争