时政
财经
科技
虚拟货币
其他
登录
#MiniMax
关注
ginobefun
1周前
记录下这篇文章的阅读笔记,关于 MiniMax 和 Kimi 在大模型注意力机制上的不同技术路线选择。 1. MiniMax 选的:全注意力 (Full Attention) 这是一种蛮力但最扎实的办法。 它就像一个记忆力超群、但也最耗费精力的学生。当他读到小说第 500 页的某一个词时,为了彻底理解这个词,他会把这个词,和前面 499 页的每一个词,都重新对比一遍。 优点: 绝对的全面。他绝不会漏掉任何一丝线索,理解的质量是最高的。 缺点: 成本高到爆炸。文章越长,这种回头看的对比次数就呈指数级飙升。这会吃掉海量的内存和计算时间。 MiniMax 的选择是:我们先用这种最好的蛮力办法,一边等待未来的硬件变得足够便宜,来解决成本问题。 2. Kimi 选的:混合注意力 (Kimi Linear) 这是一种更聪明、更像人类的巧办法。 Kimi 知道蛮力在读长文时是行不通的。它就像一个更有效率的学霸,采用了 3:1 的混合阅读模式: 在 3/4 的时间用一种「线性接力」的方式阅读。 当它读到第 500 页的某个词时,它不会回头去看 499 页的全部内容,而是只看第 499 页最后传过来的那个摘要。它在摘要上补充新信息,再传给下一页。这就像我们正常读书,只需要记住一个不断更新的上下文概要。这非常快,而且极度节省内存。 在 1/4 的时间里处理纠错,它也怕阅读摘要传久了,会忘掉第 1 页的细节。 所以每隔 3 层接力后,它就停一下,用一种压缩过的「全局眼光」快速扫一眼全文的内容大纲,确保自己对整本书的理解没有跑偏。 核心差别 MiniMax 全注意力是用蛮力换质量。它赌的是未来硬件会进步,能撑得起这种巨大的消耗。 Kimi Linear 是用巧劲换效率。它用一种 3:1 的混合架构,在大部分时间跑得飞快,再用小部分时间回头看大局。 Kimi 的突破还在于,它证明了这套巧劲,现在就能用低 75% 的内存和快 6 倍的速度,达到甚至超过了蛮力办法的效果。
#MiniMax
#Kimi
#大模型注意力机制
#技术路线选择
#全注意力 vs 混合注意力
分享
评论 0
0
yvonuk
2周前
又一家“国货之光”:MiniMax M2模型 MiniMax官方宣布11月7日前可免费调用它的API,我把它加到了Free AI for Everyone中供大家免费使用👇
MiniMax M1发布:开源长上下文推理模型引发AI领域震动· 23 条信息
#MiniMax
#M2模型
#国货之光
#免费API
#AI
分享
评论 0
0
Gorden Sun
2周前
MiniMax开源MiniMax-M2 230B总参数,10B激活参数,水平跟其他国产头部开源模型接近。 模型:
MiniMax M1发布:开源长上下文推理模型引发AI领域震动· 23 条信息
#MiniMax
#开源模型
#MiniMax-M2
#230B参数
#国产头部模型
分享
评论 0
0
向阳乔木
1个月前
今晚和朋友们一起直播学习Trickle的用法。 昨天手搓了一个案例,其实还想做一个给孩子用的英语学习工具。 用上Seedream4生图、Minimax生成TTS、Veo3生成视频等,未来的AI编程工具一定是多模态的。
#AI编程工具
#多模态
#英语学习工具
#seedream4
#MiniMax
分享
评论 0
0
汗青 HQ
1个月前
测了一下Minimax最新的音乐模型Music 1.5,中文音乐的效果很不错,价格相比suno很划算,还支持API: 1.
#MiniMax
#Music 1.5
#中文音乐
#API
#划算
分享
评论 0
0
Y11
2个月前
使用minimax生成了一首关于的歌。
#MiniMax
#歌曲生成
#人工智能音乐
#AI创作
#音乐
分享
评论 0
0
歸藏(guizang.ai)
2个月前
MiniMax 居然发了一个音乐模型 Music 1.5 试了一下真不错,解决了没有好用的音乐生成 API 的问题 最长生成时间超过了四分钟; 相较于之前的版本在人声、器乐、演奏和歌曲结构上都有优化; 感觉跟 Suno 已经差不多了,而且价格比 Suno 便宜的多,C 端单价一首歌只需要一毛钱; 支持简洁模式,也支持自定义歌词和歌曲结构生成; 支持一些非常小众的民族乐器的生成; 你可以选择 16种风格 × 11种情绪 × 10个场景 这种丰富的组合来生成音乐; 👇下面有对应的测试提示词:
#MiniMax
#Music 1.5
#音乐生成API
#suno
#民族乐器
分享
评论 0
0
代码家
2个月前
听了李诞采访邓紫棋的那期播客,邓紫棋说的自己投的 AI 公司是不是 minimax 🤔 有没有人知道,真的好奇
#李诞
#邓紫棋
#MiniMax
#AI公司
#播客
分享
评论 0
0
澎湃新闻-科创101
3个月前
共拓AI+媒体新生态,澎湃新闻旗下派生万物与瑞壹投资、MiniMax达成三方战略合作
澎湃AI新闻合辑:未来科技与社会热点交锋· 105 条信息
#AI
#澎湃新闻
#MiniMax
#战略合作
#媒体
分享
评论 0
0
karminski-牙医
4个月前
MiniMax 开源周第二弹来啦!视频生成大模型—— Hailuo-02 这个模型支持文生视频,图生视频,甚至添加人物照片作为索引来生成人物在其他场景内互动的视频。 从官方放出的数据来看,目前与 Veo3, 豆包-seedance-1.0-pro 处于排行榜前三的位置。我已经正在测试了,稍后给大家带来实测视频! (这个帖子中的视频是官方的)
#MiniMax
#视频生成
#Hailuo-02
#开源模型
#排行榜
#Veo3
#豆包-seedance-1.0-pro
分享
评论 0
0
Gorden Sun
4个月前
MiniMax-M1:MiniMax开源的推理模型 分80K和40K两个版本,这里的80K和40K是指推理消耗的最大token数。456B总参数,激活参数45.9B。评分超过旧版DeepSeek R1和Qwen3-235B-A22B。 在线使用: 模型: Github:
MiniMax M1发布:开源长上下文推理模型引发AI领域震动· 23 条信息
#MiniMax
#开源模型
#推理模型
#DeepSeek R1
#Qwen3-235B-A22B
#人工智能
分享
评论 0
0
Tom Huang
4个月前
Minimax 也发布了自家的类 Manus Agent 产品⚡️ 伴随发布的是 Minimax M1,最强开源的 agentic 推理模型,配备超大上下文窗口以及极低成本的 RL 训练效率 产品体验地址👉
MiniMax M1发布:开源长上下文推理模型引发AI领域震动· 23 条信息
#MiniMax
#ManusAgent
#M1发布
#开源模型
#agentic推理
#RL训练
分享
评论 0
0
Tom Huang
4个月前
Minimax 开源世界首个长上下文推理模型 -Minimax-M1⚡️ - 1M token 输入,80K Token 输出 - 最强开源 Agentic 能力模型 - 仅 50 万刀 RL-based 训练成本效率
MiniMax M1发布:开源长上下文推理模型引发AI领域震动· 23 条信息
#MiniMax
#长上下文推理
#开源模型
#AI技术
#agentic能力
分享
评论 0
0
orange.ai
4个月前
今天 MiniMax M1 发布并开源 特色是两个: 1M 输入,80k 输出的超长上下文,以及 Agentic Tool Use 能力。 官方正好列出了 M1 和 OpenAI O3、Gemini 2.5 Pro、Claude 4 Opus、DeepSeek R1 0528 的各项对比。 Gemini 和 Claude 可以说是各领风骚。 MiniMax 和 DeepSeek 在开源模型里是头部了,比 Qwen3 要好一档
MiniMax M1发布:开源长上下文推理模型引发AI领域震动· 23 条信息
#MiniMax
#开源
#长上下文
#AI工具
#OpenAI
#Gemini
#Claude
#DeepSeek
#M1发布
#技术对比
分享
评论 0
0
向阳乔木
6个月前
昨天AI产品蝗虫群,有朋友问有没有纳米 MCP的邀请。 那必须有!😏 只是现在还在内测,还有不少值得优化的地方。 既然有人想吃螃蟹,就先分享两个。 邀请码: V6BES7 EBSP7U 优势呢,就是官方花钱内置了Firecrawl、Minimax等十多个常用付费API,一键添加就能用。 初步体验,深度研究智能体还行。
#AI产品
#MCP
#邀请码
#内测
#智能体
#Firecrawl
#MiniMax
#付费API
分享
评论 0
0
orange.ai
6个月前
终于有公司在解决 MCP 配置难的问题了。 纳米AI出了个 MCP 万能工具箱,把100多个MCP 都配置好了,直接就能调用。 甚至把常用的18个的key都内置了,连去各个网站找key都省了... 不管高德地图还是MiniMax生图、生音、生视频,想要什么就直接调用 目前还是限制免费随便调用,也就说是纳米官方的key在支付账单,后续应该会收费,不然谁兜得住。
#MCP
#纳米AI
#AI工具
#高德地图
#MiniMax
#生图
#生音
#生视频
#免费调用
#AI配置
分享
评论 0
0
向阳乔木
6个月前
熬夜让AI给写了一个MCP server。 方便把Minimax生成的语音图片等各种文件传到七牛云,并给访问URL。 这样就能在AI生成的网页引用播放、使用。 有空还可以写一个支持Cloudflare R2存储的MCP。 项目已开源,地址见评论区
#AI
#MCP服务器
#MiniMax
#七牛云
#Cloudflare R2
#开源
分享
评论 0
0
新浪新闻-新浪新闻综合
9个月前
国产AI“三英”战OpenAI:DeepSeek、月之暗面、MiniMax相继上新 战况如何?
《科创板日报》1月21日讯(编辑宋子乔)OpenAI的GPT系列身后,国产大模型正紧追不舍。1月20日,DeepSeek正式发布DeepSeek-R1,并同步开_新浪网
#国产AI
#OpenAI
#DeepSeek
#月之暗面
#MiniMax
#科技竞争
分享
评论 0
0
个人主页
通知
我的投稿
我的关注
我的拉黑
我的评论
我的点赞