2025 年 1 月登陆港交所,2026 年 2 月 ARR 突破 1.5 亿美元,5 月底递交科创板上市辅导,6 月 1 日发布旗舰 M3——MiniMax 过去 18 个月节奏之密、动作之猛,在大模型圈堪称异类。
但密集动作不等于虚火。我把公开资料翻过一輪,剔除公关话术,留下可验证的数字,整理出 MiniMax 当前(2026 年 6 月)真正站得住脚的 4 大优势。要先说在前头:这 4 点不是「我看好的理由」,而是「你拿数字去查也能查到的事实」。
对工程师与创业者来说,看懂这 4 点比看懂任何一场发布会都重要——因为它直接影响你 2026 下半年选模型的决策。
一、M3 三项第一:开源模型的全球唯一

MiniMax 在 6 月 1 日发布的 M3,定位不是「对标谁」,而是「补齐谁」。它把过去只有海外闭源旗舰才同时具备的三项能力——前沿编程、超长上下文、原生多模态——第一次以完全开源的形式放进同一个模型裡。
三个关键数字值得记住:
- SWE-Bench Pro 59.0%:M3 在这个直接拿真实 GitHub Issue 修 Bug 的基准上,超过 GPT-5.5 与 Gemini 3.1 Pro,逼近 Claude Opus 4.7。
- 1M Token 上下文:最高支援 100 万 Token,且是工程级可用——不是标称值高、实测掉帧的「纸面 1M」。
- BrowseComp 83.5:在长程 Agent 智能体评测中得分超越 Opus 4.7(79.3),是当前 Agent 维度最强的开源选项。
为什么「开源」这件事比你想的更关键?因为它直接改变了采用成本结构。闭源 API 用多少付多少,遇到增长瓶颈要重新谈合约;开源模型可以本地部署,数据不出内网,可以微调适配业务,等同把成本上限从「无限」压成「可控」。
对企业 IT 决策者来说,M3 是 2026 年第一个真正能作为「对标 Opus 4.7 但成本可承受」选项的开源模型。这个位置,过去是 Llama 系模型想抢但抢不到的。
二、MSA 稀疏注意力:1M 上下文真正可 scale

把上下文拉到 1M 不是难事,真正难的是——1M 上下文跑得动、不贵。传统 Transformer 的注意力是 O(n²),token 数翻倍计算量翻四倍;这就是为什么多数模型的 1M 标称值都是「能塞但慢到没人用」。
MiniMax 的解法是自己写了一套稀疏注意力架构:MSA(MiniMax Sparse Attention)。三个工程化指标直接看数字:
- 每 Token 计算量仅为上代模型 1/20:1M 上下文下运算成本回到可控区间。
- Prefilling 阶段加速 9 倍以上:长文档初次读入的等待时间大幅压缩。
- Decoding 阶段加速 15 倍以上:生成的「打字机速度」明显提升,实际使用体感接近 128K 级别的模型。
这个架构还有第二个细节——MiniMax 把 KV 读取路径整个重做,比开源的 Flash-Sparse-Attention、flash-moba 等方案快 4 倍以上。这不是「我写了篇论文」,是「我把算子层直接做进生产环境」。
对开发者的实际意义:以前你做 Agent 跑到第 11 小时会「失忆」,把第 2 小时设定的硬体约束忘掉,是因为上下文装不下。M3 的 1M 加上 MSA 等于把 Agent 的「工作记忆上限」从几十万字拉到接近一整本百科全书。这也是为什么 MiniMax 敢让 M3 连续自主运行 12 小时复现一篇 ICLR 论文、24 小时最佳化 CUDA Kernel——它不会跑到一半失忆。
三、全模态 + 全球化:70% 营收来自海外

很多大模型公司只有文字一条腿,影音是「未来规划」;MiniMax 是少数全模态都做到全球第一梯队的中国公司。直接列产品矩阵:
- 语言:M 系列(M2.5 → M2.7 → M3),2026 年 2 月单日 Token 消耗量已是 2025 年 12 月的 6 倍以上。
- 视频:Hailuo 2.3,动态表现力持续优化。
- 语音:Speech 2.6,端到端延迟 < 250ms,行业顶尖水准。
- 音乐:Music 2.6,首包延迟 < 20 秒,并开源 3 个面向 Agent 生态的 Music Skill。
注意这不是「我们也有」的齐头式跟进——Speech 2.6 的 250ms 延迟、M3 在 Claw-Eval 拿最高分、Music 2.6 开源 Agent Skill,每一项都是公开可查的具体领先点。
商业面同样紮实。2025 年报数据:
- 全年总营收 7,903.8 万美元,同比 +158.9%。
- 毛利率从 2023 年的 -24.7%,连两年轉正到 25.4%。
- 超过 70% 收入来自国际市场。
- 服务 200+ 国家、2.36 亿个人用户;100+ 国家、21.4 万企业客户与开发者。
70% 海外营收这件事在中国 AI 公司裡是极少见的。它说明两件事:第一,MiniMax 并非只会在中文场景打轉,它对英文及其他语言的支援是真的可用、可收费;第二,这家公司的商业模式已经跑过了「靠融资续命」阶段,毛利率连两年改善、净亏损率显著收窄。
对创业者的启示:选 AI 中间层供应商时,「能服务全球客户」不只是技术能力问题,更是商业可持续性问题。一家海外营收占比过半的公司,商业周期会比纯本土营收的公司更平滑。
四、平台化升级:Token Plan 与商业闭环

M3 发布当天,MiniMax 同步推出新订阅方案 Token Plan,把全模态(文字/图像/语音/音乐)整合到同一个额度池。Plus 版 49 元/月(6 亿 Token)、Max 版 119 元/月(18 亿)、Ultra 版 469 元/月(55 亿)。
同样价格对标海外——Plus 49 元约等于 Claude Pro 100 的 2 倍。对个人开发者来说,这是第一次出现「用 Claude 订阅的价格买到旗舰级开源模型体验」的选项。
但更值得关注的是商业模式本身。MiniMax 创办人閆俊杰在 2025 财报电话会上说得很清楚:MiniMax 将从「大模型公司」升级为AI 平台型公司,核心指标是智能密度 × Token 吞吐。
这不是一句口号。三条具体线索:
- M3 + MiniMax Code 同步训练:M3 发布当天,配套的 Agent 编程工具 MiniMax Code 也同步更新,二者是用同一套数据和强化学习流程协同训练出来的,不是「模型先做好,工具后面接」。
- Notion Custom Agents 首个开源权重模型选了 M2.5:这是国际主流生产力工具对 MiniMax 开源策略的市场投票。
- 港股 + 科创板双重布局:1 月港股上市、5 月底递交科创板辅导,资本市场用脚投了票。
平台化升级的关键不是「我也有 App」,而是「模型 × Agent × 开发者生态 × 资本」四个齿輪咬合在一起。MiniMax 走到 2026 年 6 月这一刻,是少数四个齿輪都在轉的中国 AI 公司。
结语:把 M3 放回「选模型」的日常决策
看完 4 点优势,最重要的不是「MiniMax 好棒」,而是你接下来怎么用这些资讯做决策。三个具体的行动建议:
- 如果你正在选 Agent 编程模型的后端:把 M3 加进你的评估清单。SWE-Bench Pro 59% 不是分数游戏,是「真实 GitHub Issue 修复率」,比任何 Demo 都接近生产环境。
- 如果你的应用有 1M 级长上下文需求(法律尽调、财报审计、大型代码库分析、长影片摘要):M3 + MSA 是 2026 上半年最值得做 PoC 的开源选项。
- 如果你在评估供应商的可持续性:70% 海外营收 + 连续两年毛利率改善 + 港股 + 科创板双重上市路径,这是一份相对完整的商业可持续性证据。
MiniMax 不是完美的——M3 在多輪对话的自然度、特定垂直领域的微调成熟度、繁体中文在地化细节上仍有优化空间。但 2026 年 6 月这个时间点,它确实是中国 AI 公司裡少数能在技术领先性、商业可持续性、开源生态三条线同时交出可验证成绩单的那一个。
剩下的,就是你自己上手试一试了。
免责声明:本文所引用之模型测试数据、财务数据、产品规格均来自 MiniMax 官方公告、第三方技术报告(SegmentFault、掘金、知乎、财经媒体)及公开新聞稿,撰写时间为 2026 年 6 月。技术迭代迅速,产品功能与商业数据可能随时间调整,请以官方最新公告为准。本文不构成任何投资建议,AI 技术采用请依自身业务场景评估。
留言