技術成長

M3 開源 + 1M 上下文:MiniMax 4 大真實優勢

廣告版位(header)啟用:後台 /admin/settings 填 AdSense Publisher ID
M3 開源 + 1M 上下文:MiniMax 4 大真實優勢

2025 年 1 月登陸港交所,2026 年 2 月 ARR 突破 1.5 億美元,5 月底遞交科創板上市輔導,6 月 1 日發布旗艦 M3——MiniMax 過去 18 個月節奏之密、動作之猛,在大模型圈堪稱異類。

但密集動作不等於虛火。我把公開資料翻過一輪,剔除公關話術,留下可驗證的數字,整理出 MiniMax 當前(2026 年 6 月)真正站得住腳的 4 大優勢。要先說在前頭:這 4 點不是「我看好的理由」,而是「你拿數字去查也能查到的事實」。

對工程師與創業者來說,看懂這 4 點比看懂任何一場發布會都重要——因為它直接影響你 2026 下半年選模型的決策。

一、M3 三項第一:開源模型的全球唯一

M3 三項第一:編程、上下文、多模態交織的視覺隱喻

MiniMax 在 6 月 1 日發布的 M3,定位不是「對標誰」,而是「補齊誰」。它把過去只有海外閉源旗艦才同時具備的三項能力——前沿編程、超長上下文、原生多模態——第一次以完全開源的形式放進同一個模型裡。

三個關鍵數字值得記住:

  • SWE-Bench Pro 59.0%:M3 在這個直接拿真實 GitHub Issue 修 Bug 的基準上,超過 GPT-5.5 與 Gemini 3.1 Pro,逼近 Claude Opus 4.7。
  • 1M Token 上下文:最高支援 100 萬 Token,且是工程級可用——不是標稱值高、實測掉幀的「紙面 1M」。
  • BrowseComp 83.5:在長程 Agent 智能體評測中得分超越 Opus 4.7(79.3),是當前 Agent 維度最強的開源選項。

為什麼「開源」這件事比你想的更關鍵?因為它直接改變了採用成本結構。閉源 API 用多少付多少,遇到增長瓶頸要重新談合約;開源模型可以本地部署,數據不出內網,可以微調適配業務,等同把成本上限從「無限」壓成「可控」。

對企業 IT 決策者來說,M3 是 2026 年第一個真正能作為「對標 Opus 4.7 但成本可承受」選項的開源模型。這個位置,過去是 Llama 系模型想搶但搶不到的。

二、MSA 稀疏注意力:1M 上下文真正可 scale

MSA 稀疏注意力:長流光中只取關鍵節點相連的視覺化

把上下文拉到 1M 不是難事,真正難的是——1M 上下文跑得動、不貴。傳統 Transformer 的注意力是 O(n²),token 數翻倍計算量翻四倍;這就是為什麼多數模型的 1M 標稱值都是「能塞但慢到沒人用」。

MiniMax 的解法是自己寫了一套稀疏注意力架構:MSA(MiniMax Sparse Attention)。三個工程化指標直接看數字:

  • 每 Token 計算量僅為上代模型 1/20:1M 上下文下運算成本回到可控區間。
  • Prefilling 階段加速 9 倍以上:長文檔初次讀入的等待時間大幅壓縮。
  • Decoding 階段加速 15 倍以上:生成的「打字機速度」明顯提升,實際使用體感接近 128K 級別的模型。

這個架構還有第二個細節——MiniMax 把 KV 讀取路徑整個重做,比開源的 Flash-Sparse-Attention、flash-moba 等方案快 4 倍以上。這不是「我寫了篇論文」,是「我把算子層直接做進生產環境」。

對開發者的實際意義:以前你做 Agent 跑到第 11 小時會「失憶」,把第 2 小時設定的硬體約束忘掉,是因為上下文裝不下。M3 的 1M 加上 MSA 等於把 Agent 的「工作記憶上限」從幾十萬字拉到接近一整本百科全書。這也是為什麼 MiniMax 敢讓 M3 連續自主運行 12 小時復現一篇 ICLR 論文、24 小時最佳化 CUDA Kernel——它不會跑到一半失憶。

三、全模態 + 全球化:70% 營收來自海外

全模態與全球化:世界地圖上文字、影像、影片、音樂四種模態繞行

很多大模型公司只有文字一條腿,影音是「未來規劃」;MiniMax 是少數全模態都做到全球第一梯隊的中國公司。直接列產品矩陣:

  • 語言:M 系列(M2.5 → M2.7 → M3),2026 年 2 月單日 Token 消耗量已是 2025 年 12 月的 6 倍以上。
  • 視頻:Hailuo 2.3,動態表現力持續優化。
  • 語音:Speech 2.6,端到端延遲 < 250ms,行業頂尖水準。
  • 音樂:Music 2.6,首包延遲 < 20 秒,並開源 3 個面向 Agent 生態的 Music Skill。

注意這不是「我們也有」的齊頭式跟進——Speech 2.6 的 250ms 延遲、M3 在 Claw-Eval 拿最高分、Music 2.6 開源 Agent Skill,每一項都是公開可查的具體領先點。

商業面同樣紮實。2025 年報數據:

  • 全年總營收 7,903.8 萬美元,同比 +158.9%。
  • 毛利率從 2023 年的 -24.7%,連兩年轉正到 25.4%。
  • 超過 70% 收入來自國際市場。
  • 服務 200+ 國家、2.36 億個人用戶;100+ 國家、21.4 萬企業客戶與開發者。

70% 海外營收這件事在中國 AI 公司裡是極少見的。它說明兩件事:第一,MiniMax 並非只會在中文場景打轉,它對英文及其他語言的支援是真的可用、可收費;第二,這家公司的商業模式已經跑過了「靠融資續命」階段,毛利率連兩年改善、淨虧損率顯著收窄。

對創業者的啟示:選 AI 中間層供應商時,「能服務全球客戶」不只是技術能力問題,更是商業可持續性問題。一家海外營收佔比過半的公司,商業週期會比純本土營收的公司更平滑。

四、平台化升級:Token Plan 與商業閉環

平台化升級:基座模型層撐起多層應用生態的視覺隱喻

M3 發布當天,MiniMax 同步推出新訂閱方案 Token Plan,把全模態(文字/圖像/語音/音樂)整合到同一個額度池。Plus 版 49 元/月(6 億 Token)、Max 版 119 元/月(18 億)、Ultra 版 469 元/月(55 億)。

同樣價格對標海外——Plus 49 元約等於 Claude Pro 100 的 2 倍。對個人開發者來說,這是第一次出現「用 Claude 訂閱的價格買到旗艦級開源模型體驗」的選項。

但更值得關注的是商業模式本身。MiniMax 創辦人閆俊傑在 2025 財報電話會上說得很清楚:MiniMax 將從「大模型公司」升級為AI 平台型公司,核心指標是智能密度 × Token 吞吐

這不是一句口號。三條具體線索:

  1. M3 + MiniMax Code 同步訓練:M3 發布當天,配套的 Agent 編程工具 MiniMax Code 也同步更新,二者是用同一套數據和強化學習流程協同訓練出來的,不是「模型先做好,工具後面接」。
  2. Notion Custom Agents 首個開源權重模型選了 M2.5:這是國際主流生產力工具對 MiniMax 開源策略的市場投票。
  3. 港股 + 科創板雙重布局:1 月港股上市、5 月底遞交科創板輔導,資本市場用腳投了票。

平台化升級的關鍵不是「我也有 App」,而是「模型 × Agent × 開發者生態 × 資本」四個齒輪咬合在一起。MiniMax 走到 2026 年 6 月這一刻,是少數四個齒輪都在轉的中國 AI 公司。

結語:把 M3 放回「選模型」的日常決策

看完 4 點優勢,最重要的不是「MiniMax 好棒」,而是你接下來怎麼用這些資訊做決策。三個具體的行動建議:

  1. 如果你正在選 Agent 編程模型的後端:把 M3 加進你的評估清單。SWE-Bench Pro 59% 不是分數遊戲,是「真實 GitHub Issue 修復率」,比任何 Demo 都接近生產環境。
  2. 如果你的應用有 1M 級長上下文需求(法律盡調、財報審計、大型代碼庫分析、長影片摘要):M3 + MSA 是 2026 上半年最值得做 PoC 的開源選項。
  3. 如果你在評估供應商的可持續性:70% 海外營收 + 連續兩年毛利率改善 + 港股 + 科創板雙重上市路徑,這是一份相對完整的商業可持續性證據。

MiniMax 不是完美的——M3 在多輪對話的自然度、特定垂直領域的微調成熟度、繁體中文在地化細節上仍有優化空間。但 2026 年 6 月這個時間點,它確實是中國 AI 公司裡少數能在技術領先性、商業可持續性、開源生態三條線同時交出可驗證成績單的那一個。

剩下的,就是你自己上手試一試了。

免責聲明:本文所引用之模型測試數據、財務數據、產品規格均來自 MiniMax 官方公告、第三方技術報告(SegmentFault、掘金、知乎、財經媒體)及公開新聞稿,撰寫時間為 2026 年 6 月。技術迭代迅速,產品功能與商業數據可能隨時間調整,請以官方最新公告為準。本文不構成任何投資建議,AI 技術採用請依自身業務場景評估。

廣告版位(in-article)啟用:後台 /admin/settings 填 AdSense Publisher ID
支持

拍手支持

喜歡這篇就拍幾下,每位讀者最多 10 次。

本次還可拍 10 次

留言

發表留言

留言需審核後才會顯示。