MiniMax M3 – MiniMax 推出的新一代 AI 模型

AI工具14小時前發佈新公告 AI管理員
0 0

MiniMax M3是什麼

MiniMax M3是 MiniMax 推出的全新AI模型,具備領先的編程、Agent與長文本處理能力。模型採用創新的MSA稀疏注意力架構,支持1M超長上下文,效率提升20倍。同時原生支持圖像、視頻輸入,可操控電腦桌面。在SWE-Bench等評測中超越GPT-5.5等模型,且已開源,可通過MiniMax Code、API等體驗。

MiniMax M3 – MiniMax 推出的新一代 AI 模型

MiniMax M3的主要功能

  • 編程與智能體 (Agent):在SWE-Bench Pro編碼測試中超越GPT-5.5等主流模型。能自主進行任務拆解、工具調用和多步推理,代碼目標是可直接交付
  • 1M超長上下文:基於自研MSA架構,API最高支持100萬tokens上下文窗口(至少保障512K tokens可用)
  • 原生多模態支持:支持圖像與視頻輸入,能看懂論文中的圖表公式,並具備模擬操作電腦桌面的能力
  • 高效模型架構:採用稀疏MoE架構,總參數量196B,但每次推理僅激活約11B參數,保證運行效率

MiniMax M3的技術原理

  • MSA稀疏注意力架構:模型採用自研的MSA(MiniMax Sparse Attention)機制,通過輕量級索引模塊快速篩選出關鍵的KV塊,再對這些塊進行稀疏計算,大幅降低長序列下的計算量。
  • 兩階段計算流程:在索引階段,模型用一個低成本的注意力模塊評估所有token的重要性;在稀疏階段,只對篩選出的高價值塊執行完整注意力計算,使100萬token上下文的計算量降至傳統模型的1/20。
  • MoE混合專家結構:模型總參數量爲196B,每次推理只激活約11B參數(約6個專家),在保持大模型容量的同時,顯著提升推理速度和部署效率。

如何使用MiniMax M3

  • 在線體驗(MiniMax Code):訪問 MiniMax Code 官網 https://agent.minimaxi.com/download,無需部署可直接體驗編程、長文本等能力。
  • API 調用:訪問 MiniMax 開放平台,獲取 API 密鑰,將 M3 集成到自己的應用或工作流中。支持圖像/視頻輸入及 Agent 任務。

MiniMax M3的核心優勢

  • 頂尖編程與Agent能力:在 SWE-Bench Pro、Terminal Bench 等權威評測中達到國際領先水平,部分指標超越 GPT-5.5 和 Gemini 3.1 Pro,能完成端到端的代碼交付與複雜任務自動化。
  • 超長上下文 + 極致效率:支持 1M token 上下文,憑藉自研 MSA 稀疏注意力架構,處理百萬級 token 的計算量僅爲傳統模型的 1/20,預填充和解碼階段分別提速 9.7 倍和 15.6 倍。
  • 原生多模態與桌面操作:直接支持圖像、視頻輸入,可理解論文圖表、公式等視覺信息,能模擬操作電腦桌面(如點擊、輸入),拓展 Agent 的應用邊界。

MiniMax M3的同類競品對比

對比項 MiniMax M3 GPT-5.5
編程能力 SWE-Bench Pro 超越 GPT-5.5 優秀,但略低於M3
上下文效率 1M token,計算量僅1/20 支持1M但計算成本高
多模態 原生支持圖像/視頻/桌面操作 僅圖像(需多模態版本)
開源 完全開源 閉源

MiniMax M3的應用場景

  • 智能軟件開發:直接根據需求生成可交付的代碼,完成自動化測試、代碼重構與調試。Agent能力可自主調用工具、拆解任務,輔助完成完整項目開發。
  • 超長文檔分析:一次處理百萬token(如數百頁財報、整本技術手冊或全部病歷),進行摘要、問答、合同審查或多文檔對比。
  • 桌面自動化與數字員工:模型能“看懂”屏幕內容,模擬點擊、輸入等電腦操作,適用RPA流程自動化、軟件測試、數據錄入等場景。
  • 多模態科研與教育:理解論文中的圖表、公式、實驗截圖,輔助文獻解讀、實驗復現;可用於教學課件分析與智能答疑。
© 版權聲明

相關文章

暫無評論

暫無評論...