實測MiniMax-M1,一文看懂M1爲什麼是全球開源模型第一梯隊

AI教程11個月前發佈新公告 AI管理員
0 0

實測MiniMax-M1,一文看懂M1爲什麼是全球開源模型第一梯隊

6月底,LMArena 發佈了一則大模型文本競技排行榜。

MiniMax-M1 位列第12名,和 DeepSeek V3 0324、DeepSeek R1、Qwen3 並列,至此——國內LLM御三家正式會師全球開源模型第一梯隊。

實測MiniMax-M1,一文看懂M1爲什麼是全球開源模型第一梯隊

LMArena 排行榜,是全球用戶一票票盲選出來的實打實戰績,不看參數,拼的是模型本身的“硬功夫”。

本週最新排行榜數據顯示,MiniMax-M1 已經進入前10。

 

01. MiniMax-M1 憑什麼位列前茅

 

MiniMax-M1採用混合專家 (MoE)架構,結合閃電注意力機制,4560 億參數裏真正激活的只有 45.9 B——推理時只叫醒“少數派”專家。

訓練環節MiniMax 自研了 CISPO,官方公佈的訓練賬單 53.5 萬美元,遠低於曾經動輒千萬美元起步的大模型訓練花費。

再配合“少數派”激活方式,一條 100K token 的長回覆推理開銷只有 DeepSeek-R1 的四分之一。

實測MiniMax-M1,一文看懂M1爲什麼是全球開源模型第一梯隊

MiniMax-M1 的數學能力也是不遑多讓,在 AIME 2024 上,MiniMax-M1-80K 得分率高達86%,在公開權重模型裏直接衝到第一梯隊;

實測MiniMax-M1,一文看懂M1爲什麼是全球開源模型第一梯隊

在 LMArena 最新的大模型排行榜-數學分類中也是穩居第一。

實測MiniMax-M1,一文看懂M1爲什麼是全球開源模型第一梯隊

MiniMax-M1的上下文能力同樣強大到離譜:輸入最長 100 萬 tokens,輸出 8 萬 tokens。一次性吞下整部《水滸傳》都不會噎住。

實測MiniMax-M1,一文看懂M1爲什麼是全球開源模型第一梯隊

MiniMax-M1 的代碼生成能力雖然不在第一梯隊,但在 LMArena 編程排行中穩居第二梯隊,在指令對齊、邏輯清晰度、代碼可讀性方面表現優異。

適配 Agent 場景、輔助開發任務根本沒有壓力。

 

02. 實測MiniMax-M1

 

但是多說不如多做,咱們一起實測看看它到底實力如何。

通用場景

提示詞:爲我規劃一週旅遊行程,北京出發,目的地新疆,預算在1萬元以內,考慮 7 月天氣並給交通方案。

實測MiniMax-M1,一文看懂M1爲什麼是全球開源模型第一梯隊

交通住宿、景點消費都規劃的很不錯,各個景點的參觀時長也都規劃的很好,整個方案對比小某書的攻略來說,真的是有過之而無不及。

數學

提示詞:求 n<1000 且可寫成 2a−2b (a>b≥0)的正整數個數。

實測MiniMax-M1,一文看懂M1爲什麼是全球開源模型第一梯隊

這是 2021 AIME 測試中的第 3 題,這題考察枚舉、二次判斷和快速上界估計,能順滑做對說明基礎代數同樣紮實。

網頁開發場景

提示詞:創建一組九宮格3D卡片組件,可在懸停時卡片翻轉,且略微放大。僅使用HTML和CSS(無需JS)。正反面都有內容,且正常顯示。翻轉過程流暢且逼真。

實測MiniMax-M1,一文看懂M1爲什麼是全球開源模型第一梯隊

用純 HTML+CSS 做翻轉動效,乍一看是小把戲,其實在驗底層——佈局、三維幾何、微交互三條鏈能否一次咬合到位。

MiniMax M1 對提示詞的遵循很到位,卡片翻轉後略微放大的效果也很好的呈現了。

提示詞:創建一個便籤牆,用戶可以在這裏創建、編輯、拖動和刪除彩色便籤。

實測MiniMax-M1,一文看懂M1爲什麼是全球開源模型第一梯隊

一面彩色便籤牆看似玩具,卻把事件模型、狀態持久化、拖拽幾何、接口調度統統拉到紅區,能順滑跑完纔是真硬功。

 

03. Minimax 技術全景

 

MiniMax-M1 的高光並非僥倖,而是 MiniMax 長期策略的集中體現,當然,MiniMax 手裏的王牌也不只這一張:

視頻生成模型 Hailuo 02,在全球主流榜單上衝到第二。複雜動作、鏡頭調度、光影寫實能力都很能打,真實感逼近電影質感。

實測MiniMax-M1,一文看懂M1爲什麼是全球開源模型第一梯隊

音頻模型方面,MiniMax 也拿下了多個全球第一。從TTS到語音風格遷移,保真度、節奏感、自然度在業內都屬頂級。

實測MiniMax-M1,一文看懂M1爲什麼是全球開源模型第一梯隊

更關鍵的是,MiniMax 走的不是大力出奇蹟的老路。他們並不迷信參數,而是把精力花在“推理能力”和“工程穩態”上——用更少的資源,跑得更穩,更準,更快。

 

04. 一些分享

 

MiniMax 沒打算單點爆破,而是把語言、視頻、音頻同時推上公開擂台。

排行榜上是用戶在投票,也是市場在投票。一旦能在開放排名裏站住,就代表了市場的認可。

中國 AI 起初拼算力、拼資金,如今比的卻是生態和落地速度;MiniMax 用開源、長上下文、跨模態三張牌,把自己放進了全球同場競技的賽場裏,也把“中國打法”寫進了遊戲規則。

接下來,無論資本風向怎麼搖擺,只要 MiniMax 能保持這種技術—產品—生態的正向循環,就會一直坐在牌桌上。

原文鏈接:用大廠預算的零頭衝入第一梯隊,MiniMax到底有什麼實力

© 版權聲明

相關文章

暫無評論

暫無評論...