MiniCPM 4.0 – 面壁智能開源極致高效的端側大模型

AI工具11個月前發佈新公告 AI管理員
0 0

MiniCPM 4.0是什麼

MiniCPM 4.0 是面壁智能推出的極致高效的端側大模型。模型分爲 8B 和 0.5B 兩種參數規模。8B 閃電稀疏版採用創新稀疏架構,能高效處理長文本任務;0.5B 版本以低計算資源消耗和高性能著稱。自研 CPM.cu 推理框架在極限場景下可實現最高 220 倍提速,常規情況下也能達到 5 倍的速度提升。MiniCPM 4.0 支持在 vLLM、SGLang、LlamaFactory 等開源框架部署,已適配 Intel、高通、MTK、華爲昇騰等主流芯片。

MiniCPM 4.0 – 面壁智能開源極致高效的端側大模型

MiniCPM 4.0開源模型合集

MiniCPM4-8B:MiniCPM4的旗艦模型,擁有80億參數,在8T tokens上訓練。

MiniCPM4-0.5B:MiniCPM4的小型版本,擁有0.5億參數,在1T tokens上訓練。

MiniCPM4-8B-Eagle-FRSpec:用於FRSpec的Eagle頭,加速MiniCPM4-8B的推測性推理。

MiniCPM4-8B-Eagle-FRSpec-QAT-cpmcu:使用QAT訓練的FRSpec的Eagle頭,高效地結合推測和量化,實現MiniCPM4-8B的超加速。

MiniCPM4-8B-Eagle-vLLM: vLLM格式的Eagle頭,加速MiniCPM4-8B的推測性推理。

MiniCPM4-8B-marlin-Eagle-vLLM: 量化的vLLM格式Eagle頭,加速MiniCPM4-8B的推測性推理。

BitCPM4-0.5B:應用極值三進制量化於MiniCPM4-0.5B,將模型參數壓縮爲三進制值,實現了90%的位寬減少。

BitCPM4-1B:應用極值三進制量化於MiniCPM3-1B,將模型參數壓縮爲三進制值,實現了90%的位寬減少。

MiniCPM4-Survey: 基於MiniCPM4-8B,接受用戶的查詢作爲輸入,並自動生成可信的長篇調查論文。

MiniCPM4-MCP:基於MiniCPM4-8B,接受用戶的查詢及可用的MCP工具作爲輸入,並自動調用相關的MCP工具以滿足用戶需求。

MiniCPM 4.0的主要功能

  • 高效雙頻換擋機制:MiniCPM 4.0-8B 版本可根據任務特徵自動切換注意力模式。處理長文本時啓用稀疏注意力,降低計算複雜度;處理短文本時切換至稠密注意力,確保精度。
  • 極致推理速度提升:通過自研 CPM.cu 推理框架,在極限場景下實現最高 220 倍提速,常規場景下也能達到 5 倍的速度提升。
  • 模型瘦身與高效部署:採用創新的稀疏架構和極致低位寬量化技術,實現模型體積縮小 90%,同時保持卓越性能。支持在 vLLM、SGLang、LlamaFactory 等開源框架部署。
  • 端側推理優化:內置自研 CPM.cu 極速端側推理框架,從投機採樣創新、模型壓縮量化創新、端側部署框架創新幾方面,帶來 90% 的模型瘦身和速度提升。
  • 多平台適配:已適配 Intel、高通、MTK、華爲昇騰等主流芯片,可在多種端側設備上流暢運行。
  • 多種版本選擇:提供 8B 和 0.5B 兩種參數規模的版本,滿足不同場景需求。

MiniCPM 4.0的技術原理

  • 稀疏注意力機制:MiniCPM 4.0-8B 採用創新的可訓練稀疏注意力機制(InfLLM v2),在處理長文本時,每個詞元(token)僅需與不到 5% 的其他詞元進行相關性計算,極大地降低了長文本處理的計算開銷。
  • 高效雙頻換擋:根據任務特徵自動切換注意力模式。處理長文本時啓用稀疏注意力以降低計算複雜度,處理短文本時切換至稠密注意力以確保精度。
  • 模型風洞 2.0:引入先進的下游任務 Scaling 預測方法,能更精準地搜索並確定最佳的模型訓練配置。
  • BitCPM:實現了極致的三值量化技術,將模型參數的位寬壓縮超過 90%,在大幅“瘦身”的同時保持了卓越性能。
  • 高效訓練工程:全面採用 FP8 低精度計算技術,結合多詞元預測(Multi-token Prediction)訓練策略,進一步提升訓練效率。
  • 自研推理框架:MiniCPM 4.0 內置自研 CPM.cu 極速端側推理框架,從投機採樣創新、模型壓縮量化創新、端側部署框架創新幾方面,帶來 90% 的模型瘦身和速度提升。

MiniCPM 4.0的項目地址

  • Github倉庫:https://github.com/OpenBMB/MiniCPM
  • HuggingFace模型庫:https://huggingface.co/collections/openbmb/minicpm4
  • 技術報告:https://github.com/OpenBMB/MiniCPM/blob/main/report/MiniCPM_4_Technical_Report.pdf

MiniCPM 4.0的應用場景

  • 智能輔導系統:MiniCPM 4.0 可以作爲智能輔導系統的核心,通過自然語言處理技術,理解學生的問題並提供詳細的解答和解釋,幫助學生更好地理解和掌握知識。
  • 病例分析與診斷輔助:MiniCPM 4.0 可以輔助醫生進行病例分析,通過自然語言處理技術理解病歷內容,爲醫生提供診斷建議和參考信息,提高診斷的準確性和效率。
  • 醫學文獻檢索:幫助醫生和研究人員快速檢索相關的醫學文獻和研究成果,提供精準的文獻推薦和摘要,節省時間和精力。
  • 智能客服:作爲金融客服的核心,快速準確地回答客戶的諮詢問題,提供個性化的服務和解決方案,提高客戶滿意度。
  • 遊戲劇情生成:MiniCPM 4.0 可以根據遊戲設定和玩家行爲,自動生成豐富多樣的遊戲劇情和任務,增加遊戲的趣味性和可玩性。
© 版權聲明

相關文章

暫無評論

暫無評論...