Sage – 商湯絕影推出的端側多模態智能體基座大模型

AI工具11小時前發佈新公告 AI管理員
0 0

Sage是什麼

Sage是商湯絕影推出的端側多模態智能體基座大模型,採用MoE架構,總參數32B、激活參數僅3B,模型已在英偉達Orin X平台部署。在PinchBench評測中任務完成率達94%,超越Claude-Opus-4.6、GPT-5.4等雲端旗艦。Sage搭載SCOUT與ERL兩項後訓練技術,支持複合指令解析、多系統聯動與主動感知,爲智能座艙提供雲端級Agent能力。

Sage – 商湯絕影推出的端側多模態智能體基座大模型

Sage的主要功能

  • 複合指令解析:支持一次性解析用戶多意圖複合指令,自動聯動空調、導航、影音等車載系統完成任務閉環。
  • 主動感知服務:結合傳感器實時感知乘員狀態與路況,主動觸發兒童模式、路線調整等場景化服務。
  • 多模態座艙理解:依託原生車載數據,實現座艙語義與視覺理解,精準識別車內環境與用戶需求。
  • 工具調用與任務閉環:支持長鏈路工具調用與多步推理,在τ2-bench基準上實現80分,具備真正的智能體執行能力。
  • 端側實時響應:Orin X平台首字響應約0.5秒,單Token延遲0.03秒,生成吞吐80 tk/s,無需依賴雲端。

Sage的技術原理

  • MoE稀疏激活架構:總參數32B,激活參數僅3B,通過稀疏激活機制在端側有限算力下實現高效推理。
  • SCOUT分級協同學習:採用”小模型探路、大模型吸收”的分級協同機制,在複雜任務訓練中節省約60% GPU小時消耗。
  • ERL可擦除強化學習:模型自動識別推理鏈中的錯誤步驟並擦除重生成,阻斷偏差擴散,複雜任務完成率提升20%。
  • 一體化多模態架構:融合視覺、語言與傳感器數據的原生訓練體系,針對車載場景構建差異化理解能力。

如何使用Sage

模型現已在英偉達 Orin X 端側平台實現部署。

Sage的關鍵信息和使用要求

  • 模型架構: MoE架構,總參數32B,激活參數3B。
  • 部署平台: 已在英偉達Orin X端側平台實現部署。
  • 評測成績: PinchBench最佳任務完成率94%,超越Claude-Opus-4.6、GPT-5.4等主流模型。
  • 硬件產品: 北京車展期間推出搭載Sage的SageBox。
  • 適用對象: 主要面向車企、Tier 1供應商及端側智能體開發者。
  • 網絡要求: 端側部署,無需依賴雲端網絡連接即可運行。
  • 框架兼容: 支持接入OpenClaw、Hermes等主流Agent框架。

Sage的核心優勢

  • 端側性能領先:用3B激活參數在PinchBench上達到94%任務完成率,超越衆多大參數雲端旗艦模型。
  • 極致效率比:相比MiMo-v2-Pro(激活42B),Sage激活算力僅爲其1/14,顯存佔用約1/31,性能高出6.6個百分點。
  • 訓練成本優化:SCOUT技術節省約60%複雜任務訓練GPU小時,降低模型後訓練成本。
  • 推理糾錯能力:ERL技術實現推理過程中錯誤步驟的自動識別與擦除,從源頭阻斷任務失敗。
  • 原生車載數據優勢:Human Semantic Understanding測試獲91.5分,領先同級端側模型32%,深度理解座艙場景。
  • 量產可行性:已在Orin X平台驗證部署,具備車規級量產條件。

Sage的同類競品對比

對比維度 Sage Google Gemma 4 MiMo-v2-Pro
發佈方 商湯絕影 Google 小米
總參數量 32B 同量級端側 超1T
激活參數量 3B 未披露 42B
PinchBench完成率 94% 83.9% 87.4%
MMLU Pro 75.8 69.2
GPQA Diamond 77.3 58.5
τ2-bench 80.7 42.1
Human Semantic Understanding 91.5 69.5
部署平台 英偉達Orin X 端側 端側
核心定位 端側智能體基座 端側通用模型 端側推理模型

Sage的應用場景

  • 智能座艙交互: 用戶通過自然語言發出複合指令,Sage一次性解析並聯動空調、導航、音樂等多個車載系統完成服務閉環。
  • 兒童安全守護: 後排傳感器檢測到兒童乘坐時,Sage主動觸發兒童模式,自動鎖定車窗、切換適齡內容並限制音量。
  • 智能出行規劃: 結合實時路況與用戶需求,Sage主動推薦最優路線並在擁堵時提供備選方案,實現從被動響應到主動服務的轉變。
  • 艙駕一體服務: 作爲艙駕融合方案的核心AI支撐,Sage打通座艙交互與駕駛感知,提供全場景智能體服務。
© 版權聲明

相關文章

暫無評論

暫無評論...