Sage是什麼
Sage是商湯絕影推出的端側多模態智能體基座大模型,採用MoE架構,總參數32B、激活參數僅3B,模型已在英偉達Orin X平台部署。在PinchBench評測中任務完成率達94%,超越Claude-Opus-4.6、GPT-5.4等雲端旗艦。Sage搭載SCOUT與ERL兩項後訓練技術,支持複合指令解析、多系統聯動與主動感知,爲智能座艙提供雲端級Agent能力。

Sage的主要功能
- 複合指令解析:支持一次性解析用戶多意圖複合指令,自動聯動空調、導航、影音等車載系統完成任務閉環。
- 主動感知服務:結合傳感器實時感知乘員狀態與路況,主動觸發兒童模式、路線調整等場景化服務。
- 多模態座艙理解:依託原生車載數據,實現座艙語義與視覺理解,精準識別車內環境與用戶需求。
- 工具調用與任務閉環:支持長鏈路工具調用與多步推理,在τ2-bench基準上實現80分,具備真正的智能體執行能力。
- 端側實時響應:Orin X平台首字響應約0.5秒,單Token延遲0.03秒,生成吞吐80 tk/s,無需依賴雲端。
Sage的技術原理
- MoE稀疏激活架構:總參數32B,激活參數僅3B,通過稀疏激活機制在端側有限算力下實現高效推理。
- SCOUT分級協同學習:採用”小模型探路、大模型吸收”的分級協同機制,在複雜任務訓練中節省約60% GPU小時消耗。
- ERL可擦除強化學習:模型自動識別推理鏈中的錯誤步驟並擦除重生成,阻斷偏差擴散,複雜任務完成率提升20%。
- 一體化多模態架構:融合視覺、語言與傳感器數據的原生訓練體系,針對車載場景構建差異化理解能力。
如何使用Sage
模型現已在英偉達 Orin X 端側平台實現部署。
Sage的關鍵信息和使用要求
- 模型架構: MoE架構,總參數32B,激活參數3B。
- 部署平台: 已在英偉達Orin X端側平台實現部署。
- 評測成績: PinchBench最佳任務完成率94%,超越Claude-Opus-4.6、GPT-5.4等主流模型。
- 硬件產品: 北京車展期間推出搭載Sage的SageBox。
- 適用對象: 主要面向車企、Tier 1供應商及端側智能體開發者。
- 網絡要求: 端側部署,無需依賴雲端網絡連接即可運行。
- 框架兼容: 支持接入OpenClaw、Hermes等主流Agent框架。
Sage的核心優勢
- 端側性能領先:用3B激活參數在PinchBench上達到94%任務完成率,超越衆多大參數雲端旗艦模型。
- 極致效率比:相比MiMo-v2-Pro(激活42B),Sage激活算力僅爲其1/14,顯存佔用約1/31,性能高出6.6個百分點。
- 訓練成本優化:SCOUT技術節省約60%複雜任務訓練GPU小時,降低模型後訓練成本。
- 推理糾錯能力:ERL技術實現推理過程中錯誤步驟的自動識別與擦除,從源頭阻斷任務失敗。
- 原生車載數據優勢:Human Semantic Understanding測試獲91.5分,領先同級端側模型32%,深度理解座艙場景。
- 量產可行性:已在Orin X平台驗證部署,具備車規級量產條件。
Sage的同類競品對比
| 對比維度 | Sage | Google Gemma 4 | MiMo-v2-Pro |
|---|---|---|---|
| 發佈方 | 商湯絕影 | 小米 | |
| 總參數量 | 32B | 同量級端側 | 超1T |
| 激活參數量 | 3B | 未披露 | 42B |
| PinchBench完成率 | 94% | 83.9% | 87.4% |
| MMLU Pro | 75.8 | 69.2 | – |
| GPQA Diamond | 77.3 | 58.5 | – |
| τ2-bench | 80.7 | 42.1 | – |
| Human Semantic Understanding | 91.5 | 69.5 | – |
| 部署平台 | 英偉達Orin X | 端側 | 端側 |
| 核心定位 | 端側智能體基座 | 端側通用模型 | 端側推理模型 |
Sage的應用場景
- 智能座艙交互: 用戶通過自然語言發出複合指令,Sage一次性解析並聯動空調、導航、音樂等多個車載系統完成服務閉環。
- 兒童安全守護: 後排傳感器檢測到兒童乘坐時,Sage主動觸發兒童模式,自動鎖定車窗、切換適齡內容並限制音量。
- 智能出行規劃: 結合實時路況與用戶需求,Sage主動推薦最優路線並在擁堵時提供備選方案,實現從被動響應到主動服務的轉變。
- 艙駕一體服務: 作爲艙駕融合方案的核心AI支撐,Sage打通座艙交互與駕駛感知,提供全場景智能體服務。
© 版權聲明
文章版权归作者所有,未经允许请勿转载。
相關文章
暫無評論...