Step 3.7 Flash是什麼
Step 3.7 Flash 是階躍星辰面向 Agent 生產化階段推出的新一代開源 Flash 模型,採用稀疏 MoE 架構,最高生成速度達 400 Tokens/s。模型圍繞 Agent、Coding、Search 與多模態工作流進行系統優化,在速度、成本、可靠執行和複雜任務完成能力之間取得平衡,爲開發者構建生產級 Agent 的高效率基座模型。

Step 3.7 Flash的主要功能
-
原生多模態理解與執行:原生理解 UI、圖表、文檔、圖片和應用界面,將複雜視覺信息轉化爲結構化結果、代碼生成和可執行任務,支持自主裁剪、放大、重讀圖像。
-
聯網與視覺搜索增強:強化聯網檢索與圖像搜索,在開放信息環境中跨文本與圖像主動獲取並交叉比對多源證據。
-
高可靠工具調用與編排:在長程多輪 Agent 工作流中穩定調用 API、瀏覽器、終端、Office 工具和外部系統,保持任務軌跡一致。
-
Agent 生態兼容優化:針對 Claude Code、KiloCode、RooCode、OpenCode、Hermes Agent、OpenClaw 等主流 Agent 框架及 MCP/Skills 協議進行兼容適配。
-
本地與雲端雙部署:支持雲端 API 調用,同時針對個人工作站本地部署優化,提供 GGUF 多精度端側版本。
Step 3.7 Flash的技術原理
-
稀疏 MoE 架構:總參數 196B + 1.8B(ViT),激活參數僅 11B,實現模型能力與推理成本的更優平衡。
-
視覺感知-搜索-推理融合:將視覺感知、搜索與推理過程深度結合,面對複雜視覺問題時主動發起搜索進行交叉驗證。
-
長程任務軌跡保持:在多輪 Agent 工作流中通過優化保持任務軌跡一致性,降低跑偏和執行失敗率。
-
多精度端側優化:提供 GGUF 格式支持,適配不同硬件資源的本地部署需求。
如何使用Step 3.7 Flash
- 雲端接入
- 國內開放平台 API:訪問 https://platform.stepfun.com註冊賬號,獲取 API Key 後即可通過標準接口調用模型能力。
- 海外開放平台 API:訪問 https://platform.stepfun.ai 進行海外節點接入,適合國際業務場景。
- Studio 在線體驗:進入 https://studio.stepfun.com/ 無需配置即可在網頁端直接體驗模型對話與多模態能力。
- 開源部署
- GitHub 倉庫:前往 https://github.com/stepfun-ai/Step-3.7-Flash下載完整代碼與權重,按文檔完成本地或服務器部署。
- Huggingface 模型:在 https://huggingface.co/stepfun-ai/Step-3.7-Flash獲取模型文件,支持 Transformers 等主流框架直接加載推理。
- Modelscope 模型:通過https://modelscope.cn/models/stepfun-ai/Step-3.7-Flash下載,適合國內開發者快速拉取。
- 端側 GGUF 版本:訪問 https://huggingface.co/stepfun-ai/Step-3.7-Flash-GGUF 獲取多精度量化版本,可在個人工作站甚至低配置設備上流暢運行。
- 應用端與生態
- 階躍 AI App:下載階躍 AI 移動端應用,直接在手機上體驗 Step 3.7 Flash 的問答與 Agent 能力。
- Agent 框架接入:在 Kilo Code、Nous Research(Hermes Agent)等已驗證的 Agent 工具中配置 Step 3.7 Flash 的 API 端點,可作爲底層模型驅動 Coding 與自動化工作流。
Step 3.7 Flash的核心優勢
-
極速推理:單請求最高 400 TPS,適合高頻、多輪、低等待的 Agent 應用。
-
激活參數極低:僅 11B 激活參數,推理成本大幅降低,性價比極高。
-
生產級可靠性:在 Toolathlon(49.5%)、ClawEval-1.1(67.1%)、GDPval(45.8%)等真實環境基準中表現穩定。
-
多模態深度理解:在 SimpleVQA(79.2%)、V*(95.3%)等複雜視覺任務上媲美更大規模旗艦模型。
-
生態即插即用:針對主流 Agent 框架和 MCP/Skills 協議預優化,降低接入成本。
Step 3.7 Flash的項目地址
- 項目官網:https://static.stepfun.com/blog/step-3.7-flash/
- GitHub倉庫:https://github.com/stepfun-ai/Step-3.7-Flash
- HuggingFace模型庫:https://huggingface.co/stepfun-ai/Step-3.7-Flash
Step 3.7 Flash的同類競品對比
| 對比維度 | Step 3.7 Flash | Step 3.5 Flash | Gemini 2.5 Flash |
|---|---|---|---|
| 架構 | 稀疏 MoE,196B/11B 激活 | 前代 Flash 架構 | 未知 |
| 最高速度 | 400 TPS | 較低 | 較高 |
| SWE-Bench Pro | 56.3 | 51.3 | 55.6 |
| Terminal-Bench 2.1 | 59.5 | 53.4 | 62.0 |
| SimpleVQA (Tool) | 79.2 | 78.2 | 78.2 |
| V (Python)* | 95.3 | 89.0 | 96.9 |
| ClawEval-1.1 | 67.1 | 43.6 | 57.8 |
| Toolathlon | 49.5 | 33.3 | 52.8 |
| HLE (Tool) | 47.2 | 35.7 | 45.1 |
| 開源 | ✅ 完全開源 | ✅ 開源 | ❌ 閉源 |
Step 3.7 Flash的應用場景
-
Coding Agent:在 SWE-Bench Pro 和 Terminal-Bench 中表現突出,可穩定執行代碼生成、調試、終端操作等開發任務。
-
多模態知識工作:自動理解 UI 界面、圖表、文檔,生成結構化分析或操作指引,適用於產品分析、設計評審、軟件教程生成。
-
企業流程自動化:通過穩定調用 API、Office 工具和外部系統,嵌入企業工作流執行數據錄入、報表生成、跨系統操作。
-
視覺搜索與驗證:在信息不確定時主動發起圖像搜索和交叉驗證,適用於電商比價、內容審覈、事實覈查。
© 版權聲明
文章版权归作者所有,未经允许请勿转载。
相關文章
暫無評論...