星火X2-Flash是什麼
星火X2-Flash是科大訊飛發佈的MoE架構大語言模型,總參數30B,支持256K超長上下文,基於華爲昇騰910B國產算力集羣訓練。模型專爲Agent時代設計,在智能體任務執行、代碼生成、深度研究等場景表現接近萬億級參數模型,Token消耗成本不到主流大模型的三分之一。模型通過DSA稀疏注意力與MTP多token預測等技術實現高效訓練與推理,已開放API並接入AstronClaw、Loomy等平台。

星火X2-Flash的主要功能
-
智能體任務執行:支持深度研究報告生成、Skill管理與調用、系統控制與執行等複雜Agent工作流,效果接近萬億級參數模型。
-
代碼生成:可快速生成複雜Skill(如AI視頻生成Skill),包含技能結構、核心功能、使用案例等完整說明。
-
超長上下文處理:最大支持256K上下文窗口,滿足長鏈路Agent任務中數十萬甚至上百萬Token的消耗需求。
-
多平台接入:已接入AstronClaw、Loomy等產品,兼容OpenClaw、Claude Code等主流Agent框架。
-
API服務:通過訊飛開放平台、星辰MaaS平台提供API調用,星辰Coding Plan已全面支持該模型。
星火X2-Flash的技術原理
-
MoE架構:模型採用混合專家架構,總參數30B,在保持性能的同時實現更高效率。
-
國產算力訓練:基於華爲昇騰910B集羣完成訓練,通過親和國產芯片的算子和分佈式訓練策略深度優化。
-
智能體數據閉環:構建可驗證的大規模智能體數據自動合成平台,由Agent自主搭建環境、檢測結果準確性,實現數據高效合成與閉環。
-
長文本高效訓練:率先在國產算力上實現DSA(稀疏注意力)與MTP(多token預測)結合,上下文拓展至256K,訓練效率相比同規模A800集羣從20%提升至90%。
-
採樣解碼效率優化:在強化學習訓練場景中,通過算法與工程創新,採樣解碼效率最高提升2倍以上,緩解長交互場景下RL訓練的算力障礙。
星火X2-Flash的關鍵信息和使用要求
-
模型名稱:星火X2-Flash
-
發佈方:科大訊飛 / 訊飛開放平台
-
模型架構:MoE(混合專家),總參數30B
-
上下文窗口:最大支持256K
-
訓練算力:華爲昇騰910B國產集羣
-
已接入平台:AstronClaw、Loomy
-
API入口:訊飛開放平台、星辰MaaS平台
-
兼容框架:OpenClaw、Claude Code等主流Agent框架
- 使用要求:
-
開發者可通過訊飛開放平台或星辰MaaS平台調用API
-
星辰Coding Plan已全面支持該模型,新老用戶均可自主切換使用
-
星火X2-Flash的核心優勢
-
性價比極高:複雜Agent任務效果接近萬億級參數模型,Token消耗不到主流大模型的三分之一
-
國產算力自主可控:基於華爲昇騰910B集羣訓練,在本土算力架構上高效運行
-
超長上下文:256K上下文窗口,滿足複雜智能體工作流的長鏈路需求
-
訓練效率突破:通過DSA+MTP技術,國產算力訓練效率從20%提升至90%
-
推理速度快:採樣解碼效率最高提升2倍以上,強化學習訓練耗時大幅降低
-
Agent原生優化:深度兼容OpenClaw等主流Agent框架,支持智能體數據自動合成閉環
-
生態快速接入:已接入AstronClaw、Loomy等應用,開發者可即開即用
星火X2-Flash的同類競品對比
| 對比維度 | 星火X2-Flash | DeepSeek-V3 | Qwen2.5-72B |
|---|---|---|---|
| 參數規模 | 30B(MoE) | 671B MoE(每次激活37B) | 72B(Dense) |
| 上下文窗口 | 256K | 128K | 128K |
| 模型架構 | MoE | MoE | Dense(密集架構) |
| 訓練算力 | 華爲昇騰910B(國產) | 英偉達H800集羣 | 英偉達/AMD等多類GPU |
| 開源情況 | 閉源(API服務) | 開源(可本地部署) | 開源(可本地部署) |
| Agent適配 | 原生優化,深度兼容OpenClaw、Claude Code | 通用能力強,Agent生態依賴社區/第三方 | 通用能力強,Agent生態依賴社區/第三方 |
| 任務效果 | 接近萬億級參數模型 | 接近GPT-4o水平,數學/代碼突出 | 綜合能力優秀,多語言支持好 |
| Token成本 | 不到主流大尺寸模型1/3 | API定價較低(約GPT-4o的1/10) | API定價較低(約GPT-4o的1/20) |
| 核心定位 | Agent時代的性價比引擎 | 高性能開源基座模型 | 開源生態旗艦模型 |
星火X2-Flash的應用場景
-
複雜Agent工作流:深度研究報告生成、多步驟任務拆解與執行、多輪上下文讀取與修正。
-
Skill/工具開發:自動生成和管理複雜Skill(如AI視頻生成Skill),包含結構定義、核心功能、使用案例。
-
代碼生成與系統控制:編寫腳本、系統命令執行、自動化運維等需要代碼能力的場景。
-
長文檔分析:基於256K上下文處理超長文檔、論文、報告,進行摘要、提取與問答。
-
多模態任務編排:作爲Agent大腦,調度文生視頻、圖生視頻等多平台工具鏈(如可靈、Runway、Pika等)。
© 版權聲明
文章版权归作者所有,未经允许请勿转载。
相關文章
暫無評論...