星火X2-Flash – 科大訊飛推出的MoE架構大語言模型

AI工具2周前發佈新公告 AI管理員

0 0 0

星火X2-Flash是什麼

星火X2-Flash是科大訊飛發佈的MoE架構大語言模型，總參數30B，支持256K超長上下文，基於華爲昇騰910B國產算力集羣訓練。模型專爲Agent時代設計，在智能體任務執行、代碼生成、深度研究等場景表現接近萬億級參數模型，Token消耗成本不到主流大模型的三分之一。模型通過DSA稀疏注意力與MTP多token預測等技術實現高效訓練與推理，已開放API並接入AstronClaw、Loomy等平台。

星火X2-Flash – 科大訊飛推出的MoE架構大語言模型

星火X2-Flash的主要功能

智能體任務執行：支持深度研究報告生成、Skill管理與調用、系統控制與執行等複雜Agent工作流，效果接近萬億級參數模型。
代碼生成：可快速生成複雜Skill（如AI視頻生成Skill），包含技能結構、核心功能、使用案例等完整說明。
超長上下文處理：最大支持256K上下文窗口，滿足長鏈路Agent任務中數十萬甚至上百萬Token的消耗需求。
多平台接入：已接入AstronClaw、Loomy等產品，兼容OpenClaw、Claude Code等主流Agent框架。
API服務：通過訊飛開放平台、星辰MaaS平台提供API調用，星辰Coding Plan已全面支持該模型。

星火X2-Flash的技術原理

MoE架構：模型採用混合專家架構，總參數30B，在保持性能的同時實現更高效率。
國產算力訓練：基於華爲昇騰910B集羣完成訓練，通過親和國產芯片的算子和分佈式訓練策略深度優化。
智能體數據閉環：構建可驗證的大規模智能體數據自動合成平台，由Agent自主搭建環境、檢測結果準確性，實現數據高效合成與閉環。
長文本高效訓練：率先在國產算力上實現DSA（稀疏注意力）與MTP（多token預測）結合，上下文拓展至256K，訓練效率相比同規模A800集羣從20%提升至90%。
採樣解碼效率優化：在強化學習訓練場景中，通過算法與工程創新，採樣解碼效率最高提升2倍以上，緩解長交互場景下RL訓練的算力障礙。

星火X2-Flash的關鍵信息和使用要求

模型名稱：星火X2-Flash
發佈方：科大訊飛 / 訊飛開放平台
模型架構：MoE（混合專家），總參數30B
上下文窗口：最大支持256K
訓練算力：華爲昇騰910B國產集羣
已接入平台：AstronClaw、Loomy
API入口：訊飛開放平台、星辰MaaS平台
兼容框架：OpenClaw、Claude Code等主流Agent框架
使用要求：
- 開發者可通過訊飛開放平台或星辰MaaS平台調用API
- 星辰Coding Plan已全面支持該模型，新老用戶均可自主切換使用

星火X2-Flash的核心優勢

性價比極高：複雜Agent任務效果接近萬億級參數模型，Token消耗不到主流大模型的三分之一
國產算力自主可控：基於華爲昇騰910B集羣訓練，在本土算力架構上高效運行
超長上下文：256K上下文窗口，滿足複雜智能體工作流的長鏈路需求
訓練效率突破：通過DSA+MTP技術，國產算力訓練效率從20%提升至90%
推理速度快：採樣解碼效率最高提升2倍以上，強化學習訓練耗時大幅降低
Agent原生優化：深度兼容OpenClaw等主流Agent框架，支持智能體數據自動合成閉環
生態快速接入：已接入AstronClaw、Loomy等應用，開發者可即開即用

星火X2-Flash的同類競品對比

對比維度	星火X2-Flash	DeepSeek-V3	Qwen2.5-72B
參數規模	30B（MoE）	671B MoE（每次激活37B）	72B（Dense）
上下文窗口	256K	128K	128K
模型架構	MoE	MoE	Dense（密集架構）
訓練算力	華爲昇騰910B（國產）	英偉達H800集羣	英偉達/AMD等多類GPU
開源情況	閉源（API服務）	開源（可本地部署）	開源（可本地部署）
Agent適配	原生優化，深度兼容OpenClaw、Claude Code	通用能力強，Agent生態依賴社區/第三方	通用能力強，Agent生態依賴社區/第三方
任務效果	接近萬億級參數模型	接近GPT-4o水平，數學/代碼突出	綜合能力優秀，多語言支持好
Token成本	不到主流大尺寸模型1/3	API定價較低（約GPT-4o的1/10）	API定價較低（約GPT-4o的1/20）
核心定位	Agent時代的性價比引擎	高性能開源基座模型	開源生態旗艦模型

星火X2-Flash的應用場景

複雜Agent工作流：深度研究報告生成、多步驟任務拆解與執行、多輪上下文讀取與修正。
Skill/工具開發：自動生成和管理複雜Skill（如AI視頻生成Skill），包含結構定義、核心功能、使用案例。
代碼生成與系統控制：編寫腳本、系統命令執行、自動化運維等需要代碼能力的場景。
長文檔分析：基於256K上下文處理超長文檔、論文、報告，進行摘要、提取與問答。
多模態任務編排：作爲Agent大腦，調度文生視頻、圖生視頻等多平台工具鏈（如可靈、Runway、Pika等）。

© 版權聲明

文章版权归作者所有，未经允许请勿转载。

相關文章

Shaped – 支持個性化推薦的AI搜索引擎

earnbyshare2016

1 0

GPT-SoVITS – 開源的聲音克隆項目，只需少量數據即可合成聲音

earnbyshare2016

44 0

Kyutai TTS – Kyutai Labs推出的流式文本轉語音技術

earnbyshare2016

4 0

盤盤單詞 – 百度網盤推出的AI英語學習小程序

earnbyshare2016

6 0

CogView-3-Plus – 智譜AI最新推出的AI文生圖模型，媲美 MJ-V6 和 FLUX

earnbyshare2016

16 0

Speak APP – AI英語學習應用，與AI實時互動模擬真實口語對話場景

earnbyshare2016

0 0

暫無評論

暫無評論...