星火X2-Flash – 科大訊飛推出的MoE架構大語言模型

AI工具1周前發佈新公告 AI管理員
0 0

星火X2-Flash是什麼

星火X2-Flash是科大訊飛發佈的MoE架構大語言模型,總參數30B,支持256K超長上下文,基於華爲昇騰910B國產算力集羣訓練。模型專爲Agent時代設計,在智能體任務執行、代碼生成、深度研究等場景表現接近萬億級參數模型,Token消耗成本不到主流大模型的三分之一。模型通過DSA稀疏注意力與MTP多token預測等技術實現高效訓練與推理,已開放API並接入AstronClaw、Loomy等平台。

星火X2-Flash – 科大訊飛推出的MoE架構大語言模型

星火X2-Flash的主要功能

  • 智能體任務執行:支持深度研究報告生成、Skill管理與調用、系統控制與執行等複雜Agent工作流,效果接近萬億級參數模型。
  • 代碼生成:可快速生成複雜Skill(如AI視頻生成Skill),包含技能結構、核心功能、使用案例等完整說明。
  • 超長上下文處理:最大支持256K上下文窗口,滿足長鏈路Agent任務中數十萬甚至上百萬Token的消耗需求。
  • 多平台接入:已接入AstronClaw、Loomy等產品,兼容OpenClaw、Claude Code等主流Agent框架。
  • API服務:通過訊飛開放平台、星辰MaaS平台提供API調用,星辰Coding Plan已全面支持該模型。

星火X2-Flash的技術原理

  • MoE架構:模型採用混合專家架構,總參數30B,在保持性能的同時實現更高效率。
  • 國產算力訓練:基於華爲昇騰910B集羣完成訓練,通過親和國產芯片的算子和分佈式訓練策略深度優化。
  • 智能體數據閉環:構建可驗證的大規模智能體數據自動合成平台,由Agent自主搭建環境、檢測結果準確性,實現數據高效合成與閉環。
  • 長文本高效訓練:率先在國產算力上實現DSA(稀疏注意力)與MTP(多token預測)結合,上下文拓展至256K,訓練效率相比同規模A800集羣從20%提升至90%。
  • 採樣解碼效率優化:在強化學習訓練場景中,通過算法與工程創新,採樣解碼效率最高提升2倍以上,緩解長交互場景下RL訓練的算力障礙。

星火X2-Flash的關鍵信息和使用要求

  • 模型名稱:星火X2-Flash
  • 發佈方:科大訊飛 / 訊飛開放平台
  • 模型架構:MoE(混合專家),總參數30B
  • 上下文窗口:最大支持256K
  • 訓練算力:華爲昇騰910B國產集羣
  • 已接入平台:AstronClaw、Loomy
  • API入口:訊飛開放平台、星辰MaaS平台
  • 兼容框架:OpenClaw、Claude Code等主流Agent框架
  • 使用要求:
    • 開發者可通過訊飛開放平台或星辰MaaS平台調用API
    • 星辰Coding Plan已全面支持該模型,新老用戶均可自主切換使用

星火X2-Flash的核心優勢

  • 性價比極高:複雜Agent任務效果接近萬億級參數模型,Token消耗不到主流大模型的三分之一
  • 國產算力自主可控:基於華爲昇騰910B集羣訓練,在本土算力架構上高效運行
  • 超長上下文:256K上下文窗口,滿足複雜智能體工作流的長鏈路需求
  • 訓練效率突破:通過DSA+MTP技術,國產算力訓練效率從20%提升至90%
  • 推理速度快:採樣解碼效率最高提升2倍以上,強化學習訓練耗時大幅降低
  • Agent原生優化:深度兼容OpenClaw等主流Agent框架,支持智能體數據自動合成閉環
  • 生態快速接入:已接入AstronClaw、Loomy等應用,開發者可即開即用

星火X2-Flash的同類競品對比

對比維度 星火X2-Flash DeepSeek-V3 Qwen2.5-72B
參數規模 30B(MoE) 671B MoE(每次激活37B) 72B(Dense)
上下文窗口 256K 128K 128K
模型架構 MoE MoE Dense(密集架構)
訓練算力 華爲昇騰910B(國產) 英偉達H800集羣 英偉達/AMD等多類GPU
開源情況 閉源(API服務) 開源(可本地部署) 開源(可本地部署)
Agent適配 原生優化,深度兼容OpenClaw、Claude Code 通用能力強,Agent生態依賴社區/第三方 通用能力強,Agent生態依賴社區/第三方
任務效果 接近萬億級參數模型 接近GPT-4o水平,數學/代碼突出 綜合能力優秀,多語言支持好
Token成本 不到主流大尺寸模型1/3 API定價較低(約GPT-4o的1/10) API定價較低(約GPT-4o的1/20)
核心定位 Agent時代的性價比引擎 高性能開源基座模型 開源生態旗艦模型

星火X2-Flash的應用場景

  • 複雜Agent工作流:深度研究報告生成、多步驟任務拆解與執行、多輪上下文讀取與修正。
  • Skill/工具開發:自動生成和管理複雜Skill(如AI視頻生成Skill),包含結構定義、核心功能、使用案例。
  • 代碼生成與系統控制:編寫腳本、系統命令執行、自動化運維等需要代碼能力的場景。
  • 長文檔分析:基於256K上下文處理超長文檔、論文、報告,進行摘要、提取與問答。
  • 多模態任務編排:作爲Agent大腦,調度文生視頻、圖生視頻等多平台工具鏈(如可靈、Runway、Pika等)。
© 版權聲明

相關文章

暫無評論

暫無評論...