Hy3 preview – 騰訊混元開源快慢思考融合的混合專家模型

AI工具2周前發佈新公告 AI管理員
0 0

Hy3 preview是什麼

Hy3 preview 是騰訊混元開源的快慢思考融合的混合專家模型,定位爲”迄今最智能的模型”。模型採用 MoE 架構,用21B激活參數實現295B總參數規模,兼顧性能與推理成本。模型主打全面實用性,拒絕”偏科”,強調推理、長文、指令、對話、代碼、工具等能力的體系化協同。模型通過自建評測、最新考試與產品衆測驗證真實戰鬥力,深度協同推理框架優化,使推理效率提升40%,讓高性能AI具備商業可用性。

Hy3 preview – 騰訊混元開源快慢思考融合的混合專家模型

Hy3 preview的主要功能

  • 複雜推理:在數學奧賽、生物聯賽及前沿科學難題中展現可泛化的強推理能力。
  • 代碼與智能體:支持一次性生成完整小程序/小遊戲代碼,在 SWE-Bench Verified、Terminal-Bench 2.0 等評測中表現突出。
  • 上下文學習:基於自研 CL-bench 與 CL-bench-Life 基準,精準理解雜亂長文本中的隱含約束與規則。
  • 指令遵循:準確處理多輪對話中的複雜排期、項目規劃等真實工作場景需求。
  • 自然對話:減少”機器味”,先共情再回答,寫作更自然、比喻更生動。
  • 長文本處理:支持256K上下文,可處理數萬字文檔的全文理解與總結。

Hy3 preview的技術原理

  • MoE 混合專家架構:採用稀疏激活機制,單次推理僅激活21B參數,在295B總參數規模下實現高性能與低推理成本的平衡。
  • 快慢思考融合機制:整合快速直覺推理與慢速深度思考兩種認知模式,根據任務複雜度動態調配計算資源與推理路徑。
  • 預訓練基礎設施重建:推倒重建預訓練與強化學習框架,擴大RL訓練規模,針對性提升代碼生成與智能體任務執行能力。
  • 架構-推理協同優化:深度協同模型結構設計與底層推理框架,通過算子融合、內存優化等工程手段使端到端推理效率提升40%。
  • 長上下文處理機制:支持256K tokens超長上下文,採用高效的位置編碼與稀疏注意力機制,實現對數萬字文檔的全文精準定位與理解。
  • 多能力體系化訓練:拒絕單一能力”偏科”,通過統一訓練框架實現推理、代碼、對話、指令遵循、工具調用等能力的深度協同與相互增強。

如何使用Hy3 preview

  • 官網直接體驗:訪問騰訊混元官網,在線與模型對話,測試推理、代碼生成與長文本理解能力。
  • 開源本地部署:前往 GitHub 或 Hugging Face 搜索”Tencent Hy3 preview”,下載模型權重與推理代碼,基於本地GPU環境進行部署與微調。
  • API 調用開發:登錄騰訊雲 TokenHub,選擇 Hy3 preview 套餐(Lite/Standard/Pro/Max),獲取 API Key 後即可通過標準接口將模型能力接入自有應用或工作流。
  • 騰訊產品直接使用:在元寶、ima、CodeBuddy、WorkBuddy、QQ、QQ瀏覽器、騰訊文檔、騰訊樂享、搜狗輸入法、騰訊地圖、騰訊電子籤、騰訊雲等產品中,Hy3 preview 已作爲底層模型全面上線,直接對話即可調用新模型能力。

Hy3 preview的關鍵信息和使用要求

  • 模型架構:快慢思考融合 MoE,總參數295B,激活參數21B。
  • 上下文長度:最大支持256K tokens。
  • 開源情況:模型權重與代碼已在 GitHub、Hugging Face 全面開源,免費下載。
  • API 調用:可通過騰訊雲 TokenHub 調用,輸入最低1.2元/百萬tokens,輸出最低4元/百萬tokens。
  • 套餐價格:Lite套餐28元/月(35百萬tokens),Standard 78元/月,Pro 238元/月,Max 468元/月。
  • 已接入產品:元寶、ima、CodeBuddy、WorkBuddy、QQ、QQ瀏覽器、騰訊文檔、騰訊樂享、搜狗輸入法、騰訊地圖、騰訊電子籤、騰訊雲等。

Hy3 preview的核心優勢

  • 真實評測導向:跳出易被刷榜的公開榜單,通過自建50+套評測、真實考試與產品衆測驗證能力。
  • 高性價比:深度協同模型架構與推理框架設計,推理效率提升40%,激活參數僅21B。
  • Agent 能力躍升:代碼生成與多步驟任務執行能力進步顯著,可一次性輸出完整可運行項目。
  • 實用主義原則:模型追求能力體系化、評測真實性與商業合理性的統一。

Hy3 preview的項目地址

  • 項目官網:https://hunyuan.tencent.com/research/hy3
  • GitHub倉庫:https://github.com/Tencent-Hunyuan/Hy3-preview
  • HuggingFace模型庫:https://huggingface.co/tencent/Hy3-preview

Hy3 preview的同類競品對比

維度 騰訊混元 Hy3 preview DeepSeek-V3.2 Kimi-K2.5 GLM-5
總參數 295B 約600B+ 約1T 約800B
激活參數 21B 約37B 約32B 約78B
上下文長度 256K 128K 256K 128K
Agent 評測 57+分(16項均值) 約51分 約57分 約60分
開源情況 已開源 已開源 未開源 未開源
定價策略 輸入1.2元/百萬tokens起 較低 較高 中等
核心定位 實用主義+高性價比 性能優先 長文本+多模態 通用大模型

Hy3 preview的應用場景

  • 學術科研: 推導複雜數學公式、解答奧賽級理科難題、輔助論文閱讀與科研假設驗證。
  • 教育輔導:講解高難度題目、根據學生水平動態調整講解深度、生成個性化練習題與知識梳理。
  • 軟件開發:一次性輸出完整微信小程序/小遊戲代碼與配置文件、自動修復代碼Bug、輔助前後端聯調與終端任務執行。
  • 智能辦公:從雜亂會議紀要中精準提取待辦事項與排期、處理跨部門複雜項目協調、在騰訊文檔中直接生成PPT內容。
  • 內容運營:撰寫公衆號文章與營銷文案、優化文本減少”AI腔”、生成多風格創意內容與生動比喻。
© 版權聲明

相關文章

暫無評論

暫無評論...