Ornith-1.0是什麼
Ornith-1.0 是 DeepReinforce 團隊推出的專爲 Agentic 編程任務設計的開源大模型系列,模型基於 Gemma 4 與 Qwen 3.5 預訓練基座,採用自改進訓練框架,在代碼生成與軟件工程基準上達到同級別開源模型的 SOTA 水平。

Ornith-1.0的主要功能
-
全規格覆蓋:提供 9B Dense、31B Dense、35B MoE、397B MoE 四種規格,滿足從邊緣設備到旗艦級服務器的全場景部署需求。
-
Agentic 編程:專爲智能體編程任務優化,支持複雜軟件工程問題的自動化解決,如代碼修復、功能實現與終端命令執行。
-
自改進腳手架生成:模型能夠自主生成任務特定的腳手架(harness),引導並優化解決方案的搜索路徑。
-
本地部署兼容:已上架 HuggingFace,提供兼容 OpenAI API 的接口及多種本地部署方案。

微信關注回覆 “開源”,加入AI開源項目交流羣
Ornith-1.0的技術原理
-
基座模型:基於 Gemma 4 和 Qwen 3.5 的預訓練權重進行後訓練,繼承其語言理解與代碼生成能力。
-
自改進訓練框架:區別於傳統 RL 依賴人工設計腳手架,Ornith-1.0 通過強化學習讓模型聯合生成解決方案 rollout 與任務特定 harness,實現腳手架與最終解的協同優化。
-
聯合優化機制:在訓練過程中同時優化任務腳手架和生成結果,使模型能夠自主發現更優的搜索軌跡,持續提升輸出質量。
如何使用Ornith-1.0
-
獲取模型:訪問 HuggingFace 平台搜索 Ornith-1.0 系列,下載對應規格的模型權重。
-
本地部署:根據硬件配置選擇 9B(邊緣設備)、31B/35B或 397B版本。
-
接口調用:用兼容 OpenAI API 的接口集成到現有開發工作流或 Agent 框架中。
-
任務配置:針對 Agentic coding 場景,將模型接入 IDE 插件或自動化軟件工程流水線。
Ornith-1.0的核心優勢
-
同級 SOTA:397B 旗艦版在 Terminal-Bench 2.1取得77.5 分和 SWE-Bench Verified取得82.4 分超越 Claude Opus 4.7。
-
越級性能:35B MoE 版本在 Terminal-Bench 2.1 上以 64.4 分超越 397B 參數的 Qwen 3.5-397B取得53.5 分,實現以小博大。
-
邊緣友好:9B 模型可在低資源環境部署,性能匹敵 Gemma 4-31B 與 Qwen 3.6 35B。
Ornith-1.0的項目地址
- 項目官網:https://deep-reinforce.com/ornith_1_0.html
- HuggingFace模型庫:https://huggingface.co/collections/deepreinforce-ai/ornith-10
Ornith-1.0的同類競品對比
| 對比維度 | Ornith-1.0 | DeepSeek-V4-Pro |
|---|---|---|
| 參數規模 | 9B / 31B Dense、35B / 397B MoE(全系列梯度覆蓋) | 超大參數(具體規格未公開細分梯度) |
| 開源協議 | MIT(完全開源,可自由商用) | 開源(具體協議以官方爲準) |
| Terminal-Bench 2.1 | 77.5(397B)/ 64.4(35B) | 67.9 |
| SWE-Bench Verified | 82.4(397B) | 80.6 |
| 核心訓練方法 | 自改進訓練框架:模型自主生成任務腳手架(harness)並與解決方案聯合優化,減少人工設計依賴 | RLHF + 規則驅動優化:依賴人類反饋與預設規則進行代碼優化 |
| 模型定位 | Agentic 編程專用:專爲智能體編程、終端命令執行、軟件工程自動化設計 | 通用編程開源:面向廣泛代碼生成與編程輔助任務 |
| 部署靈活性 | 全規格覆蓋:9B 可部署至邊緣設備,397B 面向服務器集羣 | 主要聚焦超大參數版本,邊緣部署受限 |
Ornith-1.0的應用場景
-
智能體編程助手:作爲 AI 程序員的核心引擎,自動化處理 GitHub Issue 修復、代碼審查與功能開發。
-
終端命令智能體:基於 Terminal-Bench 優化能力,執行復雜的服務器運維、數據分析與自動化腳本任務。
-
邊緣設備代碼輔助:9B 版本可集成至本地 IDE 插件或離線開發環境,爲資源受限場景提供實時代碼補全。
-
企業級軟件工程:397B 旗艦版可用於大型代碼庫維護、跨文件重構與複雜軟件架構設計。
© 版權聲明
文章版权归作者所有,未经允许请勿转载。
相關文章
暫無評論...