AI工具
MAI-Thinking-1 – 微軟推出的首款自研高級推理模型
MAI-Thinking-1是什麼 MAI-Thinking-1 是微軟推出的首款自研高級推理模型。模型採用 35B 活躍參數 / 約 1T 總參數的稀疏 MoE 架構,完全基於乾淨、商業授權數...
Science Skills – 谷歌 DeepMind 開源的科研技能工具包
Science Skills是什麼 Science Skills 是谷歌 DeepMind 推出的開源科研技能集合,專爲加速 AI Agent 驅動的科學研究工作流設計。工具整合 AlphaGenome、Alpha...
Bernini – 字節跳動開源的統一視頻生成與編輯框架
Bernini是什麼 Bernini 是字節跳動開源的統一視頻生成與編輯框架,採用MLLM 語義規劃 + DiT 視覺渲染的兩階段解耦架構。多模態大模型理解指令並規劃語義草圖...
PaddleOCR-VL-1.6 – 百度推出的文檔解析視覺語言模型
PaddleOCR-VL-1.6是什麼 PaddleOCR-VL-1.6 是百度飛槳團隊推出的文檔解析視覺語言模型(VLM),是 PaddleOCR-VL 系列的最新升級版本。模型僅 0.9B 參數,在 O...
Mellum2 – JetBrains 開源的混合專家模型
Mellum2是什麼 Mellum2 是 JetBrains 開源的面向軟件工程系統的新機器學習模型。模型每 token 僅激活 2.5B 參數,專爲軟件工程 AI 工作流優化,支持代碼生成...
OpenClacky – 李亞飛團隊開源的低成本 AI Agent
OpenClacky是什麼 OpenClacky 是李亞飛團隊開源的 AI Agent,支持一鍵安裝與跨平台運行。工具通過精簡工具集、智能上下文壓縮和模型路由大幅降低使用成本,讓...
語構 – 阿里達摩院推出的 AI 原生開發平台
語構是什麼 語構是阿里達摩院推出的AI原生開發平台,以Vibe Coding爲核心範式,讓用戶通過自然語言描述需求可生成完整可用的數字產品。平台覆蓋從需求理解、...
Qwen3.7-Plus – 阿里通義推出的智能體多模態大模型
Qwen3.7-Plus是什麼 Qwen3.7-Plus 是通義千問推出的新一代多模態大模型,將視覺與語言統一爲一體化智能體基座。模型能感知真實世界場景、讀取屏幕並操作 GUI...
Polar – 英偉達開源的智能體強化學習訓練框架
Polar是什麼 Polar 是英偉達推出的開源智能體強化學習(Agentic RL)訓練框架,核心創新在於無需修改現有智能體框架內部代碼,可將其接入 GRPO 等 RL 算法進...
Dubbing v2 – ElevenLabs 推出的 AI 配音模型
Dubbing v2是什麼 Dubbing v2 是 ElevenLabs 推出的 AI 配音模型,支持 29 種語言自動翻譯配音,保留原始說話人音色與情感。模型提供雙工作流模式,Auto Dub ...