AI工具

MAI-Thinking-1 – 微軟推出的首款自研高級推理模型

MAI-Thinking-1是什麼 MAI-Thinking-1 是微軟推出的首款自研高級推理模型。模型採用 35B 活躍參數 / 約 1T 總參數的稀疏 MoE 架構,完全基於乾淨、商業授權數...

Science Skills – 谷歌 DeepMind 開源的科研技能工具包

Science Skills是什麼 Science Skills 是谷歌 DeepMind 推出的開源科研技能集合,專爲加速 AI Agent 驅動的科學研究工作流設計。工具整合 AlphaGenome、Alpha...

Bernini – 字節跳動開源的統一視頻生成與編輯框架

Bernini是什麼 Bernini 是字節跳動開源的統一視頻生成與編輯框架,採用MLLM 語義規劃 + DiT 視覺渲染的兩階段解耦架構。多模態大模型理解指令並規劃語義草圖...

PaddleOCR-VL-1.6 – 百度推出的文檔解析視覺語言模型

PaddleOCR-VL-1.6是什麼 PaddleOCR-VL-1.6 是百度飛槳團隊推出的文檔解析視覺語言模型(VLM),是 PaddleOCR-VL 系列的最新升級版本。模型僅 0.9B 參數,在 O...

Mellum2 – JetBrains 開源的混合專家模型

Mellum2是什麼 Mellum2 是 JetBrains 開源的面向軟件工程系統的新機器學習模型。模型每 token 僅激活 2.5B 參數,專爲軟件工程 AI 工作流優化,支持代碼生成...

OpenClacky – 李亞飛團隊開源的低成本 AI Agent

OpenClacky是什麼 OpenClacky 是李亞飛團隊開源的 AI Agent,支持一鍵安裝與跨平台運行。工具通過精簡工具集、智能上下文壓縮和模型路由大幅降低使用成本,讓...

語構 – 阿里達摩院推出的 AI 原生開發平台

語構是什麼 語構是阿里達摩院推出的AI原生開發平台,以Vibe Coding爲核心範式,讓用戶通過自然語言描述需求可生成完整可用的數字產品。平台覆蓋從需求理解、...

Qwen3.7-Plus – 阿里通義推出的智能體多模態大模型

Qwen3.7-Plus是什麼 Qwen3.7-Plus 是通義千問推出的新一代多模態大模型,將視覺與語言統一爲一體化智能體基座。模型能感知真實世界場景、讀取屏幕並操作 GUI...

Polar – 英偉達開源的智能體強化學習訓練框架

Polar是什麼 Polar 是英偉達推出的開源智能體強化學習(Agentic RL)訓練框架,核心創新在於無需修改現有智能體框架內部代碼,可將其接入 GRPO 等 RL 算法進...

Dubbing v2 – ElevenLabs 推出的 AI 配音模型

Dubbing v2是什麼 Dubbing v2 是 ElevenLabs 推出的 AI 配音模型,支持 29 種語言自動翻譯配音,保留原始說話人音色與情感。模型提供雙工作流模式,Auto Dub ...
1 ... 10 11 12 13 14 ... 127