AI工具
VoxCPM2 – OpenBMB開源的語音合成模型
VoxCPM2是什麼 VoxCPM2是OpenBMB開源的2B參數語音合成模型。模型採用無分詞器擴散自迴歸架構,支持30種語言及中文方言,輸出48kHz錄音室級音質。VoxCPM2首創V...
LLM Wiki – Karpathy開源的自運行個人知識庫
LLM Wiki是什麼 LLM Wiki是Karpathy推出的自運行的個人知識庫,突破傳統RAG”每次查詢從零檢索”的侷限。LLM Wiki通過Schema文件指導LLM主動維護結構化Markdown...
OpenHarness – 港大開源的輕量級 AI Agent 框架
OpenHarness是什麼 OpenHarness 是香港大學數據智能實驗室(HKUDS)開源的輕量級 AI Agent 框架,用純 Python 實現,僅 11,733 行代碼(爲 Claude Code 的 1/...
EmDash – Cloudflare開源的 AI 原生內容管理系統
EmDash是什麼 EmDash是Cloudflare推出的AI原生內容管理系統,定位爲WordPress的繼承者。EmDash採用TypeScript+Serverless架構,支持AI代理直接操作網站,數據...
OmniWeaving – 騰訊混元聯合浙大等開源的視頻生成框架
OmniWeaving是什麼 OmniWeaving是浙江大學聯合騰訊混元、南洋理工大學推出的統一視頻生成框架。框架突破傳統開源模型單一任務限制,實現多模態自由組合與推理...
MAI-Transcribe-1 – 微軟推出的語音轉文字模型
MAI-Transcribe-1是什麼 MAI-Transcribe-1是微軟Azure AI Foundry推出的企業級語音轉文字模型,支持中英日法等25種語言,模型在FLEURS基準測試中全面領先Whis...
Wan2.7-Video – 阿里通義推出的 AI 視頻創作模型
Wan2.7-Video是什麼 Wan2.7-Video是阿里通義實驗室推出的AI視頻創作大模型,支持文本、圖像、視頻、音頻全模態輸入。模型突破傳統生成限制,實現”像修圖一樣...
JoyAI-Image-Edit – 京東開源的指令引導圖像編輯模型
JoyAI-Image-Edit是什麼 JoyAI-Image-Edit是京東開源的指令引導圖像編輯模型,基於JoyAI-Image多模態基礎模型構建。模型支持通過自然語言指令實現精確可控的...
InternSVG – 上海AI Lab推出的統一 SVG 建模套件
InternSVG是什麼 InternSVG是上海人工智能實驗室等推出的面向統一SVG建模的“數據-評測-模型”綜合套件,包含三大組件:超1600萬樣本的SAgoge數據集、標準化SAr...
Gemma 4 – 谷歌開源的多模態大模型系列
Gemma 4是什麼 Gemma 4是Google開源的多模態大模型系列,基於Gemini 3架構。模型包含E2B/E4B(手機/樹莓派可跑)、26B MoE(僅激活3.8B參數)和31B Dense(Ar...