VimRAG – 阿里通義開源的全模態知識庫 RAG 框架
VimRAG是什麼 VimRAG是阿里通義實驗室開源的全模態RAG框架,支持圖文視頻混合知識庫。框架創新採用多模態記憶圖(DAG)替代線性上下文,將推理建模爲動態有向...
Seeduplex – 字節跳動推出的原生全雙工語音大模型
Seeduplex是什麼 Seeduplex是字節跳動Seed團隊推出的原生全雙工語音大模型,實現”邊聽邊說”的實時交互。模型能精準抗干擾(誤打斷率降50%)、動態判停(搶話...
QBotClaw – 騰訊推出的國內首個瀏覽器原生AI智能體
QBotClaw是什麼 QBotClaw是騰訊推出的國內首個瀏覽器原生AI智能體,深度集成於QQ瀏覽器。用戶無需下載安裝,打開瀏覽器可通過自然語言指令讓AI自動操控網頁、...
ListenHub CLI – ListenHub 開源的AI內容創作命令行工具
ListenHub CLI是什麼 ListenHub CLI是開源的AI內容創作命令行工具,基於Node.js,支持在終端一鍵生成音樂、播客、PPT、語音及AI繪畫。工具支持本地文件上傳、...
MMX-CLI – MiniMax 推出的全模態命令行工具
MMX-CLI是什麼 MMX-CLI 是 MiniMax 專爲 AI Agent 打造的全模態命令行工具,支持文本、圖像、視頻、語音、音樂生成及視覺理解等能力。Agent 可在 Claude Code...
Claude Managed Agents – Anthropic 推出的全託管 Agent 平台
Claude Managed Agents是什麼 Claude Managed Agents 是 Anthropic 推出的全託管 Agent 平台,通過 API 讓開發者在雲端構建、部署生產級 AI Agent。將”大腦”...
Muse Spark – Meta 推出的原生多模態大模型
Muse Spark是什麼 Muse Spark是Meta超級智能實驗室推出的首個原生多模態大模型。作爲Meta AI重組後的旗艦產品,模型在Artificial Analysis基準測試中從18分躍...
CutClaw – 灣大聯合北交大開源的 AI 視頻剪輯工具
CutClaw是什麼 CutClaw是大灣區大學GVC實驗室與北交大團隊開源的AI視頻剪輯工具。工具採用多智能體架構,通過”音樂驅動”方式將幾小時長視頻自動剪輯成節奏精...
OmniVoice – 小米團隊開源的多語言TTS模型
OmniVoice是什麼 OmniVoice是小米 AI 實驗室新一代 Kaldi 團隊開源的超大規模多語言TTS模型,支持600+語種零樣本語音克隆。模型採用極簡非自迴歸擴散架構,結...
HappyHorse – Artificial Analysis盲測榜首的AI視頻生成模型
HappyHorse是什麼 HappyHorse是空降Artificial Analysis視頻生成盲測榜榜首的神祕AI模型,以1347分Elo積分斷層領先Seedance 2.0,文生/圖生視頻雙冠。模型疑...