VITA – 騰訊推出的開源多模態AI模型
VITA是什麼 VITA是騰訊優圖實驗室推出的全球首個開源多模態大語言模型(MLLM),能理解和處理視頻、圖像、文本和音頻。基於Mixtral 8×7B模型,擴展了中文詞彙...
Linly-Dubbing – 智能視頻多語言AI配音和翻譯工具
Linly-Dubbing是什麼 Linly-Dubbing是一個開源的智能視頻多語言AI配音和翻譯工具,能自動將視頻內容翻譯成多種語言,並生成字幕。通過WhisperX和FunASR進行精...
神采PromeAI – 專爲設計師打造的AI設計助手
神采PromeAI是什麼 神采PromeAI是一款專爲設計師打造的AI設計助手。適合建築師、室內設計師、產品設計師和遊戲動漫設計師使用,通過強大的AIGC模型風格庫,用...
Cradle – 通用計算機控制的多模態AI Agent框架
Cradle是什麼 Cradle是面向通用計算機控制(General Computer Control, GCC)的多模態AI Agent框架,由崑崙萬維攜手北京智源人工智能研究院、新加坡南洋理工...
Not Diamond – AI模型路由器,智能選擇最合適的AI模型
Not Diamond是什麼 Not Diamond是AI模型路由器,根據任務需求智能選擇最合適的AI模型,提高效率和降低成本。Not Diamond在多個基準測試中表現出色,超越了現...
ORMBG – 開源的AI圖像分割工具
ORMBG是什麼 ORMBG是開源的AI圖像分割工具,由開發者schirrmacher在GitHub上發起。ORMBG專注於從圖片中準確去除背景,用先進的圖像處理技術,實現對圖像中前...
HumanVid – 專爲人類圖像動畫生成而設計的高質量數據集
HumanVid是什麼 HumanVid是香港中文大學和上海人工智能實驗室共同推出的高質量數據集,專爲人類圖像動畫訓練設計。結合了現實世界視頻和合成數據,通過精心設...
關於AI工具集官方社羣
免費社羣 ✅ 分享每日最新AI資訊、AI產品、行業新聞、融資信息等; ✅ 分享AI產品使用技巧、玩法、教程、學習資源等; 🤔 可能偶爾會有【AI工具集|廣告信息...
Buzz – 免費開源的AI語音轉文字工具
Buzz是什麼 Buzz是一款基於OpenAI Whisper模型構建的離線語音轉文字工具,適用於Windows、macOS和Linux系統。Buzz能將麥克風輸入或音頻、視頻文件實時轉換爲...
Subtitle Edit – 免費開源的多功能字幕編輯器
Subtitle Edit是什麼 Subtitle Edit是一款免費開源的多功能字幕編輯器,支持超過300種字幕格式,包括SRT、MicroDVD和Sub Station Alpha等。具備字幕同步、創...