VITA – 騰訊推出的開源多模態AI模型

VITA是什麼 VITA是騰訊優圖實驗室推出的全球首個開源多模態大語言模型(MLLM),能理解和處理視頻、圖像、文本和音頻。基於Mixtral 8×7B模型,擴展了中文詞彙...

Linly-Dubbing – 智能視頻多語言AI配音和翻譯工具

Linly-Dubbing是什麼 Linly-Dubbing是一個開源的智能視頻多語言AI配音和翻譯工具,能自動將視頻內容翻譯成多種語言,並生成字幕。通過WhisperX和FunASR進行精...

神采PromeAI – 專爲設計師打造的AI設計助手

神采PromeAI是什麼 神采PromeAI是一款專爲設計師打造的AI設計助手。適合建築師、室內設計師、產品設計師和遊戲動漫設計師使用,通過強大的AIGC模型風格庫,用...

Cradle – 通用計算機控制的多模態AI Agent框架

Cradle是什麼 Cradle是面向通用計算機控制(General Computer Control, GCC)的多模態AI Agent框架,由崑崙萬維攜手北京智源人工智能研究院、新加坡南洋理工...

Not Diamond – AI模型路由器,智能選擇最合適的AI模型

Not Diamond是什麼 Not Diamond是AI模型路由器,根據任務需求智能選擇最合適的AI模型,提高效率和降低成本。Not Diamond在多個基準測試中表現出色,超越了現...

ORMBG – 開源的AI圖像分割工具

ORMBG是什麼 ORMBG是開源的AI圖像分割工具,由開發者schirrmacher在GitHub上發起。ORMBG專注於從圖片中準確去除背景,用先進的圖像處理技術,實現對圖像中前...

關於AI工具集官方社羣

免費社羣 ✅ 分享每日最新AI資訊、AI產品、行業新聞、融資信息等; ✅ 分享AI產品使用技巧、玩法、教程、學習資源等; 🤔 可能偶爾會有【AI工具集|廣告信息...

Buzz – 免費開源的AI語音轉文字工具

Buzz是什麼 Buzz是一款基於OpenAI Whisper模型構建的離線語音轉文字工具,適用於Windows、macOS和Linux系統。Buzz能將麥克風輸入或音頻、視頻文件實時轉換爲...

Subtitle Edit – 免費開源的多功能字幕編輯器

Subtitle Edit是什麼 Subtitle Edit是一款免費開源的多功能字幕編輯器,支持超過300種字幕格式,包括SRT、MicroDVD和Sub Station Alpha等。具備字幕同步、創...

LabelU – 開源的多模態數據標註工具

LabelU是什麼 LabelU 是一款開源的多模態數據標註工具,支持圖像、視頻和音頻的標註,具備拉框、多邊形、標點、標線、分類、描述等圖像標註能力,能滿足...
1 ... 23 24 25 26 27 ... 77