AI項目和框架
ChatLearn – 阿里雲PAI團隊開發的大規模Alignment訓練框架
ChatLearn是什麼 ChatLearn 是由阿里雲 PAI 團隊開發的一個靈活、易用、高效的大規模 Alignment 訓練框架。是爲了支持大型語言模型(LLMs)的 Alignment 訓練...
NanoFlow – 優化大語言模型推理吞吐量的服務框架
NanoFlow是什麼 NanoFlow 是一個高性能的服務框架,專爲大型語言模型(LLMs)設計,以提高模型的推理吞吐量。它通過在單個設備內部並行使用計算、內存和網絡...
LanceDB – 爲AI應用設計的無服務器向量數據庫,降低運維成本
LanceDB是什麼 LanceDB 是一款專爲人工智能應用設計的無服務器向量數據庫,支持向量搜索、全文搜索和SQL查詢,優化了多模態數據處理。它採用向量索引技術,實...
VideoGameBunny – 專爲視頻遊戲設計的開源多模態大模型
VideoGameBunny是什麼 VideoGameBunny(VGB)是一個專爲視頻遊戲設計的開源大型多模態模型,由加拿大阿爾伯塔大學研究團隊開發。它能理解和生成多種語言的遊...
GaussianEditor – 一種3D編輯算法,支持快速且精確地修改3D場景
GaussianEditor是什麼 GaussianEditor 是一種基於高斯飛濺(Gaussian Splatting)的3D編輯算法,支持用戶快速而精確地修改3D場景。通過高斯語義跟蹤和分層高...
ControlNeXt – AI圖像和視頻可控生成框架
ControlNeXt是什麼 ControlNeXt是一種新型的AI圖像和視頻可控生成框架,由香港中文大學和商湯科技聯合開發。採用輕量化控制模塊和創新的交叉歸一化技術,大幅...
VITA – 騰訊推出的開源多模態AI模型
VITA是什麼 VITA是騰訊優圖實驗室推出的全球首個開源多模態大語言模型(MLLM),能理解和處理視頻、圖像、文本和音頻。基於Mixtral 8×7B模型,擴展了中文詞彙...
Linly-Dubbing – 智能視頻多語言AI配音和翻譯工具
Linly-Dubbing是什麼 Linly-Dubbing是一個開源的智能視頻多語言AI配音和翻譯工具,能自動將視頻內容翻譯成多種語言,並生成字幕。通過WhisperX和FunASR進行精...
Cradle – 通用計算機控制的多模態AI Agent框架
Cradle是什麼 Cradle是面向通用計算機控制(General Computer Control, GCC)的多模態AI Agent框架,由崑崙萬維攜手北京智源人工智能研究院、新加坡南洋理工...
ORMBG – 開源的AI圖像分割工具
ORMBG是什麼 ORMBG是開源的AI圖像分割工具,由開發者schirrmacher在GitHub上發起。ORMBG專注於從圖片中準確去除背景,用先進的圖像處理技術,實現對圖像中前...