AI項目和框架

ChatLearn – 阿里雲PAI團隊開發的大規模Alignment訓練框架

ChatLearn是什麼 ChatLearn 是由阿里雲 PAI 團隊開發的一個靈活、易用、高效的大規模 Alignment 訓練框架。是爲了支持大型語言模型(LLMs)的 Alignment 訓練...

NanoFlow – 優化大語言模型推理吞吐量的服務框架

NanoFlow是什麼 NanoFlow 是一個高性能的服務框架,專爲大型語言模型(LLMs)設計,以提高模型的推理吞吐量。它通過在單個設備內部並行使用計算、內存和網絡...

LanceDB – 爲AI應用設計的無服務器向量數據庫,降低運維成本

LanceDB是什麼 LanceDB 是一款專爲人工智能應用設計的無服務器向量數據庫,支持向量搜索、全文搜索和SQL查詢,優化了多模態數據處理。它採用向量索引技術,實...

VideoGameBunny – 專爲視頻遊戲設計的開源多模態大模型

VideoGameBunny是什麼 VideoGameBunny(VGB)是一個專爲視頻遊戲設計的開源大型多模態模型,由加拿大阿爾伯塔大學研究團隊開發。它能理解和生成多種語言的遊...

GaussianEditor – 一種3D編輯算法,支持快速且精確地修改3D場景

GaussianEditor是什麼 GaussianEditor 是一種基於高斯飛濺(Gaussian Splatting)的3D編輯算法,支持用戶快速而精確地修改3D場景。通過高斯語義跟蹤和分層高...

ControlNeXt – AI圖像和視頻可控生成框架

ControlNeXt是什麼 ControlNeXt是一種新型的AI圖像和視頻可控生成框架,由香港中文大學和商湯科技聯合開發。採用輕量化控制模塊和創新的交叉歸一化技術,大幅...

VITA – 騰訊推出的開源多模態AI模型

VITA是什麼 VITA是騰訊優圖實驗室推出的全球首個開源多模態大語言模型(MLLM),能理解和處理視頻、圖像、文本和音頻。基於Mixtral 8×7B模型,擴展了中文詞彙...

Linly-Dubbing – 智能視頻多語言AI配音和翻譯工具

Linly-Dubbing是什麼 Linly-Dubbing是一個開源的智能視頻多語言AI配音和翻譯工具,能自動將視頻內容翻譯成多種語言,並生成字幕。通過WhisperX和FunASR進行精...

Cradle – 通用計算機控制的多模態AI Agent框架

Cradle是什麼 Cradle是面向通用計算機控制(General Computer Control, GCC)的多模態AI Agent框架,由崑崙萬維攜手北京智源人工智能研究院、新加坡南洋理工...

ORMBG – 開源的AI圖像分割工具

ORMBG是什麼 ORMBG是開源的AI圖像分割工具,由開發者schirrmacher在GitHub上發起。ORMBG專注於從圖片中準確去除背景,用先進的圖像處理技術,實現對圖像中前...
1 2 3 ... 5