Boximator – 字節推出的控制視頻生成中對象運動的框架

Boximator是什麼? Boximator是由字節跳動的研究團隊開發的一種視頻合成技術,旨在生成豐富且可控的運動,以增強視頻合成的質量和可控性。該技術通過引入兩種...

V-JEPA:Meta推出的視覺模型,可以通過觀看視頻來學習理解物理世界

V-JEPA是什麼? V-JEPA(Video Joint-Embedding Predictive Architecture,視頻聯合嵌入預測架構)是由Meta的研究人員推出的一種新型的視頻自監督學習方法,...

Depth Anything – Tiktok等推出的單目深度估計模型

Depth Anything是什麼? Depth Anything是由來自Tiktok、香港大學和浙江大學的研究人員推出的一個爲單目深度估計(Monocular Depth Estimation, MDE)設計的...

AnimateDiff – 擴展文生圖模型生成動畫的框架

AnimateDiff是什麼? AnimateDiff是由上海人工智能實驗室、香港中文大學和斯坦福大學的研究人員推出的一款將個性化的文本到圖像模型擴展爲動畫生成器的框架,...

MotionCtrl – 騰訊等推出的視頻生成模型的運動控制器

MotionCtrl是什麼 MotionCtrl是由來自騰訊、香港大學、上海AI實驗室、清華大學、廣東工業大學等機構的研究人員推出的一個爲視頻生成模型設計的統一且靈活的運...

MotionCtrl – 騰訊等推出的視頻生成模型的運動控制器

MotionCtrl是什麼 MotionCtrl是由來自騰訊、香港大學、上海AI實驗室、清華大學、廣東工業大學等機構的研究人員推出的一個爲視頻生成模型設計的統一且靈活的運...

Genmo – AI生成視頻、圖片和動畫的平台

Genmo是什麼 Genmo是一個專注於人工智能的創意平台,用戶可以在 Genmo 上創建視頻、動畫、圖像等。該平台提供了一系列的工具和服務,旨在幫助用戶通過AI技術...

Make-A-Character:阿里開源的AI 3D數字人生成框架

Make-A-Character是什麼? Make-A-Character(簡稱Mach)是一個由阿里巴巴集團智能計算研究院開發的一個人工智能3D數字人生成框架,旨在通過文本描述快速創建...

MetaGPT – 多個AI智能體協作分工的框架

MetaGPT是什麼? MetaGPT是一個創新的元編程框架,結合了大語言模型和多智能體協作系統,旨在通過模擬人類工作流程來解決複雜問題。該框架的核心在於將標準化...

DiffusionGPT – 開源的大模型驅動的文本到圖像生成系統

DiffusionGPT是什麼? DiffusionGPT是由來自字節跳動與中山大學的研究人員推出的一個開源的大模型(LLM)驅動的文本到圖像生成系統,旨在解決文生圖領域無法...
1 ... 90 91 92 93 94 ... 104