VideoPoet – 谷歌推出的AI視頻生成模型

VideoPoet是什麼 VideoPoet是由谷歌的研究團隊開發的一種基於大模型的AI視頻生成方案,支持從文本、圖像或視頻輸入中合成高質量的視頻內容,並生成匹配的音頻...

DiT – 基於Transfomer架構的擴散模型

DiT是什麼 DiT(Diffusion Transformers)是一種新型的擴散模型,由William Peebles(Sora的研發負責人之一) 與紐約大學助理教授謝賽寧提出,結合了去噪擴散...

Boximator – 字節推出的控制視頻生成中對象運動的框架

Boximator是什麼? Boximator是由字節跳動的研究團隊開發的一種視頻合成技術,旨在生成豐富且可控的運動,以增強視頻合成的質量和可控性。該技術通過引入兩種...

V-JEPA:Meta推出的視覺模型,可以通過觀看視頻來學習理解物理世界

V-JEPA是什麼? V-JEPA(Video Joint-Embedding Predictive Architecture,視頻聯合嵌入預測架構)是由Meta的研究人員推出的一種新型的視頻自監督學習方法,...

Depth Anything – Tiktok等推出的單目深度估計模型

Depth Anything是什麼? Depth Anything是由來自Tiktok、香港大學和浙江大學的研究人員推出的一個爲單目深度估計(Monocular Depth Estimation, MDE)設計的...

AnimateDiff – 擴展文生圖模型生成動畫的框架

AnimateDiff是什麼? AnimateDiff是由上海人工智能實驗室、香港中文大學和斯坦福大學的研究人員推出的一款將個性化的文本到圖像模型擴展爲動畫生成器的框架,...

MotionCtrl – 騰訊等推出的視頻生成模型的運動控制器

MotionCtrl是什麼 MotionCtrl是由來自騰訊、香港大學、上海AI實驗室、清華大學、廣東工業大學等機構的研究人員推出的一個爲視頻生成模型設計的統一且靈活的運...

MotionCtrl – 騰訊等推出的視頻生成模型的運動控制器

MotionCtrl是什麼 MotionCtrl是由來自騰訊、香港大學、上海AI實驗室、清華大學、廣東工業大學等機構的研究人員推出的一個爲視頻生成模型設計的統一且靈活的運...

Genmo – AI生成視頻、圖片和動畫的平台

Genmo是什麼 Genmo是一個專注於人工智能的創意平台,用戶可以在 Genmo 上創建視頻、動畫、圖像等。該平台提供了一系列的工具和服務,旨在幫助用戶通過AI技術...

Make-A-Character:阿里開源的AI 3D數字人生成框架

Make-A-Character是什麼? Make-A-Character(簡稱Mach)是一個由阿里巴巴集團智能計算研究院開發的一個人工智能3D數字人生成框架,旨在通過文本描述快速創建...
1 ... 59 60 61 62 63 ... 73