AI工具

SUPIR – 高保真的AI圖像修復和畫質增強模型

SUPIR是什麼 SUPIR(Scaling-UP Image Restoration)是一個突破性的圖像修復和畫質增強方法,利用了大規模的生成模型StableDiffusion-XL(SDXL)和模型擴展技...

BrushNet – 騰訊推出的高質量圖像照片修復模型

BrushNet是什麼 BrushNet是由騰訊PCG部門的ARC實驗室與香港大學的研究人員推出的一個基於擴散模型的即插即用的圖像照片修復(Inpainting)模型,通過分解的雙...

LATTE3D – 英偉達推出的快速生成3D對象的文本模型

什麼是LATTE3D LATTE3D是英偉達的多倫多人工智慧實驗室研究團隊推出的一個模型,可根據文本描述快速生成高品質的3D內容(僅需400毫秒)。該技術的核心在於運...

LATTE3D – 英偉達推出的文本快速生成3D對象的模型

LATTE3D是什麼 LATTE3D是由英偉達的多倫多AI實驗室的研究人員推出的一個文本生成3D對象的模型,能夠從文本提示描述快速生成高質量的3D內容(僅需400毫秒)。...

Mora – 微軟等推出的可生成12秒視頻的多AI智能體框架

Mora是什麼 Mora是由來自微軟和理海大學的研究人員推出的一個多智能體(AI Agents)框架,專門用於通用視頻生成任務,目標是模擬並擴展OpenAI的Sora視頻生成...

StreamMultiDiffusion – 實時生成和編輯圖像的交互式框架

StreamMultiDiffusion是什麼 StreamMultiDiffusion是一個開源的實時交互式的圖像生成框架,結合了擴散模型的高質量圖像合成能力和區域控制的靈活性,可根據用...

AnimateDiff-Lightning – 字節推出的快速生成高質量視頻的模型

AnimateDiff-Lightning是什麼 AnimateDiff-Lightning是由字節跳動的研究人員最新推出的一個高質量視頻生成模型,利用了漸進式對抗性擴散蒸餾技術來實現快速的...

Stable Video 3D (SV3D) – 多視角合成和3D生成模型,由Stability AI推出

Stable Video 3D是什麼 Stable Video 3D(簡稱SV3D)是由Stability AI公司開發的一個多視角合成和3D生成模型,能夠從單張圖片生成一致的多視角圖像,並進一步...

VLOGGER – 谷歌推出的圖像到合成人物動態視頻的模型

VLOGGER是什麼 VLOGGER AI是谷歌的研究團隊開發的一個多模態擴散模型,專門用於從單一輸入圖像和音頻樣本生成逼真的、連貫的人像動態視頻。該模型的主要功能...

Open-Sora – 開源的類Sora架構的視頻生成模型和復現方案

Open-Sora是什麼 Open-Sora是由Colossal-AI團隊開源的視頻生成模型,旨在復現OpenAI的Sora視頻生成產品。Open-Sora同樣基於DiT架構,通過三個階段訓練:大規...
1 ... 35 36 37 38 39 ... 49