DemoFusion – 免費開源的圖像分辨率超清增強框架

AI工具2年前 (2024)發佈新公告 AI管理員

2 0 0

DemoFusion是什麼

DemoFusion是一個旨在低成本進行高分辨率圖像生成的技術框架，通過擴展現有的開源生成人工智能模型（如Stable Diffusion），使得這些模型能夠在不進行額外訓練和不產生過高內存需求的情況下，將模糊的低分辨率圖像變得更加高清（放大4倍、16倍甚至更高分辨率）。DemoFusion採用漸進式增強、跳躍殘差和擴張採樣機制來實現更高分辨率的圖像生成，對於資源有限的用戶來說，達成類似於Magnific AI的解決方案。

DemoFusion的官網入口

官方項目主頁：https://ruoyidu.github.io/demofusion/demofusion.html
Arxiv研究論文：https://arxiv.org/abs/2311.16973
GitHub代碼庫：https://github.com/PRIS-CV/DemoFusion
Hugging Face運行地址：
- Image to Image版本：https://huggingface.co/spaces/radames/Enhance-This-DemoFusion-SDXL
- Text to Image版本：https://huggingface.co/spaces/fffiloni/DemoFusion
Replicate運行地址：
- Image to Image版本：https://replicate.com/lucataco/demofusion-enhance
- Text to Image版本：https://replicate.com/lucataco/demofusion
Google Colab運行地址：https://colab.research.google.com/github/camenduru/DemoFusion-colab/blob/main/DemoFusion_colab.ipynb

DemoFusion – 免費開源的圖像分辨率超清增強框架

DemoFusion的功能特色

高分辨率圖像生成：DemoFusion能夠將預訓練的GenAI模型（如SDXL）的圖像生成能力擴展到更高的分辨率，例如從1024×1024像素提升到4096×4096像素或更高，而無需對模型進行額外的訓練。
漸進式上採樣：通過逐步增加圖像分辨率的方式，DemoFusion允許用戶在生成過程中逐步細化圖像細節，同時保持圖像的整體質量和語義一致性。
全局語義一致性：通過跳躍殘差和擴張採樣機制，DemoFusion能夠在生成高分辨率圖像時保持全局的語義一致性，避免局部區域的重複和結構扭曲。
快速迭代：由於漸進式上採樣的特性，DemoFusion允許用戶在生成過程中快速預覽低分辨率的結果，從而在等待高分辨率圖像生成完成之前，對圖像的佈局和風格進行快速迭代和調整。
無需額外硬件：DemoFusion能夠在消費級的硬件（如RTX 3090 GPU）上運行，這意味着用戶不需要昂貴的硬件投資就能生成高分辨率的圖像。
易於集成：DemoFusion作爲一個插件式的框架，可以輕鬆地與現有的AI生成模型集成，使得研究人員和開發者能夠快速地將高分辨率圖像生成能力應用到他們的項目中。
豐富的應用場景：DemoFusion不僅適用於藝術創作，還可以用於各種需要高分辨率圖像的領域，如遊戲開發、電影製作、虛擬現實等。

DemoFusion的工作原理

DemoFusion的工作原理基於幾個關鍵步驟和機制，這些步驟共同作用以生成高分辨率的圖像。以下是其主要的工作流程：

初始化（Initialization）：
- DemoFusion首先從一個低分辨率的圖像開始，這個圖像是通過一個預訓練的潛在擴散模型（如SDXL）生成的。
漸進式上採樣（Progressive Upscaling）：
- 從低分辨率圖像開始，DemoFusion通過迭代過程逐步增加圖像的分辨率。這個過程涉及到將當前分辨率的圖像上採樣到更高的分辨率，然後通過擴散過程引入噪聲，最後通過去噪過程恢復圖像。這個過程重複進行，每次都在更高的分辨率上進行，以逐漸增加圖像的細節。
跳躍殘差（Skip Residual）：
- 在去噪過程中，DemoFusion利用之前迭代步驟中的噪聲反轉表示作爲跳躍殘差。這有助於在生成過程中保持圖像的全局結構，同時允許局部細節的優化。
擴張採樣（Dilated Sampling）：
- 爲了增強每個去噪路徑的全局上下文，DemoFusion引入了擴張採樣。這意味着在潛在空間中，通過擴張採樣來獲取全局表示，然後這些全局表示被用於指導局部去噪路徑，以生成具有全局一致性的圖像內容。
局部和全局路徑融合（Fusing Local and Global Paths）：
- 在每個迭代步驟中，DemoFusion將局部去噪路徑（通過擴張採樣得到的局部潛在表示）和全局去噪路徑（通過跳躍殘差得到的全局潛在表示）結合起來，以生成最終的高分辨率圖像。
解碼（Decoding）：
- 最後，通過一個解碼器將最終的潛在表示轉換回圖像空間，得到高分辨率的輸出圖像。