MagicMan – 騰訊聯合多所高校推出2D圖像生成3D人類模型的AI項目

AI工具2年前 (2024)發佈新公告 AI管理員

0 0 0

MagicMan是什麼

MagicMan 是清華大學深圳國際研究生院、騰訊AI實驗室、香港科技大學、斯坦福大學和香港中文大學的研究團隊共同推出的AI項目，專注於基於深度學習技術從單張2D圖像生成高質量的3D人類模型。結合預訓練的2D擴散模型和參數化的SMPL-X模型，通過混合多視角注意力機制和迭代細化策略，實現精確的3D感知和圖像生成。在遊戲、電影、虛擬現實等多個領域具有廣泛的應用潛力。

MagicMan的主要功能

單圖像生成3D模型：從一張2D人物圖像生成高質量的3D人類模型。
多視角圖像合成：生成人物在不同視角下的圖像，提供全方位的視覺表現。
法線圖生成：同時生成與RGB圖像對應的法線圖，增強3D模型的質感和真實感。
3D感知能力：結合SMPL-X模型，MagicMan能理解和生成具有準確3D結構的人物模型。
混合多視角注意力機制：從不同角度生成的圖像在視覺上保持連貫和一致。

MagicMan的技術原理

預訓練的2D擴散模型：在大量圖像數據上進行預訓練，學習豐富的紋理和外觀特徵。
參數化的SMPL-X模型：SMPL-X是一個參數化的3D人體模型，能精確描述人體的幾何結構和姿態變化。
混合多視角注意力機制：結合1D和3D注意力機制，實現不同視角間信息的有效交換。確保從不同角度生成的圖像在視覺上保持連貫和一致。
幾何感知的雙分支生成：同時生成RGB圖像和法線圖像，利用幾何線索提升圖像的幾何一致性。MagicMan能生成在視覺上和幾何結構上高度逼真的3D圖像。

MagicMan的項目地址

項目官網：thuhcsi.github.io/MagicMan
GitHub倉庫：https://github.com/thuhcsi/MagicMan
arXiv技術論文：https://arxiv.org/pdf/2408.14211

MagicMan的應用場景

遊戲開發：在遊戲設計中，MagicMan快速生成逼真的遊戲角色和動態環境，提高角色設計的多樣性和真實感。
電影與動畫製作：電影行業用 MagicMan 從現有的2D圖像或真實演員的照片生成3D角色模型，用於動作捕捉或直接在動畫中使用，節省傳統建模的時間和成本。
虛擬現實（VR）與增強現實（AR）：在 VR 和 AR 應用中，MagicMan創建逼真的虛擬角色和環境，提升用戶的沉浸感和交互體驗。
時尚與零售：時尚行業用 MagicMan 技術創建虛擬試衣間，消費者上傳自己的圖像，預覽不同服裝在自己身上的效果，提供個性化的購物體驗。
教育與訓練模擬：在教育領域，MagicMan用於生成各種角色和場景，進行模擬訓練，如醫學模擬、歷史重現等，提高學習效果和訓練質量。

# AI工具