MagicMan – 騰訊聯合多所高校推出2D圖像生成3D人類模型的AI項目

AI工具3天前發佈新公告 AI管理員
0 0

MagicMan是什麼

MagicMan 是清華大學深圳國際研究生院、騰訊AI實驗室、香港科技大學、斯坦福大學和香港中文大學的研究團隊共同推出的AI項目,專注於基於深度學習技術從單張2D圖像生成高質量的3D人類模型。結合預訓練的2D擴散模型和參數化的SMPL-X模型,通過混合多視角注意力機制和迭代細化策略,實現精確的3D感知和圖像生成。在遊戲、電影、虛擬現實等多個領域具有廣泛的應用潛力。

MagicMan – 騰訊聯合多所高校推出2D圖像生成3D人類模型的AI項目

MagicMan的主要功能

  • 單圖像生成3D模型:從一張2D人物圖像生成高質量的3D人類模型。
  • 多視角圖像合成:生成人物在不同視角下的圖像,提供全方位的視覺表現。
  • 法線圖生成:同時生成與RGB圖像對應的法線圖,增強3D模型的質感和真實感。
  • 3D感知能力:結合SMPL-X模型,MagicMan能理解和生成具有準確3D結構的人物模型。
  • 混合多視角注意力機制:從不同角度生成的圖像在視覺上保持連貫和一致。

MagicMan的技術原理

  • 預訓練的2D擴散模型在大量圖像數據上進行預訓練,學習豐富的紋理和外觀特徵。
  • 參數化的SMPL-X模型SMPL-X是一個參數化的3D人體模型,能精確描述人體的幾何結構和姿態變化。
  • 混合多視角注意力機制結合1D和3D注意力機制,實現不同視角間信息的有效交換。確保從不同角度生成的圖像在視覺上保持連貫和一致。
  • 幾何感知的雙分支生成:同時生成RGB圖像和法線圖像,利用幾何線索提升圖像的幾何一致性。MagicMan能生成在視覺上和幾何結構上高度逼真的3D圖像。

MagicMan的項目地址

  • 項目官網:thuhcsi.github.io/MagicMan
  • GitHub倉庫:https://github.com/thuhcsi/MagicMan
  • arXiv技術論文:https://arxiv.org/pdf/2408.14211

MagicMan的應用場景

  • 遊戲開發:在遊戲設計中,MagicMan快速生成逼真的遊戲角色和動態環境,提高角色設計的多樣性和真實感。
  • 電影與動畫製作:電影行業用 MagicMan 從現有的2D圖像或真實演員的照片生成3D角色模型,用於動作捕捉或直接在動畫中使用,節省傳統建模的時間和成本。
  • 虛擬現實(VR)與增強現實(AR):在 VR 和 AR 應用中,MagicMan創建逼真的虛擬角色和環境,提升用戶的沉浸感和交互體驗。
  • 時尚與零售:時尚行業用 MagicMan 技術創建虛擬試衣間,消費者上傳自己的圖像,預覽不同服裝在自己身上的效果,提供個性化的購物體驗。
  • 教育與訓練模擬:在教育領域,MagicMan用於生成各種角色和場景,進行模擬訓練,如醫學模擬、歷史重現等,提高學習效果和訓練質量。
© 版權聲明

相關文章

暫無評論

暫無評論...