MagicPose – AI視頻生成模型,能生成逼真的人體動作和麪部表情

AI項目和框架1個月前發佈新公告 AI管理員
0 0

MagicPose是什麼

MagicPose是南加州大學和字節跳動聯合研發的AI視頻生成模型,無需任何微調,直接生成逼真的人類動作和麪部表情視頻。MagicPose通過一個新穎的兩階段訓練策略,分離人體動作和外觀特徵,實現了在不同身份間進行動作和表情的精確轉移。MagicPose的另一大優勢是它的易用性,可以作爲Stable Diffusion等文本到圖像模型的插件使用,且在多種複雜場景下展現出良好的泛化能力。

MagicPose – AI視頻生成模型,能生成逼真的人體動作和麪部表情

MagicPose的功能特色

  • 逼真視頻生成:能生成具有生動運動和麪部表情的逼真人類視頻。
  • 無需微調:MagicPose可直接在野外數據上生成一致性高的視頻,無需針對特定數據進行微調。
  • 外觀一致性:在生成視頻時能夠保持人物的外觀特徵,如面部特徵、膚色和着裝風格等。
  • 動作和表情轉移:可以將一個人物的動作和表情轉移到另一個人物上,同時保持目標人物的身份信息。

MagicPose的技術原理

  • 基於擴散的模型:MagicPose採用了一種基於擴散的模型,模型能處理2D人體動作和麪部表情的轉移。
  • 兩階段訓練策略:包括兩個階段,第一階段是預訓練外觀控制塊,第二階段是精細調整外觀-姿勢-聯合控制塊。
  • 外觀控制模型:MagicPose使用外觀控制模型來分離人體動作和外觀特徵,如面部表情、膚色和着裝。
  • 多源自注意模塊:外觀控制預訓練階段,訓練外觀控制模型及其多源自注意模塊,在不同姿態下保持一致的外觀。
  • 外觀解糾纏姿態控制:在第二階段,聯合微調外觀控制模型和姿態控制網,實現外觀和動作的精確控制。
  • 凍結訓練模塊:在訓練過程中,一旦某些模塊訓練完成,就會凍結這些模塊的權重,保持穩定性。
  • AnimateDiff初始化:使用AnimateDiff初始化運動模塊,進行微調,生成逼真的人體動作。
  • 泛化能力:MagicPose在訓練後能夠泛化到未見過的人類身份和複雜的運動序列上,無需額外的微調。

MagicPose – AI視頻生成模型,能生成逼真的人體動作和麪部表情

MagicPose的項目地址

  • GitHub倉庫:https://github.com/Boese0601/MagicDance
  • arXiv技術論文:https://arxiv.org/pdf/2311.12052

MagicPose的應用場景

  • 虛擬角色製作:MagicPose可以用來生成逼真的虛擬角色動作和表情,提高製作效率並降低成本。
  • 動畫製作:動畫師可以用MagicPose快速生成動畫角色的動作和表情,加速動畫創作過程。
  • 社交媒體內容創作:社交媒體用戶可以用MagicPose生成個性化的動態表情或動作,用於社交媒體分享。
  • 虛擬現實和增強現實:在VR和AR應用中,MagicPose可以爲虛擬角色提供逼真的動作和表情,增強用戶體驗。
  • 教育和培訓:MagicPose可用於模擬人物動作,如醫學教育中的人體解剖演示或體育訓練中的標準動作展示。
© 版權聲明

相關文章

暫無評論

暫無評論...