MagicPose – AI視頻生成模型，能生成逼真的人體動作和麪部表情

AI項目和框架11個月前發佈新公告 AI管理員

34 0 0

MagicPose是什麼

MagicPose是南加州大學和字節跳動聯合研發的AI視頻生成模型，無需任何微調，直接生成逼真的人類動作和麪部表情視頻。MagicPose通過一個新穎的兩階段訓練策略，分離人體動作和外觀特徵，實現了在不同身份間進行動作和表情的精確轉移。MagicPose的另一大優勢是它的易用性，可以作爲Stable Diffusion等文本到圖像模型的插件使用，且在多種複雜場景下展現出良好的泛化能力。

MagicPose – AI視頻生成模型，能生成逼真的人體動作和麪部表情

MagicPose的功能特色

逼真視頻生成：能生成具有生動運動和麪部表情的逼真人類視頻。
無需微調：MagicPose可直接在野外數據上生成一致性高的視頻，無需針對特定數據進行微調。
外觀一致性：在生成視頻時能夠保持人物的外觀特徵，如面部特徵、膚色和着裝風格等。
動作和表情轉移：可以將一個人物的動作和表情轉移到另一個人物上，同時保持目標人物的身份信息。

MagicPose的技術原理

基於擴散的模型：MagicPose採用了一種基於擴散的模型，模型能處理2D人體動作和麪部表情的轉移。
兩階段訓練策略：包括兩個階段，第一階段是預訓練外觀控制塊，第二階段是精細調整外觀-姿勢-聯合控制塊。
外觀控制模型：MagicPose使用外觀控制模型來分離人體動作和外觀特徵，如面部表情、膚色和着裝。
多源自注意模塊：外觀控制預訓練階段，訓練外觀控制模型及其多源自注意模塊，在不同姿態下保持一致的外觀。
外觀解糾纏姿態控制：在第二階段，聯合微調外觀控制模型和姿態控制網，實現外觀和動作的精確控制。
凍結訓練模塊：在訓練過程中，一旦某些模塊訓練完成，就會凍結這些模塊的權重，保持穩定性。
AnimateDiff初始化：使用AnimateDiff初始化運動模塊，進行微調，生成逼真的人體動作。
泛化能力：MagicPose在訓練後能夠泛化到未見過的人類身份和複雜的運動序列上，無需額外的微調。

MagicPose – AI視頻生成模型，能生成逼真的人體動作和麪部表情

MagicPose的項目地址

GitHub倉庫：https://github.com/Boese0601/MagicDance
arXiv技術論文：https://arxiv.org/pdf/2311.12052

MagicPose的應用場景

虛擬角色製作：MagicPose可以用來生成逼真的虛擬角色動作和表情，提高製作效率並降低成本。
動畫製作：動畫師可以用MagicPose快速生成動畫角色的動作和表情，加速動畫創作過程。
社交媒體內容創作：社交媒體用戶可以用MagicPose生成個性化的動態表情或動作，用於社交媒體分享。
虛擬現實和增強現實：在VR和AR應用中，MagicPose可以爲虛擬角色提供逼真的動作和表情，增強用戶體驗。
教育和培訓：MagicPose可用於模擬人物動作，如醫學教育中的人體解剖演示或體育訓練中的標準動作展示。

# AI項目和框架

© 版權聲明

文章版权归作者所有，未经允许请勿转载。

相關文章

SEED-Story – 騰訊推出的多模態故事生成模型

earnbyshare2016

2 0

UniBench – Meta推出的視覺語言模型(VLM)評估框架

earnbyshare2016

3 0

NanoFlow – 優化大語言模型推理吞吐量的服務框架

earnbyshare2016

4 0

Qwen2-Audio – 阿里通義千問團隊推出的開源AI語音模型

earnbyshare2016

8 0

MDT-A2G – 復旦&騰訊優圖推出的AI模型，可根據語音同步生成手勢

earnbyshare2016

6 0

FlashFace – 阿里聯合香港大學推出的高保真AI寫真工具

earnbyshare2016

3 0

暫無評論

暫無評論...