AI項目和框架
HumanVid – 專爲人類圖像動畫生成而設計的高質量數據集
HumanVid是什麼 HumanVid是香港中文大學和上海人工智能實驗室共同推出的高質量數據集,專爲人類圖像動畫訓練設計。結合了現實世界視頻和合成數據,通過精心設...
UniPortrait – 阿里推出的AI人像圖像個性化編輯工具
UniPortrait是什麼 UniPortrait是阿里巴巴推出的AI圖像個性化編輯工具,能將照片轉換爲動漫風格,支持多人合照和換臉技術。UniPortrait通過先進的”ID嵌入”和”...
UniTalker – 商湯推出的音頻驅動3D面部動畫生成模型
UniTalker是什麼 UniTalker是推出的音頻驅動3D面部動畫生成模型,能根據輸入的音頻生成逼真的面部動作。採用統一的多頭架構模型,用帶有不同標註的數據集,支...
MagicPose – AI視頻生成模型,能生成逼真的人體動作和麪部表情
MagicPose是什麼 MagicPose是南加州大學和字節跳動聯合研發的AI視頻生成模型,無需任何微調,直接生成逼真的人類動作和麪部表情視頻。MagicPose通過一個新穎...
Grok-2 – xAI公司推出的新一代AI模型
Grok-2是什麼 Grok-2是xAI公司推出的新一代AI模型,提供卓越的聊天、編程和推理能力。在學術基準測試中,Grok-2在GPQA、MMLU、MMLU-Pro和MATH等領域的表現超...
ASAM – vivo公司推出的AI圖像分割模型
ASAM是什麼 ASAM(Adversarial Adjustment of Segment Anything Model)是vivo公司推出的AI圖像分割模型,通過對抗性調整來增強原有SAM模型的性能。ASAM用自...
MDT-A2G – 復旦&騰訊優圖推出的AI模型,可根據語音同步生成手勢
MDT-A2G是什麼 MDT-A2G是復旦大學和騰訊優圖聯合推出的AI模型,專門用於根據語音內容同步生成相應的手勢動作。MDT-A2G模仿人類在交流時自然產生的手勢,計算...
MotionClone – 文本驅動的AI視頻動作克隆框架
MotionClone是什麼 MotionClone是文本驅動的AI視頻動作克隆框架,通過時間注意力機制從參考視頻中克隆動作,結合文本提示詞生成新視頻。能處理複雜的全局相機...
EXAONE 3.0 – LG 推出的開源 AI 模型,專爲英語和韓語設計
EXAONE 3.0是什麼 EXAONE 3.0是LG AI Research推出的開源AI模型,具有7.8億參數,專爲英語和韓語設計。EXAONE 3.0在英語和韓語的語言測試中均表現優異,在真...
ReSyncer – 清華聯合百度推出的AI視頻編輯工具
ReSyncer是什麼 ReSyncer是清華大學和百度聯合推出的AI視頻編輯工具,通過音頻驅動生成與聲音同步的高質量嘴脣動作視頻。ReSyncer用Style-SyncFormer分析聲音...