AI項目和框架

UniPortrait – 阿里推出的AI人像圖像個性化編輯工具

UniPortrait是什麼 UniPortrait是阿里巴巴推出的AI圖像個性化編輯工具,能將照片轉換爲動漫風格,支持多人合照和換臉技術。UniPortrait通過先進的”ID嵌入”和”...

MagicPose – AI視頻生成模型,能生成逼真的人體動作和麪部表情

MagicPose是什麼 MagicPose是南加州大學和字節跳動聯合研發的AI視頻生成模型,無需任何微調,直接生成逼真的人類動作和麪部表情視頻。MagicPose通過一個新穎...

Grok-2 – xAI公司推出的新一代AI模型

Grok-2是什麼 Grok-2是xAI公司推出的新一代AI模型,提供卓越的聊天、編程和推理能力。在學術基準測試中,Grok-2在GPQA、MMLU、MMLU-Pro和MATH等領域的表現超...

ASAM – vivo公司推出的AI圖像分割模型

ASAM是什麼 ASAM(Adversarial Adjustment of Segment Anything Model)是vivo公司推出的AI圖像分割模型,通過對抗性調整來增強原有SAM模型的性能。ASAM用自...

MDT-A2G – 復旦&騰訊優圖推出的AI模型,可根據語音同步生成手勢

MDT-A2G是什麼 MDT-A2G是復旦大學和騰訊優圖聯合推出的AI模型,專門用於根據語音內容同步生成相應的手勢動作。MDT-A2G模仿人類在交流時自然產生的手勢,計算...

MotionClone – 文本驅動的AI視頻動作克隆框架

MotionClone是什麼 MotionClone是文本驅動的AI視頻動作克隆框架,通過時間注意力機制從參考視頻中克隆動作,結合文本提示詞生成新視頻。能處理複雜的全局相機...

EXAONE 3.0 – LG 推出的開源 AI 模型,專爲英語和韓語設計

EXAONE 3.0是什麼 EXAONE 3.0是LG AI Research推出的開源AI模型,具有7.8億參數,專爲英語和韓語設計。EXAONE 3.0在英語和韓語的語言測試中均表現優異,在真...

ReSyncer – 清華聯合百度推出的AI視頻編輯工具

ReSyncer是什麼 ReSyncer是清華大學和百度聯合推出的AI視頻編輯工具,通過音頻驅動生成與聲音同步的高質量嘴脣動作視頻。ReSyncer用Style-SyncFormer分析聲音...

DressCode – 上海科技大學推出的3D服裝生成框架

DressCode是什麼 DressCode是上海科技大學、賓夕法尼亞大學和Deemos科技聯合推出的3D服裝生成框架。支持用戶通過文本描述來自動生成各種風格和材質的3D服裝模...

MiniCPM-V – 面壁智能推出的開源多模態大模型

MiniCPM-V是什麼 MiniCPM-V是面壁智能推出的開源多模態大模型,擁有80億參數,擅長圖像和視頻理解。MiniCPM-V在單圖像理解上超越了GPT-4V等模型,並首次支持...
1 2 3 4 5