ASAM – vivo公司推出的AI圖像分割模型

ASAM是什麼 ASAM(Adversarial Adjustment of Segment Anything Model)是vivo公司推出的AI圖像分割模型,通過對抗性調整來增強原有SAM模型的性能。ASAM用自...

MDT-A2G – 復旦&騰訊優圖推出的AI模型,可根據語音同步生成手勢

MDT-A2G是什麼 MDT-A2G是復旦大學和騰訊優圖聯合推出的AI模型,專門用於根據語音內容同步生成相應的手勢動作。MDT-A2G模仿人類在交流時自然產生的手勢,計算...

MotionClone – 文本驅動的AI視頻動作克隆框架

MotionClone是什麼 MotionClone是文本驅動的AI視頻動作克隆框架,通過時間注意力機制從參考視頻中克隆動作,結合文本提示詞生成新視頻。能處理複雜的全局相機...

EXAONE 3.0 – LG 推出的開源 AI 模型,專爲英語和韓語設計

EXAONE 3.0是什麼 EXAONE 3.0是LG AI Research推出的開源AI模型,具有7.8億參數,專爲英語和韓語設計。EXAONE 3.0在英語和韓語的語言測試中均表現優異,在真...

ReSyncer – 清華聯合百度推出的AI視頻編輯工具

ReSyncer是什麼 ReSyncer是清華大學和百度聯合推出的AI視頻編輯工具,通過音頻驅動生成與聲音同步的高質量嘴脣動作視頻。ReSyncer用Style-SyncFormer分析聲音...

DressCode – 上海科技大學推出的3D服裝生成框架

DressCode是什麼 DressCode是上海科技大學、賓夕法尼亞大學和Deemos科技聯合推出的3D服裝生成框架。支持用戶通過文本描述來自動生成各種風格和材質的3D服裝模...

MiniCPM-V – 面壁智能推出的開源多模態大模型

MiniCPM-V是什麼 MiniCPM-V是面壁智能推出的開源多模態大模型,擁有80億參數,擅長圖像和視頻理解。MiniCPM-V在單圖像理解上超越了GPT-4V等模型,並首次支持...

Sync Labs – AI視頻配音工具,支持實時對口型

Sync Labs是什麼 Sync Labs是一款AI視頻配音工具,使用 AI 技術實現了實時口型同步,支持用戶將任何語言的音頻與視頻中的人物進行同步。Sync Labs支持多種語...

UniBench – Meta推出的視覺語言模型(VLM)評估框架

UniBench是什麼 UniBench是Meta FAIR機構推出的視覺語言模型(VLM)評估框架,對視覺語言模型(VLM)進行全面評估。UniBench包含50多個基準測試,涵蓋物體識別、...

CharacterFactory – 大連理工推出的AI角色創作工具

CharacterFactory是什麼 CharacterFactory是大連理工大學IIAU團隊推出的AI角色創作工具,通過擴散模型在無需參考圖片的情況下,僅需2.5GB顯存和10分鐘訓練,...
1 ... 69 70 71 72 73 ... 121