AI項目和框架
Tora – 阿里推出的AI視頻生成框架
Tora是什麼 Tora是阿里推出的AI視頻生成框架,基於軌跡導向的擴散變換器(DiT)技術,將文本、視覺和軌跡條件融合,生成高質量且符合物理世界動態的視頻內容...
Stable Fast 3D – Stability AI推出的AI新模型,0.5秒將圖片轉爲3D
Stable Fast 3D是什麼 Stable Fast 3D(SF3D)是Stability AI推出的一種創新3D網格重建技術,能在0.5秒內從單張圖片生成高質量的3D模型。Stable Fast 3D採用...
FLUX.1 – Stable Diffusion創始團隊推出的開源AI圖像生成模型
FLUX.1是什麼 FLUX.1是由Stable Diffusion創始團隊推出的開源AI圖像生成模型,擁有12B參數,是迄今爲止最大的文生圖模型。包含三種變體:頂級性能的FLUX.1 [p...
Diffree – OpenGVLab推出的AI貼圖框架
Diffree是什麼 Diffree是由OpenGVLab推出的AI貼圖框架,能根據用戶的文字描述,在圖片中自動找到合適的位置添加新對象。通過智能掩碼預測,無需手動繪製,即...
Llama3.1 – Meta最新發布的最強開源AI模型
Llama3.1是什麼 Llama 3.1是Meta最新發布的開源AI模型,包括8B、70B和405B三個版本,其中405B版本以其4050億參數量成爲目前最大的開源模型之一。Llama 3.1支...
LivePortrait – 快手推出的開源人像動畫生成框架
LivePortrait是什麼 LivePortrait是快手推出的開源人像動畫生成框架,專注於高效、可控地將驅動視頻的表情和姿態遷移至靜態或動態人像,創造出富有表現力的視...
DCLM-7B – 蘋果公司與合作團隊推出的開源小模型
DCLM-7B 是什麼 DCLM-7B是由蘋果公司聯合研究團隊推出的70億參數開源小模型,性能超越Mistral-7B,接近Llama 3和Gemma。最近,蘋果公司作爲 DataComp-LM(DCL...
Mem0 – 一款開源的大語言模型記憶增強工具
Mem0 是什麼 Mem0 是一款開源的大語言模型記憶增強工具,能夠讓 AI 擁有長期、適應性強的記憶。通過自適應記憶系統,AI能實現跨應用記住用戶的偏好和交互,提...
Chameleon – Meta推出的圖文混合多模態開源模型
Chameleon是什麼 Chameleon 是 Meta(Facebook 的母公司)的人工智能研究團隊 FAIR(Facebook AI Research)發佈的一個能理解和生成任意序列的圖像和文本的混...
VideoPrism – 谷歌研究團隊推出的通用視頻編碼器
VideoPrism是什麼 VideoPrism是一個由谷歌研究團隊開發的通用視頻編碼器,旨在通過一個單一的預訓練模型來處理多種視頻理解任務。該模型能夠從視頻中提取豐富...