AI項目和框架

FLUX.1 – Stable Diffusion創始團隊推出的開源AI圖像生成模型

FLUX.1是什麼 FLUX.1是由Stable Diffusion創始團隊推出的開源AI圖像生成模型,擁有12B參數,是迄今爲止最大的文生圖模型。包含三種變體:頂級性能的FLUX.1 [p...

Diffree – OpenGVLab推出的AI貼圖框架

Diffree是什麼 Diffree是由OpenGVLab推出的AI貼圖框架,能根據用戶的文字描述,在圖片中自動找到合適的位置添加新對象。通過智能掩碼預測,無需手動繪製,即...

Llama3.1 – Meta最新發布的最強開源AI模型

Llama3.1是什麼 Llama 3.1是Meta最新發布的開源AI模型,包括8B、70B和405B三個版本,其中405B版本以其4050億參數量成爲目前最大的開源模型之一。Llama 3.1支...

LivePortrait – 快手推出的開源人像動畫生成框架

LivePortrait是什麼 LivePortrait是快手推出的開源人像動畫生成框架,專注於高效、可控地將驅動視頻的表情和姿態遷移至靜態或動態人像,創造出富有表現力的視...

DCLM-7B – 蘋果公司與合作團隊推出的開源小模型

DCLM-7B 是什麼 DCLM-7B是由蘋果公司聯合研究團隊推出的70億參數開源小模型,性能超越Mistral-7B,接近Llama 3和Gemma。最近,蘋果公司作爲 DataComp-LM(DCL...

Mem0 – 一款開源的大語言模型記憶增強工具

Mem0 是什麼 Mem0 是一款開源的大語言模型記憶增強工具,能夠讓 AI 擁有長期、適應性強的記憶。通過自適應記憶系統,AI能實現跨應用記住用戶的偏好和交互,提...

Chameleon – Meta推出的圖文混合多模態開源模型

Chameleon是什麼 Chameleon 是 Meta(Facebook 的母公司)的人工智能研究團隊 FAIR(Facebook AI Research)發佈的一個能理解和生成任意序列的圖像和文本的混...

VideoPrism – 谷歌研究團隊推出的通用視頻編碼器

VideoPrism是什麼 VideoPrism是一個由谷歌研究團隊開發的通用視頻編碼器,旨在通過一個單一的預訓練模型來處理多種視頻理解任務。該模型能夠從視頻中提取豐富...

VideoPrism – 谷歌研究團隊推出的通用視頻編碼器

VideoPrism是什麼 VideoPrism是一個由谷歌研究團隊開發的通用視頻編碼器,旨在通過一個單一的預訓練模型來處理多種視頻理解任務。該模型能夠從視頻中提取豐富...
1 ... 3 4 5