AI工具

VLOGGER – 谷歌推出的圖像到合成人物動態視頻的模型

VLOGGER是什麼 VLOGGER AI是谷歌的研究團隊開發的一個多模態擴散模型,專門用於從單一輸入圖像和音頻樣本生成逼真的、連貫的人像動態視頻。該模型的主要功能...

Open-Sora – 開源的類Sora架構的視頻生成模型和復現方案

Open-Sora是什麼 Open-Sora是由Colossal-AI團隊開源的視頻生成模型,旨在復現OpenAI的Sora視頻生成產品。Open-Sora同樣基於DiT架構,通過三個階段訓練:大規...

Grok-1 – 馬斯克旗下xAI開源的大模型,參數量3140億

Grok-1是什麼 Grok-1 是由馬斯克旗下的人工智能初創公司 xAI 開發的一款大型語言模型,是一個混合專家(MoE)模型,擁有 3140 億參數,使其成爲目前參數量最...

AutoDev – 微軟推出的AI編程和程序開發智能體框架

AutoDev是什麼 AutoDev是由微軟的研究人員推出的一個AI編程和程序開發智能體框架,專門設計用於自主規劃和執行復雜的軟件工程任務,如代碼編寫、調試、測試和...

9個免費的AI論文寫作工具和生成器

隨着人工智能和大模型的迅猛發展,AI對研究人員和學生學者提供了極大的寫作便利。本文將介紹市面上常用的AI論文寫作工具,幫助你創作論文大綱、文獻綜述、潤...

Follow-Your-Click – 騰訊等開源的圖像到視頻模型,可生成局部動畫

Follow-Your-Click是什麼 Follow-Your-Click是一個由來自騰訊公司(混元團隊)聯合清華大學和香港科技大學的研究人員共同研發的圖像到視頻(Image-to-Video,...

ComflowySpace – 免費開源且簡單易用的ComfyUI整合工具

ComflowySpace是什麼 ComflowySpace是一款專爲簡化和增強AI圖像及視頻生成工具使用體驗而設計的開源軟件,基於ComfyUI和Stable Diffusion,旨在提供一個更加...

ComflowySpace – 免費開源且簡單易用的ComfyUI整合工具

ComflowySpace是什麼 ComflowySpace是一款專爲簡化和增強AI圖像及視頻生成工具使用體驗而設計的開源軟件,基於ComfyUI和Stable Diffusion,旨在提供一個更加...

Claude 3 – Anthropic推出的第三代大模型和AI聊天機器人

Claude 3是什麼 Claude 3是人工智能初創公司Anthropic開發的新一代人工智能模型,旨在提供先進的認知能力和智能處理任務。Claude 3模型家族包括三個不同級別...

Pix2Gif – 微軟推出的靜態圖像轉動態GIF的擴散模型

Pix2Gif是什麼 Pix2Gif是由微軟研究院的研究人員提出的一個基於運動引導的擴散模型,專門用於將靜態圖像轉換成動態的GIF動畫/視頻。該模型通過運動引導的擴散...
1 ... 91 92 93 94 95 ... 104