AI工具
VLOGGER – 谷歌推出的圖像到合成人物動態視頻的模型
VLOGGER是什麼 VLOGGER AI是谷歌的研究團隊開發的一個多模態擴散模型,專門用於從單一輸入圖像和音頻樣本生成逼真的、連貫的人像動態視頻。該模型的主要功能...
Open-Sora – 開源的類Sora架構的視頻生成模型和復現方案
Open-Sora是什麼 Open-Sora是由Colossal-AI團隊開源的視頻生成模型,旨在復現OpenAI的Sora視頻生成產品。Open-Sora同樣基於DiT架構,通過三個階段訓練:大規...
Grok-1 – 馬斯克旗下xAI開源的大模型,參數量3140億
Grok-1是什麼 Grok-1 是由馬斯克旗下的人工智能初創公司 xAI 開發的一款大型語言模型,是一個混合專家(MoE)模型,擁有 3140 億參數,使其成爲目前參數量最...
AutoDev – 微軟推出的AI編程和程序開發智能體框架
AutoDev是什麼 AutoDev是由微軟的研究人員推出的一個AI編程和程序開發智能體框架,專門設計用於自主規劃和執行復雜的軟件工程任務,如代碼編寫、調試、測試和...
9個免費的AI論文寫作工具和生成器
隨着人工智能和大模型的迅猛發展,AI對研究人員和學生學者提供了極大的寫作便利。本文將介紹市面上常用的AI論文寫作工具,幫助你創作論文大綱、文獻綜述、潤...
Follow-Your-Click – 騰訊等開源的圖像到視頻模型,可生成局部動畫
Follow-Your-Click是什麼 Follow-Your-Click是一個由來自騰訊公司(混元團隊)聯合清華大學和香港科技大學的研究人員共同研發的圖像到視頻(Image-to-Video,...
ComflowySpace – 免費開源且簡單易用的ComfyUI整合工具
ComflowySpace是什麼 ComflowySpace是一款專爲簡化和增強AI圖像及視頻生成工具使用體驗而設計的開源軟件,基於ComfyUI和Stable Diffusion,旨在提供一個更加...
ComflowySpace – 免費開源且簡單易用的ComfyUI整合工具
ComflowySpace是什麼 ComflowySpace是一款專爲簡化和增強AI圖像及視頻生成工具使用體驗而設計的開源軟件,基於ComfyUI和Stable Diffusion,旨在提供一個更加...
Claude 3 – Anthropic推出的第三代大模型和AI聊天機器人
Claude 3是什麼 Claude 3是人工智能初創公司Anthropic開發的新一代人工智能模型,旨在提供先進的認知能力和智能處理任務。Claude 3模型家族包括三個不同級別...
Pix2Gif – 微軟推出的靜態圖像轉動態GIF的擴散模型
Pix2Gif是什麼 Pix2Gif是由微軟研究院的研究人員提出的一個基於運動引導的擴散模型,專門用於將靜態圖像轉換成動態的GIF動畫/視頻。該模型通過運動引導的擴散...