AI工具
Consensus – AI學術研究搜索引擎,超2億篇同行評審研究論文
Consensus是什麼 Consensus 是一個AI驅動的學術搜索引擎,基於大型語言模型(LLM)和向量搜索技術,幫助用戶快速檢索和理解科學文獻。平台提供超過2億篇同行...
Seed-VC – 零樣本實現聲音克隆和轉換的技術
Seed-VC是什麼 Seed-VC 是一種零樣本聲音轉換技術,基於上下文學習實現高質量的音頻輸出和音色相似度。用戶無需進行特定訓練,只需提供1到30秒的參考語音樣本...
Movie Gen – Meta推出文本驅動的AI視頻生成與編輯工具
Movie Gen是什麼 Movie Gen 是 Meta 推出的一種新型AI工具,能根據文本提示生成和編輯視頻,爲視頻配上同步音頻。技術包括創建長達16秒的高清視頻、爲現有視...
Phidias – 檢索增強的3D內容生成模型,支持多模態輸入
Phidias是什麼 Phidias是一個先進的3D內容生成模型,將檢索增強生成(RAG)的概念引入到3D建模領域。模型能基於用戶提供的或從大型數據庫中檢索到的3D參考模...
Steve AI – AI視頻生成的平台,支持多模態數據轉化爲多種視頻風格
Steve AI是什麼 Steve AI 是一個基於雲端的AI視頻生成平台,能將文本、博客、網頁或音頻內容快速轉化爲高質量的視頻和動畫。平台基於先進的AI技術,用戶即使...
JoyHallo – 京東推出音頻驅動視頻生成的數字人模型
JoyHallo是什麼 JoyHallo 是京東開源的數字人模型,專爲普通話設計,能根據音頻生成逼真的說話視頻。特別適合處理普通話的複雜口型和語調,具有跨語言生成視...
AMD-135M – AMD推出的首款小型語言模型
AMD-135M是什麼 AMD-135M是AMD推出的首款小型語言模型(SLM),爲特定用例提供性能與資源消耗之間的平衡。基於LLaMA2模型架構,在AMD Instinct MI250加速器上...
HouseCrafter – 東北大學和 Stability AI推出2D轉換3D室內場景的技術
HouseCrafter是什麼 HouseCrafter 是由東北大學和 Stability AI 推出的先進技術,將二維平面圖自動轉換成三維室內場景。基於一個網絡規模圖像訓練的2D擴散模...
I2VEdit – AI視頻編輯技術,基於擴散模型實現首幀編輯引導
I2VEdit是什麼 I2VEdit是一個先進的視頻編輯框架,通過圖像到視頻的擴散模型實現首幀引導的視頻編輯。用戶只需編輯視頻的第一幀,I2VEdit能自動將編輯效果應...
Oryx – 騰訊聯合清華和南洋理工大學推出的多模態大語言模型
Oryx是什麼 Oryx是由清華大學、騰訊和南洋理工大學聯合推出的多模態大型語言模型(MLLM),基於兩項核心創新來處理視覺數據,預訓練的OryxViT模型和動態壓縮...