VoiceCraft – 開源的語音編輯和文本轉語音模型
VoiceCraft是什麼 VoiceCraft是一個由德克薩斯大學奧斯汀分校研究團隊開源的神經編解碼器語言模型,專注於零樣本語音編輯和文本到語音(TTS)任務。該模型採...
VoiceCraft – 開源的語音編輯和文本轉語音模型
VoiceCraft是什麼 VoiceCraft是一個由德克薩斯大學奧斯汀分校研究團隊開源的神經編解碼器語言模型,專注於零樣本語音編輯和文本到語音(TTS)任務。該模型採...
StreamingT2V – PicsArt推出的可生成長達2分鐘視頻的模型
StreamingT2V是什麼 StreamingT2V是由PicsArt AI研究團隊推出的一個文本到視頻的生成模型,旨在解決現有模型僅能生成16幀或24幀的高質量短視頻,而當在生成長...
StreamingT2V – PicsArt推出的可生成長達2分鐘視頻的模型
StreamingT2V是什麼 StreamingT2V是由PicsArt AI研究團隊推出的一個文本到視頻的生成模型,旨在解決現有模型僅能生成16幀或24幀的高質量短視頻,而當在生成長...
SUPIR – 高保真的AI圖像修復和畫質增強模型
SUPIR是什麼 SUPIR(Scaling-UP Image Restoration)是一個突破性的圖像修復和畫質增強方法,利用了大規模的生成模型StableDiffusion-XL(SDXL)和模型擴展技...
BrushNet – 騰訊推出的高質量圖像照片修復模型
BrushNet是什麼 BrushNet是由騰訊PCG部門的ARC實驗室與香港大學的研究人員推出的一個基於擴散模型的即插即用的圖像照片修復(Inpainting)模型,通過分解的雙...
AI個人財務跟蹤應用Copilot Money獲600萬美元A輪融資
2024年3月22日,總部位於美國紐約的個人財務跟蹤應用初創公司 Copilot Money 獲 600 萬美元的 A 輪融資,由 Adjacent 領投。 該公司計劃將籌集的資金用於將 C...
LATTE3D – 英偉達推出的文本快速生成3D對象的模型
LATTE3D是什麼 LATTE3D是由英偉達的多倫多AI實驗室的研究人員推出的一個文本生成3D對象的模型,能夠從文本提示描述快速生成高質量的3D內容(僅需400毫秒)。...
LATTE3D – 英偉達推出的快速生成3D對象的文本模型
什麼是LATTE3D LATTE3D是英偉達的多倫多人工智慧實驗室研究團隊推出的一個模型,可根據文本描述快速生成高品質的3D內容(僅需400毫秒)。該技術的核心在於運...
AI/ML工作負載雲平台Foundry獲8000萬美元種子輪和A輪融資
3 月 22 日,總部位於加利福尼亞州帕洛阿爾託的 AI/ML 工作負載公共雲提供商 Foundry 宣佈在種子輪和 A 輪融資中共籌集了 8000 萬美元。本輪融資由紅杉資本和...