DUSt3R – 從任意圖像集閤中重建3D場景的框架

DUSt3R是什麼 DUSt3R(Dense and Unconstrained Stereo 3D Reconstruction,密集無約束立體三維重建)是由來自芬蘭阿爾託大學和Naver歐洲實驗室的研究人員推...

UniEdit – 免訓練調優的統一視頻編輯框架

UniEdit是什麼 UniEdit是由浙江大學、微軟研究院和北京大學的研究人員推出的一個創新的視頻編輯框架,允許用戶在不需要進行模型微調的情況下,對視頻的運動和...

TextDiffuser-2 – 微軟等推出的AI圖像文本渲染融合框架

TextDiffuser-2是什麼 Text-Diffuser 2是由來自微軟研究院、香港科技大學和中山大學的研究人員最新推出的一個基於擴散模型的文本渲染方法,旨在解決圖像擴散...

Snap Video – Snapchat公司推出的AI視頻生成模型

Snap Video是什麼 Snap Video是由Snap(社交媒體Snapchat所屬的公司)研究團隊開發的一個AI視頻生成模型,目標是通過文本描述來合成視頻,即用戶可以輸入一段...

MeloTTS – MyShell AI推出的多語言文本到語音轉換工具

MeloTTS是什麼 MeloTTS 是一個由 MyShell AI 開發的開源的高質量多語言文本轉語音(TTS)庫,能夠將文本轉換成自然流暢的語音輸出,支持多種語言,包括但不限...

StarCoder 2 – BigCode推出的第二代開源代碼大模型

StarCoder 2是什麼 StarCoder 2是由BigCode項目(Hugging Face和ServiceNow支持)聯合Nvidia的團隊開發的新一代大型代碼語言模型,使用來自 The Stack v2 數...

StarCoder 2 – BigCode推出的第二代開源代碼大模型

StarCoder 2是什麼 StarCoder 2是由BigCode項目(Hugging Face和ServiceNow支持)聯合Nvidia的團隊開發的新一代大型代碼語言模型,使用來自 The Stack v2 數...

ChatMusician – 可理解和生成音樂的大模型

ChatMusician是什麼 ChatMusician是由Multimodal Art Projection Research Community、Skywork AI和香港科技大學的研究人員推出的,一個開源的用於理解和生成...

OpenCodeInterpreter – 開源的代碼解釋器,可生成和執行代碼

OpenCodeInterpreter是什麼 OpenCodeInterpreter是一個開源的代碼解釋器系統,旨在通過利用大模型結合代碼生成、執行和迭代精煉的能力,可以輔助開發者在軟件...

Mistral Large – Mistral AI發佈的一款先進的大語言模型

Mistral Large是什麼 Mistral Large是由法國人工智能公司Mistral AI開發的一款先進的大型語言模型(LLM),具備頂級的推理能力,能夠處理複雜的多語言推理任...
1 ... 57 58 59 60 61 ... 73