TextDiffuser-2 – 微軟等推出的AI圖像文本渲染融合框架
TextDiffuser-2是什麼 Text-Diffuser 2是由來自微軟研究院、香港科技大學和中山大學的研究人員最新推出的一個基於擴散模型的文本渲染方法,旨在解決圖像擴散...
Snap Video – Snapchat公司推出的AI視頻生成模型
Snap Video是什麼 Snap Video是由Snap(社交媒體Snapchat所屬的公司)研究團隊開發的一個AI視頻生成模型,目標是通過文本描述來合成視頻,即用戶可以輸入一段...
MeloTTS – MyShell AI推出的多語言文本到語音轉換工具
MeloTTS是什麼 MeloTTS 是一個由 MyShell AI 開發的開源的高質量多語言文本轉語音(TTS)庫,能夠將文本轉換成自然流暢的語音輸出,支持多種語言,包括但不限...
StarCoder 2 – BigCode推出的第二代開源代碼大模型
StarCoder 2是什麼 StarCoder 2是由BigCode項目(Hugging Face和ServiceNow支持)聯合Nvidia的團隊開發的新一代大型代碼語言模型,使用來自 The Stack v2 數...
StarCoder 2 – BigCode推出的第二代開源代碼大模型
StarCoder 2是什麼 StarCoder 2是由BigCode項目(Hugging Face和ServiceNow支持)聯合Nvidia的團隊開發的新一代大型代碼語言模型,使用來自 The Stack v2 數...
ChatMusician – 可理解和生成音樂的大模型
ChatMusician是什麼 ChatMusician是由Multimodal Art Projection Research Community、Skywork AI和香港科技大學的研究人員推出的,一個開源的用於理解和生成...
OpenCodeInterpreter – 開源的代碼解釋器,可生成和執行代碼
OpenCodeInterpreter是什麼 OpenCodeInterpreter是一個開源的代碼解釋器系統,旨在通過利用大模型結合代碼生成、執行和迭代精煉的能力,可以輔助開發者在軟件...
Mistral Large – Mistral AI發佈的一款先進的大語言模型
Mistral Large是什麼 Mistral Large是由法國人工智能公司Mistral AI開發的一款先進的大型語言模型(LLM),具備頂級的推理能力,能夠處理複雜的多語言推理任...
GPT-SoVITS – 開源的聲音克隆項目,只需少量數據即可合成聲音
GPT-SoVITS是什麼 GPT-SoVITS是一個開源的聲音克隆項目,由B站UP主、RVC變聲器創始人花兒不哭推出,該語音合成工具結合了GPT(Generative Pre-trained Transf...
GPT-SoVITS – 開源的聲音克隆項目,只需少量數據即可合成聲音
GPT-SoVITS是什麼 GPT-SoVITS是一個開源的聲音克隆項目,由B站UP主、RVC變聲器創始人花兒不哭推出,該語音合成工具結合了GPT(Generative Pre-trained Transf...