AI工具
CodeGemma – 谷歌開源推出的代碼生成大模型
CodeGemma是什麼 CodeGemma是由Google發佈的專注於代碼生成和理解的大型語言模型,該系列包含三種不同規模的模型,分別是2B預訓練模型、7B預訓練模型和7B指令...
DesignEdit – 微軟等開源的AI圖像分層處理編輯框架
DesignEdit是什麼 DesignEdit是由來自微軟亞洲研究院和北京大學的研究人員共同開發的一個AI圖像編輯框架,引入了設計領域的圖層概念,採用多層潛在分解和融合...
InstantStyle – 開源的個性化文本到圖像生成框架,保留風格一致性
InstantStyle是什麼 InstantStyle是小紅書的InstantX團隊(該團隊也是InstantID框架背後的開發團隊)開源的保留風格一致性的個性化文本到圖像生成框架,旨在...
InstantStyle – 開源的個性化文本到圖像生成框架,保留風格一致性
InstantStyle是什麼 InstantStyle是小紅書的InstantX團隊(該團隊也是InstantID框架背後的開發團隊)開源的保留風格一致性的個性化文本到圖像生成框架,旨在...
AniPortrait – 騰訊開源的照片對口型視頻生成框架
AniPortrait是什麼 AniPortrait是一個由騰訊開源的照片對口型視頻生成框架,類似於此前阿里推出的EMO,能夠通過音頻和一張參考肖像圖片生成高質量的動畫。Ani...
DreaMoving – 阿里開源的基於擴散模型的人類視頻生成框架
DreaMoving是什麼 DreaMoving是一個基於擴散模型的人類視頻生成框架,由阿里巴巴集團的研究團隊開發。DreaMoving通過視頻控制網絡和內容引導器實現對人物動作...
SWE-agent – 普林斯頓開源的AI程序員智能體
SWE-agent是什麼 SWE-agent是一個由普林斯頓大學NLP組研究人員開發的開源AI程序員和軟件工程師系統,利用大型語言模型(如GPT-4)的能力,可以自動解決GitHub...
Voice Engine – OpenAI公佈的AI語音合成和聲音克隆模型
Voice Engine是什麼 Voice Engine是OpenAI最新公佈的一項AI語音合成和聲音克隆技術,能夠利用簡短的15秒音頻樣本和文本輸入,生成接近原聲的自然聽起來的語音...
Voice Engine – OpenAI公佈的AI語音合成和聲音克隆模型
Voice Engine是什麼 Voice Engine是OpenAI最新公佈的一項AI語音合成和聲音克隆技術,能夠利用簡短的15秒音頻樣本和文本輸入,生成接近原聲的自然聽起來的語音...
Jamba – AI21開源的首個基於Mamba架構的大模型
Jamba是什麼 Jamba是由AI21 Labs推出的首個基於Mamba架構的生產級別的大語言模型,目前大部分的大模型(如GPT、Gemini 和 Llama)都是基於 Transformer 結構...