星火公文寫作助手 – 科大訊飛推出的AI公文寫作工具

星火公文寫作助手是科大訊飛基於星火認知大模型推出的一款AI公文寫作工具,該助手提供寫作前的素材籌備、寫作中的稿件撰寫、寫作後的審覈校對,輔助公文寫作...

PixArt-Σ – 華爲推出的可生成4K高清圖像的文生圖模型

PixArt-Σ是什麼 PixArt-Σ是由來自華爲諾亞方舟實驗室、大連理工大學和香港大學的研究人員推出的一個基於擴散Transformer架構(DiT)的文生圖模型,專門設計用...

Moondream – 開源的輕量級AI視覺語言模型,可在本地快速運行

Moondream是什麼 Moondream是一個免費開源的小型的人工智能視覺語言模型,雖然參數量小(Moondream1僅16億,Moondream2爲18.6億)但可以提供高性能的視覺處理...

EMO – 阿里推出的AI肖像視頻生成框架

EMO是什麼 EMO(Emote Portrait Alive)是一個由阿里巴巴集團智能計算研究院的研究人員開發的框架,一個音頻驅動的AI肖像視頻生成系統,能夠通過輸入單一的參...

EMO – 阿里推出的AI肖像視頻生成框架

EMO是什麼 EMO(Emote Portrait Alive)是一個由阿里巴巴集團智能計算研究院的研究人員開發的框架,一個音頻驅動的AI肖像視頻生成系統,能夠通過輸入單一的參...

AtomoVideo – 阿里推出的高保真圖像到視頻生成框架

AtomoVideo是什麼 AtomoVideo是由阿里巴巴的研究團隊提出的一個高保真圖像到視頻(Image-to-Video, I2V)生成框架,旨在從輸入的靜態圖像生成高質量的視頻內...

ResAdapter – 字節推出的擴散模型分辨率適配器

ResAdapter是什麼 ResAdapter是由字節跳動的研究人員推出的一種爲擴散模型(如Stable Diffusion)設計的分辨率適配器,允許這些圖像生成模型生成具有任意分辨...

ScreenAI – 谷歌推出的可讀屏AI視覺模型,可理解UI和信息圖表

ScreenAI是什麼 ScreenAI是一個由谷歌的研究人員推出的可讀屏AI視覺語言模型,專門設計用於理解和處理用戶界面(UI)和信息圖表。該模型基於PaLI架構結合了視...

LayerDiffusion – AI生成具有透明度的圖像的框架

LayerDiffusion是什麼 LayerDiffusion(現已更名爲LayerDiffuse)是由來自斯坦福大學的研究人員 Lvmin Zhang(即ControlNet的作者張呂敏)和 Maneesh Agrawal...

LayerDiffusion – AI生成具有透明度的圖像的框架

LayerDiffusion是什麼 LayerDiffusion(現已更名爲LayerDiffuse)是由來自斯坦福大學的研究人員 Lvmin Zhang(即ControlNet的作者張呂敏)和 Maneesh Agrawal...
1 ... 56 57 58 59 60 ... 73