AI工具

AnyText – 阿里開源的視覺圖像文字生成和編輯模型

AnyText是什麼 AnyText是阿里巴巴智能計算研究院的團隊推出的一個基於擴散的多語言視覺文本生成和編輯模型,專注於在圖像中渲染準確和連貫的文本。AnyText包...

VideoCrafter2 – 騰訊推出的高質量視頻生成模型

VideoCrafter2 是什麼? VideoCrafter2是一個由騰訊AI實驗室開發的視頻生成模型,旨在克服高質量視頻數據獲取的侷限性,訓練出能夠生成高質量視頻的模型。該...

Screenshot to Code – AI將截圖轉換爲網頁代碼的開源項目

Screenshot to Code是什麼 Sscreenshot to Code是一個開源的項目,利用人工智能技術(GPT-4V 和 DALL-E 3)將用戶的屏幕截圖轉換爲前端網頁代碼,已在GitHub...

DDColor – 阿里推出的AI圖像上色框架,將黑白圖片變彩色

DDColor是什麼 DDColor是阿里達摩院的研究人員推出的一個開源的AI圖像着色框架,可以一鍵將黑白圖片上色變爲全綵圖像。該方法通過使用雙解碼器架構(像素解碼...

Real-ESRGAN:騰訊推出的開源圖像分辨率提升模型

Real-ESRGAN是什麼 Real-ESRGAN(Real-World Blind Super-Resolution with Pure Synthetic Data)是由騰訊的ARC實驗室推出的一個開源深度學習模型,專門用於...

DemoFusion – 免費開源的圖像分辨率超清增強框架

DemoFusion是什麼 DemoFusion是一個旨在低成本進行高分辨率圖像生成的技術框架,通過擴展現有的開源生成人工智能模型(如Stable Diffusion),使得這些模型能...

DemoFusion – 免費開源的圖像分辨率超清增強框架

DemoFusion是什麼 DemoFusion是一個旨在低成本進行高分辨率圖像生成的技術框架,通過擴展現有的開源生成人工智能模型(如Stable Diffusion),使得這些模型能...

ActAnywhere – Adobe推出的AI視頻背景生成模型

ActAnywhere是什麼 ActAnywhere是一個由斯坦福大學和Adobe Research的研究人員共同開發的視頻生成模型,旨在解決視頻背景生成的問題,特別是在需要將前景主體...

Vary-toy:開源的小型視覺多模態模型

Vary-toy是什麼 Vary-toy是一個小型的視覺語言模型(LVLM),由來自曠視、國科大、華中大的研究人員共同提出,旨在解決大型視覺語言模型(LVLMs)在訓練和部...

Lepton Search – 開源的對話式AI搜索引擎項目

Lepton Search是什麼 Lepton Search是由原阿里巴巴技術副總裁和AI科學家賈揚清創辦的Lepton AI應用構建平台開源的一個對話式AI搜素引擎,該項目基於調用Lepto...
1 ... 41 42 43 44 45 ... 47