AI工具

Gemma 2 – 谷歌DeepMind推出的新一代開源人工智能模型

Gemma 2是什麼 Gemma 2是谷歌DeepMind推出的新一代開源人工智能模型,包含90億和270億參數版本。該模型以卓越的性能、高效的推理速度和廣泛的硬件兼容性爲特...

CriticGPT – OpenAI推出的識別GPT輸出代碼錯誤的模型

CriticGPT是什麼 CriticGPT是OpenAI發佈的一個新型人工智能模型,基於GPT-4構建,專門用於審查和識別大型語言模型(如ChatGPT)生成的代碼中的錯誤。CriticGP...

字節跳動發佈“豆包MarsCode”智能開發工具,面向國內開發者免費

6月26日,字節跳動在北京發佈了基於豆包大模型打造的智能開發工具 – 豆包MarsCode ,面向國內開發者免費開放。本場發佈會以“用 AI 激發創造”爲主題,在草地露...

MOFA-Video – 騰訊開源的可控性AI圖生視頻模型

MOFA-Video是什麼 MOFA-Video是由騰訊AI實驗室和東京大學的研究人員開源的一個可控性的圖像生成視頻的模型,該技術利用生成運動場適應器對圖像進行動畫處理以...

Toucan TTS – 免費開源的文本轉語音工具,支持超7000種語言

Toucan TTS是什麼 Toucan TTS是由德國斯圖加特大學自然語言處理研究所(IMS)開發的文本到語音合成工具箱,支持超過7000種語言,包括多種方言和變體。Toucan ...

ExVideo – 阿里和華東師大推出的AI視頻長度擴展調優技術

ExVideo是什麼 ExVideo是由阿里巴巴和華東師大的研究人員推出的一種視頻合成模型的後調優技術,能夠擴展現有視頻合成模型的時間尺度,以生成更長和幀數更多的...

Diffutoon – 阿里推出的AI將視頻轉卡通風格的框架

Diffutoon是什麼 Diffutoon是由阿里巴巴和華東師大的研究人員推出的一個將視頻轉換爲卡通動漫風格的AI框架,基於擴散模型的可編輯卡通着色技術,能夠將真實感...

琴樂大模型 – 騰訊推出的AI音樂創作大模型

琴樂大模型是什麼 琴樂大模型是由騰訊AI Lab與騰訊TME天琴實驗室共同研發的人工智能音樂創作大模型,該模型通過輸入中英文關鍵詞、描述性語句或音頻,能夠直...

Unique3D – 清華大學團隊開源的圖像到3D生成模型

Unique3D是什麼 Unique3D是由清華大學團隊開源的一個單張圖像到3D模型轉換的框架,通過結合多視圖擴散模型和法線擴散模型,以及一種高效的多級上採樣策略,能...

谷歌DeepMind推出V2A技術,可爲無聲視頻添加逼真音效

在人工智能領域,谷歌旗下的DeepMind公司再次取得突破性進展,推出了一款名爲V2A(Video-to-Audio,視頻到音頻)的AI模型。該項技術能夠將視頻像素與文本提示...
1 ... 28 29 30 31 32 ... 49