AI工具

ChatTTS – 開源的用於對話的生成式語音合成模型

ChatTTS是什麼 ChatTTS是一款專爲對話場景設計的支持中英文的文本轉語音(TTS)模型,基於約10萬小時的中英文數據進行訓練,能夠生成高質量、自然流暢的對話...

Codestral – Mistral AI推出的代碼生成模型,支持80+編程語言

Codestral是什麼 Codestral是法國人工智能初創公司Mistral AI推出的一款代碼生成AI模型,專爲提高軟件開發效率而設計,支持超過80種編程語言,包括但不限於Py...

Stable Assistant – Stability AI推出的AI聊天機器人

Stable Assistant是什麼 Stable Assistant是由Stability AI開發的一款聊天機器人,集成了最新的文本和圖像生成技術(Stable Diffusion 3和Stable LM 2 12B )...

CogVLM2 – 智譜AI推出的新一代多模態大模型

CogVLM2是什麼 CogVLM2是由智譜AI推出的新一代多模態大模型,在視覺和語言理解方面實現了顯著的性能提升,支持高達8K的文本長度和1344*1344分辨率的圖像輸入...

騰訊元器 – 騰訊推出的智能體創作開發平台

騰訊元器是什麼 騰訊元器是騰訊公司在騰訊雲生成式AI產業應用峯會上推出的一款基於其騰訊混元大模型的AI智能體創作與分發平台,可幫助用戶輕鬆創建和部署智能...

GPT-4o – OpenAI最新發布的多模態AI大模型

GPT-4o是什麼 GPT-4o是OpenAI最新推出的一款先進的人工智能模型,具備強大的多模態推理能力,能夠處理語音、文本和視覺信息。該模型能夠實時響應用戶輸入,並...

Veo – 谷歌推出的可生成1分鐘1080P的視頻模型

Veo是什麼 Veo是由Google DeepMind開發的一款視頻生成模型,用戶可以通過文本、圖像或視頻提示來指導其生成所需的視頻內容,能夠生成時長超過一分鐘1080P分辨...

混元DiT – 騰訊混元開源的文生圖擴散模型Hunyuan-DiT

混元DiT是什麼 混元DiT(Hunyuan-DiT)是由騰訊混元團隊開源的一款高性能的文本到圖像的擴散Transformer模型,具備細粒度的中英文理解能力,能夠根據文本提示...

GPT-4o – OpenAI最新發布的多模態AI大模型

GPT-4o是什麼 GPT-4o是OpenAI最新推出的一款先進的人工智能模型,具備強大的多模態推理能力,能夠處理語音、文本和視覺信息。該模型能夠實時響應用戶輸入,並...

AniTalker – 上海交大開源的對口型說話視頻生成框架

AniTalker是什麼 AniTalker是由來自上海交大X-LANCE實驗室和思必馳AISpeech的研究人員推出的一個對口型說話視頻生成框架,能夠將單張靜態人像和輸入的音頻轉...
1 ... 30 31 32 33 34 ... 49