AI工具

FunAudioLLM – 阿里巴巴通義團隊推出的開源語音大模型

FunAudioLLM是什麼 FunAudioLLM是阿里巴巴通義實驗室推出的開源語音大模型項目,包含SenseVoice和CosyVoice兩個模型。SenseVoice擅長多語言語音識別和情感辨...

EchoMimic – 阿里推出的開源數字人項目,賦予靜態圖像以生動語音和表情

EchoMimic是什麼 EchoMimic是阿里螞蟻集團推出的AI數字人開源項目,賦予靜態圖像以生動語音和表情。通過深度學習模型結合音頻和麪部標誌點,創造出高度逼真的...

Kimi瀏覽器插件 – 月之暗面推出的官方Kimi瀏覽器助手

Kimi瀏覽器插件是什麼 Kimi瀏覽器插件是月之暗面科技有限公司推出的一款官方工具,集成了即時問答、全文摘要和劃線互動等實用功能。用戶可以輕鬆劃線提問,獲...

Moshi – 法國AI實驗室Kyutai開發的實時音頻多模態模型

Moshi是什麼 Moshi是由法國的的人工智能研究實驗室Kyutai推出的一款端到端實時音頻多模態AI模型,擁有聽、說、看的能力,並能模擬70種不同的情緒和風格進行交...

Fish Speech – 開源的高效文本到語音合成TTS工具

Fish Speech是什麼 Fish Speech是一款由Fish Audio開發的開源的文本到語音(TTS)工具,支持中文、英文和日文。通過約15萬小時的多語種數據訓練,實現了接近...

FreeAskInternet – 免費開源的本地AI搜索引擎

FreeAskInternet是什麼 FreeAskInternet是一個免費開源的本地AI搜索引擎,整合了GPT-3.5等先進的大型語言模型(LLM)和SearXNG元搜索引擎,爲用戶提供搜索和...

MimicMotion – 騰訊推出的AI人像動態視頻生成框架

MimicMotion是什麼 MimicMotion是騰訊的研究人員推出的一個高質量的人類動作視頻生成框架,利用置信度感知的姿態引導技術,確保視頻幀的高質量和時間上的平滑...

FunClip – 阿里達摩院開源的AI自動視頻剪輯工具

FunClip是什麼 FunClip是阿里達摩院通義實驗室推出的一款完全開源、本地部署的自動化視頻剪輯工具,通過調用阿里巴巴通義實驗室的FunASR Paraformer系列模型...

Gemma 2 – 谷歌DeepMind推出的新一代開源人工智能模型

Gemma 2是什麼 Gemma 2是谷歌DeepMind推出的新一代開源人工智能模型,包含90億和270億參數版本。該模型以卓越的性能、高效的推理速度和廣泛的硬件兼容性爲特...

CriticGPT – OpenAI推出的識別GPT輸出代碼錯誤的模型

CriticGPT是什麼 CriticGPT是OpenAI發佈的一個新型人工智能模型,基於GPT-4構建,專門用於審查和識別大型語言模型(如ChatGPT)生成的代碼中的錯誤。CriticGP...
1 ... 105 106 107 108 109 ... 127