AI工具

盤盤單詞 – 百度網盤推出的AI英語學習小程序

盤盤單詞是什麼 盤盤單詞是百度網盤推出的AI英語學習微信小程序。採用生成式AI技術,分析用戶百度網盤的照片,提取關鍵元素,自動生成與用戶生活緊密相關的英...

GPT-4o mini – OpenAI 推出全新 AI 模型替代GPT-3.5

GPT-4o mini是什麼 GPT-4o mini 是 OpenAI 最新推出的一款AI大模型,提供更高效、更具成本效益的解決方案。這款新模型替代 GPT-3.5,成爲市場上最具成本效益...

FunAudioLLM – 阿里巴巴通義團隊推出的開源語音大模型

FunAudioLLM是什麼 FunAudioLLM是阿里巴巴通義實驗室推出的開源語音大模型項目,包含SenseVoice和CosyVoice兩個模型。SenseVoice擅長多語言語音識別和情感辨...

EchoMimic – 阿里推出的開源數字人項目,賦予靜態圖像以生動語音和表情

EchoMimic是什麼 EchoMimic是阿里螞蟻集團推出的AI數字人開源項目,賦予靜態圖像以生動語音和表情。通過深度學習模型結合音頻和麪部標誌點,創造出高度逼真的...

Kimi瀏覽器插件 – 月之暗面推出的官方Kimi瀏覽器助手

Kimi瀏覽器插件是什麼 Kimi瀏覽器插件是月之暗面科技有限公司推出的一款官方工具,集成了即時問答、全文摘要和劃線互動等實用功能。用戶可以輕鬆劃線提問,獲...

Moshi – 法國AI實驗室Kyutai開發的實時音頻多模態模型

Moshi是什麼 Moshi是由法國的的人工智能研究實驗室Kyutai推出的一款端到端實時音頻多模態AI模型,擁有聽、說、看的能力,並能模擬70種不同的情緒和風格進行交...

Fish Speech – 開源的高效文本到語音合成TTS工具

Fish Speech是什麼 Fish Speech是一款由Fish Audio開發的開源的文本到語音(TTS)工具,支持中文、英文和日文。通過約15萬小時的多語種數據訓練,實現了接近...

FreeAskInternet – 免費開源的本地AI搜索引擎

FreeAskInternet是什麼 FreeAskInternet是一個免費開源的本地AI搜索引擎,整合了GPT-3.5等先進的大型語言模型(LLM)和SearXNG元搜索引擎,爲用戶提供搜索和...

MimicMotion – 騰訊推出的AI人像動態視頻生成框架

MimicMotion是什麼 MimicMotion是騰訊的研究人員推出的一個高質量的人類動作視頻生成框架,利用置信度感知的姿態引導技術,確保視頻幀的高質量和時間上的平滑...

FunClip – 阿里達摩院開源的AI自動視頻剪輯工具

FunClip是什麼 FunClip是阿里達摩院通義實驗室推出的一款完全開源、本地部署的自動化視頻剪輯工具,通過調用阿里巴巴通義實驗室的FunASR Paraformer系列模型...
1 ... 27 28 29 30 31 ... 49