AI工具
盤盤單詞 – 百度網盤推出的AI英語學習小程序
盤盤單詞是什麼 盤盤單詞是百度網盤推出的AI英語學習微信小程序。採用生成式AI技術,分析用戶百度網盤的照片,提取關鍵元素,自動生成與用戶生活緊密相關的英...
GPT-4o mini – OpenAI 推出全新 AI 模型替代GPT-3.5
GPT-4o mini是什麼 GPT-4o mini 是 OpenAI 最新推出的一款AI大模型,提供更高效、更具成本效益的解決方案。這款新模型替代 GPT-3.5,成爲市場上最具成本效益...
FunAudioLLM – 阿里巴巴通義團隊推出的開源語音大模型
FunAudioLLM是什麼 FunAudioLLM是阿里巴巴通義實驗室推出的開源語音大模型項目,包含SenseVoice和CosyVoice兩個模型。SenseVoice擅長多語言語音識別和情感辨...
EchoMimic – 阿里推出的開源數字人項目,賦予靜態圖像以生動語音和表情
EchoMimic是什麼 EchoMimic是阿里螞蟻集團推出的AI數字人開源項目,賦予靜態圖像以生動語音和表情。通過深度學習模型結合音頻和麪部標誌點,創造出高度逼真的...
Kimi瀏覽器插件 – 月之暗面推出的官方Kimi瀏覽器助手
Kimi瀏覽器插件是什麼 Kimi瀏覽器插件是月之暗面科技有限公司推出的一款官方工具,集成了即時問答、全文摘要和劃線互動等實用功能。用戶可以輕鬆劃線提問,獲...
Moshi – 法國AI實驗室Kyutai開發的實時音頻多模態模型
Moshi是什麼 Moshi是由法國的的人工智能研究實驗室Kyutai推出的一款端到端實時音頻多模態AI模型,擁有聽、說、看的能力,並能模擬70種不同的情緒和風格進行交...
Fish Speech – 開源的高效文本到語音合成TTS工具
Fish Speech是什麼 Fish Speech是一款由Fish Audio開發的開源的文本到語音(TTS)工具,支持中文、英文和日文。通過約15萬小時的多語種數據訓練,實現了接近...
FreeAskInternet – 免費開源的本地AI搜索引擎
FreeAskInternet是什麼 FreeAskInternet是一個免費開源的本地AI搜索引擎,整合了GPT-3.5等先進的大型語言模型(LLM)和SearXNG元搜索引擎,爲用戶提供搜索和...
MimicMotion – 騰訊推出的AI人像動態視頻生成框架
MimicMotion是什麼 MimicMotion是騰訊的研究人員推出的一個高質量的人類動作視頻生成框架,利用置信度感知的姿態引導技術,確保視頻幀的高質量和時間上的平滑...
FunClip – 阿里達摩院開源的AI自動視頻剪輯工具
FunClip是什麼 FunClip是阿里達摩院通義實驗室推出的一款完全開源、本地部署的自動化視頻剪輯工具,通過調用阿里巴巴通義實驗室的FunASR Paraformer系列模型...