EchoMimic – 阿里推出的開源數字人項目,賦予靜態圖像以生動語音和表情
EchoMimic是什麼 EchoMimic是阿里螞蟻集團推出的AI數字人開源項目,賦予靜態圖像以生動語音和表情。通過深度學習模型結合音頻和麪部標誌點,創造出高度逼真的...
Kimi瀏覽器插件 – 月之暗面推出的官方Kimi瀏覽器助手
Kimi瀏覽器插件是什麼 Kimi瀏覽器插件是月之暗面科技有限公司推出的一款官方工具,集成了即時問答、全文摘要和劃線互動等實用功能。用戶可以輕鬆劃線提問,獲...
Moshi – 法國AI實驗室Kyutai開發的實時音頻多模態模型
Moshi是什麼 Moshi是由法國的的人工智能研究實驗室Kyutai推出的一款端到端實時音頻多模態AI模型,擁有聽、說、看的能力,並能模擬70種不同的情緒和風格進行交...
Fish Speech – 開源的高效文本到語音合成TTS工具
Fish Speech是什麼 Fish Speech是一款由Fish Audio開發的開源的文本到語音(TTS)工具,支持中文、英文和日文。通過約15萬小時的多語種數據訓練,實現了接近...
Phaidra獲1200萬美元新一輪融資,利用AI管理數據中心能源消耗
2024年7月2日,總部位於美國西雅圖的利用AI管理數據中心能源消耗的初創公司Phaidra宣佈籌集了1200萬美元的新一輪融資,本輪融資由Index Ventures領投,此前的...
開放AI開發平台Sentient獲8500萬美元種子輪融資
2024年7月2日,總部位於美國舊金山的人工智能研究與開發初創公司Sentient宣佈籌集了8500萬美元的種子輪融資。本輪融資由彼得·蒂爾的Founders Fund、Pantera C...
FreeAskInternet – 免費開源的本地AI搜索引擎
FreeAskInternet是什麼 FreeAskInternet是一個免費開源的本地AI搜索引擎,整合了GPT-3.5等先進的大型語言模型(LLM)和SearXNG元搜索引擎,爲用戶提供搜索和...
MimicMotion – 騰訊推出的AI人像動態視頻生成框架
MimicMotion是什麼 MimicMotion是騰訊的研究人員推出的一個高質量的人類動作視頻生成框架,利用置信度感知的姿態引導技術,確保視頻幀的高質量和時間上的平滑...
FunClip – 阿里達摩院開源的AI自動視頻剪輯工具
FunClip是什麼 FunClip是阿里達摩院通義實驗室推出的一款完全開源、本地部署的自動化視頻剪輯工具,通過調用阿里巴巴通義實驗室的FunASR Paraformer系列模型...
AI教育平台MagicSchool AI獲1500萬美元A輪融資
2024年6月27日,總部位於美國丹佛的AI教育技術平台MagicSchool AI宣佈籌集了1500萬美元的A輪融資。本輪融資由Bain Capital Ventures領投,其他投資者包括Adob...