MARS5-TTS – 開源的AI聲音克隆工具,支持140+語言

MARS5-TTS是什麼 MARS5-TTS是CAMB.AI推出開源的AI聲音克隆工具,有突破性逼真的韻律,支持140多種語言支持。還能處理複雜韻律場景,如體育解說和動漫AI配音等...

WatermarkRemover – 在線AI背景去除工具

WatermarkRemover是什麼 WatermarkRemover是在線AI背景去除工具,支持PNG、JPEG等多種圖片格式。WatermarkRemover通過智能識別技術,快速去除圖片背景,同時...

Imagine Yourself – Meta公司推出的個性化AI圖像生成模型

Imagine Yourself是什麼 Imagine Yourself 是Meta公司推出的個性化AI圖像生成模型,突破了傳統方法的侷限,無需對每個用戶進行單獨調整,通過單一模式即可滿...

MooER – 摩爾線程推出的業界首個音頻理解大模型

MooER是什麼 MooER是摩爾線程推出的業界首個基於國產全功能GPU訓練的開源音頻理解大模型。不僅能進行中文和英文的語音識別,還具備中譯英的語音翻譯能力。Moo...

StockBot – 基於Llama3的AI金融Agent,提升股票投資效率

StockBot 是什麼 StockBot 是一個基於Llama3的AI金融Agent,提供實時股票信息、財務數據、新聞和互動圖表。支持多資產市場,包括股票、外匯、債券和加密貨幣...

HeadGAP – 字節跳動推出的3D頭像生成模型

HeadGAP是什麼 HeadGAP是字節跳動和上海科技大學共同推出的3D頭像生成模型,僅用少量圖片快速生成逼真的3D頭像。採用先驗學習和個性化創建階段的框架,基於大...

LMMs-Eval – 專爲多模態AI模型設計的統一評估框架

LMMs-Eval是什麼 LMMs-Eval 是一個專爲多模態AI模型設計的統一評估框架,提供標準化、廣泛覆蓋且成本效益高的模型性能評估解決方案。包含超過50個任務和10多...

AutoShorts – 開源的AI視頻創作和自動發佈平台

AutoShorts是什麼 AutoShorts是開源的AI視頻創作和發佈平台,使用AI技術一鍵生成並定製無臉視頻。AutoShorts支持自定義腳本、配音和視覺效果,每天自動發佈新...

RAGFlow – 基於OCR和文檔解析的下一代 RAG 引擎

RAGFlow是什麼 RAGFlow 是開源的 RAG(Retrieval-Augmented Generation)引擎,擁有深入理解文檔並增強生成能力,是基於OCR和文檔解析的下一代 RAG 引擎。RAG...

ComfyUI-Bxb – SD變現寶,一鍵把 ComfyUI 工作流轉換成小程序

ComfyUI-Bxb是什麼 ComfyUI-Bxb是“SD變現寶”,一鍵把 ComfyUI 工作流轉換成小程序,專爲小程序開發者設計,實現快速變現。ComfyUI-Bxb的核心功能是將ComfyUI...
1 ... 58 59 60 61 62 ... 118