AI工具
eSearch – 開源的AI桌面應用,截屏、OCR、搜索、翻譯、錄屏
eSearch是什麼 eSearch是一款開源的跨平台AI桌面應用,集成了截屏、OCR識別、搜索翻譯、貼圖、以圖搜圖和屏幕錄製等功能。eSearch基於Electron框架開發,適用...
Bark – Suno AI 推出的開源文本到音頻模型
Bark是什麼 Bark是Suno AI 推出的開源文本到音頻模型,能生成逼真的多語言語音和多種音頻類型,包括音樂、背景噪音等,同時支持非語言交流如笑聲和哭泣。Bark...
MARS5-TTS – 開源的AI聲音克隆工具,支持140+語言
MARS5-TTS是什麼 MARS5-TTS是CAMB.AI推出開源的AI聲音克隆工具,有突破性逼真的韻律,支持140多種語言支持。還能處理複雜韻律場景,如體育解說和動漫AI配音等...
WatermarkRemover – 在線AI背景去除工具
WatermarkRemover是什麼 WatermarkRemover是在線AI背景去除工具,支持PNG、JPEG等多種圖片格式。WatermarkRemover通過智能識別技術,快速去除圖片背景,同時...
Imagine Yourself – Meta公司推出的個性化AI圖像生成模型
Imagine Yourself是什麼 Imagine Yourself 是Meta公司推出的個性化AI圖像生成模型,突破了傳統方法的侷限,無需對每個用戶進行單獨調整,通過單一模式即可滿...
MooER – 摩爾線程推出的業界首個音頻理解大模型
MooER是什麼 MooER是摩爾線程推出的業界首個基於國產全功能GPU訓練的開源音頻理解大模型。不僅能進行中文和英文的語音識別,還具備中譯英的語音翻譯能力。Moo...
StockBot – 基於Llama3的AI金融Agent,提升股票投資效率
StockBot 是什麼 StockBot 是一個基於Llama3的AI金融Agent,提供實時股票信息、財務數據、新聞和互動圖表。支持多資產市場,包括股票、外匯、債券和加密貨幣...
HeadGAP – 字節跳動推出的3D頭像生成模型
HeadGAP是什麼 HeadGAP是字節跳動和上海科技大學共同推出的3D頭像生成模型,僅用少量圖片快速生成逼真的3D頭像。採用先驗學習和個性化創建階段的框架,基於大...
LMMs-Eval – 專爲多模態AI模型設計的統一評估框架
LMMs-Eval是什麼 LMMs-Eval 是一個專爲多模態AI模型設計的統一評估框架,提供標準化、廣泛覆蓋且成本效益高的模型性能評估解決方案。包含超過50個任務和10多...
AutoShorts – 開源的AI視頻創作和自動發佈平台
AutoShorts是什麼 AutoShorts是開源的AI視頻創作和發佈平台,使用AI技術一鍵生成並定製無臉視頻。AutoShorts支持自定義腳本、配音和視覺效果,每天自動發佈新...