mPLUG-Owl3 – 阿里巴巴推出的通用多模態AI模型

mPLUG-Owl3是什麼 mPLUG-Owl3是阿里巴巴推出的通用多模態AI模型,專爲理解和處理多圖及長視頻設計。在保持準確性的同時,顯著提升了推理效率,能在4秒內分析...

TrackGo – 先進的可控AI視頻生成技術

TrackGo是什麼 TrackGo是一種先進的可控AI視頻生成技術,通過用自由形狀的遮罩和箭頭,爲用戶提供了一種靈活而精確的機制來控制視頻中對象的運動。技術的核心...

AskHackers – 面向開發者的AI搜索工具

AskHackers是什麼 AskHackers是一個面向開發者的AI搜索工具,專注於技術領域的問答。通過分析Hacker News的評論區,基於AI技術自動生成問題的答案,爲用戶提...

GPT Pilot – AI編程工具,讓95%的開發者實現自動寫代碼

GPT Pilot是什麼 GPT Pilot 是一款AI編程工具,通過模仿人類開發者的工作流程,幫助從零開始構建應用程序。能編寫代碼、調試程序、與用戶討論問題,並請求代...

eSearch – 開源的AI桌面應用,截屏、OCR、搜索、翻譯、錄屏

eSearch是什麼 eSearch是一款開源的跨平台AI桌面應用,集成了截屏、OCR識別、搜索翻譯、貼圖、以圖搜圖和屏幕錄製等功能。eSearch基於Electron框架開發,適用...

Bark – Suno AI 推出的開源文本到音頻模型

Bark是什麼 Bark是Suno AI 推出的開源文本到音頻模型,能生成逼真的多語言語音和多種音頻類型,包括音樂、背景噪音等,同時支持非語言交流如笑聲和哭泣。Bark...

MARS5-TTS – 開源的AI聲音克隆工具,支持140+語言

MARS5-TTS是什麼 MARS5-TTS是CAMB.AI推出開源的AI聲音克隆工具,有突破性逼真的韻律,支持140多種語言支持。還能處理複雜韻律場景,如體育解說和動漫AI配音等...

WatermarkRemover – 在線AI背景去除工具

WatermarkRemover是什麼 WatermarkRemover是在線AI背景去除工具,支持PNG、JPEG等多種圖片格式。WatermarkRemover通過智能識別技術,快速去除圖片背景,同時...

Imagine Yourself – Meta公司推出的個性化AI圖像生成模型

Imagine Yourself是什麼 Imagine Yourself 是Meta公司推出的個性化AI圖像生成模型,突破了傳統方法的侷限,無需對每個用戶進行單獨調整,通過單一模式即可滿...

MooER – 摩爾線程推出的業界首個音頻理解大模型

MooER是什麼 MooER是摩爾線程推出的業界首個基於國產全功能GPU訓練的開源音頻理解大模型。不僅能進行中文和英文的語音識別,還具備中譯英的語音翻譯能力。Moo...
1 ... 17 18 19 20 21 ... 77