AI工具

Lingo – 西湖心辰推出的端到端語音大模型,媲美GPT-4o

Lingo是什麼 Lingo 是西湖心辰推出的國內首個端到端語音大模型,在技術上具備實時打斷、實時指令控制、超級擬人、能說會唱等能力,擁有比 GPT-4o 更出色的中...

Sapiens – Meta推出的AI視覺模型,能理解圖片和視頻中的人類動作

Sapiens是什麼 Sapiens是Meta實驗室推出的AI視覺模型,專爲理解圖片和視頻中的人類動作設計。支持二維姿勢預估、身體部位分割、深度估計和表面法線預測等任務...

mPLUG-Owl3 – 阿里巴巴推出的通用多模態AI模型

mPLUG-Owl3是什麼 mPLUG-Owl3是阿里巴巴推出的通用多模態AI模型,專爲理解和處理多圖及長視頻設計。在保持準確性的同時,顯著提升了推理效率,能在4秒內分析...

TrackGo – 先進的可控AI視頻生成技術

TrackGo是什麼 TrackGo是一種先進的可控AI視頻生成技術,通過用自由形狀的遮罩和箭頭,爲用戶提供了一種靈活而精確的機制來控制視頻中對象的運動。技術的核心...

AskHackers – 面向開發者的AI搜索工具

AskHackers是什麼 AskHackers是一個面向開發者的AI搜索工具,專注於技術領域的問答。通過分析Hacker News的評論區,基於AI技術自動生成問題的答案,爲用戶提...

GPT Pilot – AI編程工具,讓95%的開發者實現自動寫代碼

GPT Pilot是什麼 GPT Pilot 是一款AI編程工具,通過模仿人類開發者的工作流程,幫助從零開始構建應用程序。能編寫代碼、調試程序、與用戶討論問題,並請求代...

eSearch – 開源的AI桌面應用,截屏、OCR、搜索、翻譯、錄屏

eSearch是什麼 eSearch是一款開源的跨平台AI桌面應用,集成了截屏、OCR識別、搜索翻譯、貼圖、以圖搜圖和屏幕錄製等功能。eSearch基於Electron框架開發,適用...

Bark – Suno AI 推出的開源文本到音頻模型

Bark是什麼 Bark是Suno AI 推出的開源文本到音頻模型,能生成逼真的多語言語音和多種音頻類型,包括音樂、背景噪音等,同時支持非語言交流如笑聲和哭泣。Bark...

MARS5-TTS – 開源的AI聲音克隆工具,支持140+語言

MARS5-TTS是什麼 MARS5-TTS是CAMB.AI推出開源的AI聲音克隆工具,有突破性逼真的韻律,支持140多種語言支持。還能處理複雜韻律場景,如體育解說和動漫AI配音等...

WatermarkRemover – 在線AI背景去除工具

WatermarkRemover是什麼 WatermarkRemover是在線AI背景去除工具,支持PNG、JPEG等多種圖片格式。WatermarkRemover通過智能識別技術,快速去除圖片背景,同時...
1 ... 16 17 18 19 20 ... 49