AI工具

MMMLU – OpenAI推出的多語言大規模多任務語言理解數據集

MMMLU是什麼 MMMLU(多語言大規模多任務語言理解)是OpenAI推出的一個開源數據集,爲評估和提升人工智能模型在不同語言、認知和文化背景下的性能而設計。MMML...

PortraitGen – 中科大推出的AI人像視頻編輯工具

PortraitGen是什麼 PortraitGen是中國科學技術大學研究團隊推出的一款AI人像視頻編輯工具。基於3D高斯濺射技術和神經高斯紋理機制,將2D人像視頻轉換爲4D高斯...

豆包PixelDance – 字節跳動推出的AI視頻生成大模型,基於DiT結構

豆包PixelDance是什麼 豆包PixelDance是字節跳動最新推出的AI視頻生成模型,採用DiT結構,支持文生視頻和圖生視頻。它能理解複雜指令,生成長達10秒的連貫視...

豆包Seaweed – 字節跳動推出的AI視頻生成模型,基於Transformer結構

豆包Seaweed是什麼 豆包Seaweed是字節跳動推出的AI視頻生成模型,支持文生視頻和圖生視頻兩種模式。基於Transformer結構,利用時空壓縮技術進行訓練,原生支...

GOT-OCR2.0 – 開源的端到端OCR模型,多語言多模態識別,多樣化輸入輸出

GOT-OCR2.0是什麼 GOT-OCR 2.0是一種先進的光學字符識別(OCR)模型,推動OCR技術進入2.0時代。GOT-OCR 2.0端到端的模型由高壓縮編碼器和長上下文解碼器組成...

onewebot2 – 微信AI機器人一鍵運行包,雙擊exe直接使用

onewebot2是什麼 oneWebot2是一款微信AI機器人一鍵運行軟件包,用戶下載exe文件後,雙擊即可啓動,無需複雜的Python環境配置。有圖形化界面,簡化配置流程,...

SFR-RAG – 專注於上下文理解和檢索增強生成的語言模型

SFR-RAG是什麼 SFR-RAG是由Salesforce AI Research推出的一款大型語言模型,專注於提升機器在理解和生成文本方面的應用能力。模型特別強調對上下文的忠實理解...

OpenMusic – 基於 QA-MDT 的開源高質量文生音樂模型

OpenMusic是什麼 OpenMusic 是一款基於 QA-MDT(Quality-aware Masked Diffusion Transformer)技術的高質量文生音樂模型。基於先進的AI算法,根據文本描述生...

ANTO – 開源的Windows桌面字幕翻譯工具

ANTO是什麼 ANTO是一款開源的Windows桌面字幕翻譯工具,用於翻譯SRT格式的視頻字幕文件。集成多種翻譯引擎,如谷歌翻譯、DeepL、微軟翻譯、百度翻譯和有道翻...

AiNiee – AI翻譯工具,遊戲愛好者和小說迷的翻譯神器

AiNiee是什麼 AiNiee 是一款AI翻譯工具,能一鍵自動翻譯RPG、SLG遊戲、Epub、TXT格式的小說、Srt、Lrc字幕文件等。工具支持多格式文件,接入多個主流AI接口平...
1 ... 72 73 74 75 76 ... 127