SleepFM – 斯坦福大學開源的多模態睡眠分析模型
SleepFM是什麼 SleepFM 是斯坦福大學開源的多模態睡眠分析模型,基於超過14,000名參與者的100,000小時睡眠數據,通過融合大腦活動、心電圖和呼吸信號,提供全...
mPLUG-DocOwl2 – 阿里推出多頁文檔理解的多模態大模型,單頁僅需324個token
mPLUG-DocOwl2是什麼 mPLUG-DocOwl 2是由阿里巴巴通義實驗室mPLUG團隊推出的用於多頁文檔理解的多模態大型語言模型。在不依賴光學字符識別(OCR)技術的情況...
GameGen-O – 騰訊推出的遊戲視頻生成模型,自動生成角色、場景、動作和事件
GameGen-O是什麼 GameGen-O 是騰訊推出的一款基於 Transformer 架構的遊戲視頻生成模型,專門用於生成開放世界視頻遊戲。模型能模擬遊戲引擎的多種功能,包括...
CSGO AI – 小紅書聯合南理工推出的AI文生圖項目
CSGO是什麼 CSGO(Content-Style Composition in Text-to-Image Generation)是南京理工大學、小紅書等機構合作推出的圖像風格遷移和文本到圖像生成的研究項...
雲界AI – 免費的在線AI創意繪畫工具
雲界AI是什麼 雲界AI是開源在線AI繪畫工具,集成文生圖、圖生圖、條件生圖和模型訓練等多種創意生圖功能。用戶通過簡單的文本描述或上傳圖片,快速生成具有創...
漢語新解 – 生成創意性文本的prompt,新時代的AI漢語老師
漢語新解是什麼 漢語新解是由李繼剛推出的一個用於啓發AI模型進行創意性文本生成的指令模板(prompt),對漢語詞彙進行獨特而深刻的重新詮釋,只需要通過提示...
小乖記賬 – AI智能記賬應用,語音輸入自動分類和整理財務數據
小乖記賬是什麼 小乖記賬是基於AI技術的智能記賬應用,通過語音識別技術簡化記賬流程,用戶通過語音輸入快速記錄財務信息。應用的自動分類功能智能分析交易性...
LongCite – 清華推出的開源模型,提升LLMs的精準引用減少幻覺
LongCite是什麼 LongCite是由清華大學推出的項目,旨在提升大型語言模型(LLMs)在長文本問答任務中的可信度和可驗證性。項目通過生成細粒度的句子級引用,使...
PyVideoTrans – 開源的視頻翻譯和配音工具,支持多種語言
PyVideoTrans是什麼 PyVideoTrans 是開源的視頻翻譯配音工具,將視頻內容從一種語言自動翻譯成另一種語言,並添加相應的字幕和配音。PyVideoTrans支持多語言...
LlamaCoder – 開發者的AI工具,快速創建全棧應用程序
LlamaCoder LlamaCoder 是一個開源的 AI 工具,使用 Llama 3.1 405B 模型快速生成全棧應用程序。旨在提供一種替代 Claude Artifacts 的解決方案。集成了 Sand...