AI工具

cogvlm2-llama3-caption – 智普AI開源的視頻標註模型,生成文本描述

cogvlm2-llama3-caption是什麼 cogvlm2-llama3-caption模型是一個基於CogVLM2架構的視頻描述生成模型。模型用於理解視頻內容,自動生成描述視頻內容的文本標...

Gummy – 通義推出的端到端語音翻譯大模型,能實時流式生成結果

Gummy是什麼 Gummy是通義實驗室在2024年雲棲大會上推出的端到端語音翻譯大模型。模型能實時流式生成語音識別與翻譯結果,支持包括中文、英語、粵語、日語、韓...

Ovis1.6 – 阿里國際AI團隊推出的多模態大模型,超過閉源GPT-4o-mini

Ovis1.6是什麼 Ovis1.6是阿里國際AI團隊推出的多模態大模型,在多模態權威綜合評測基準OpenCompass上取得了優異的成績,特別是在30億參數以下的模型中綜合得...

RapidPages – AI驅動的集成開放環境,實時生成UI組件和CSS代碼

RapidPages是什麼 RapidPages 是一個開源的集成開發環境(IDE),專注於基於AI技術快速生成 React 和 Tailwind CSS 的 UI 組件。基於自然語言處理,支持用戶...

CogVideoX-5B-I2V – 智譜 AI 開源的文本到視頻生成模型

CogVideoX-5B-I2V是什麼 CogVideoX-5B-I2V 是智譜 AI 開源的文本到視頻生成模型,基於 3D 因果變分自編碼器和專家自適應 LayerNorm 技術,根據文本提示生成高...

Draw an Audio – 中科院聯合美團推出的視頻生成音頻系統

Draw an Audio是什麼 Draw an Audio 是中國科學院自動化研究所和美團點評的研究人員推出的視頻生成音頻系統。根據視頻內容自動生成匹配的聲音效果,類似於電...

Void – 開源的AI輔助編碼工具,代碼自動補全和智能建議

Void是什麼 Void 是基於 Visual Studio Code 構建的開源文本編輯器,集成AI技術增強編程體驗。Void支持代碼自動補全、內聯編輯、AI 驅動的代碼搜索,直接與大...

Qwen2.5-Math – 阿里Qwen團隊開源的數學專項模型,超越GPT-4o

Qwen2.5-Math是什麼 Qwen2.5-Math是由阿里巴巴Qwen團隊推出的開源AI數學模型,是Qwen2-Math的升級版,支持中英雙語。模型通過大規模數學數據預訓練,結合CoT...

Qwen2.5 – 阿里通義千問團隊最新開源的最強AI大模型

Qwen2.5是什麼 Qwen2.5 是阿里通義千問團隊最新開源的最強AI大模型,具有多種參數規模的模型,包括 0.5B、1.5B、3B、7B、14B、32B 和 72B。模型在預訓練時使...

DressPlay – AI虛擬試衣應用,支持圖片和視頻換裝

DressPlay是什麼 DressPlay 是一款基於AI術的虛擬試衣應用,支持用戶通過上傳照片來試穿各種服裝。應用基於AI算法分析用戶的身材和姿勢,將服裝圖像自然地貼...
1 ... 25 26 27 28 29 ... 76