Star Office UI – 開源 AI 可視化看板,Agent實時工作狀態

Star Office UI是什麼 Star Office UI 是開源的像素風格的 AI 可視化狀態看板,支持將 AI 助手的工作狀態實時可視化。Star Office UI 支持 6 種狀態映射到不...

FeelFish 3.0 發佈 – 小說創作,正式邁入多智能體時代

當 AI 還在以「單智能體問答」的方式幫你改一句台詞時,FeelFish 已經在思考一個更宏大的問題:如果每一個創作環節都有一位專屬的 AI 專家坐鎮,寫作會變成什...

SciClaw – AI 科研 Agent,支持自主運行實驗

SciClaw是什麼 SciClaw是專爲科研領域打造的AI Agent產品,定位爲”科研龍蝦”和”AI同事”。產品能自動完成文獻調研、實驗設計、數據分析和論文撰寫,支持自主運...

SenseAudio – 商湯科技推出的 AI 語音開放平台

SenseAudio是什麼 SenseAudio 是商湯科技推出的 AI 語音開放平台,主打”自然好聽、富有情緒的 AI 語音”。平台集成 70+ 精品音色,提供文本轉語音、聲音克隆(...

商湯輸入法AudioClaw – 商湯科技推出的 AI 語音輸入工具

商湯輸入法AudioClaw是什麼 商湯輸入法AudioClaw是商湯科技基於日日新多模態大模型推出的智能語音輸入工具。工具集語音轉文字、智能潤色、即時翻譯、口語淨化...

MOCR – 小紅書聯合華中科技推出的多模態文檔解析模型

MOCR是什麼 MOCR(Multimodal OCR)是華中科技大學與小紅書hi lab聯合推出的多模態文檔解析模型,僅3B參數在文檔解析和圖形重建上實現突破性表現。模型打破傳...

Voxtral TTS – Mistral AI開源的文本轉語音模型

Voxtral TTS是什麼 Voxtral TTS 是 Mistral AI開源的文本轉語音模型,基於 40 億參數架構,支持 9 種語言。模型具備 90 毫秒超低延遲和 6 倍實時生成速度,僅...

Gemini 3.1 Flash Live – 谷歌推出的實時語音模型

Gemini 3.1 Flash Live是什麼 Gemini 3.1 Flash Live是Google最新推出的高質量實時語音模型,專爲自然流暢的對話交互設計。模型在語調理解、推理能力和響應速...

Suno v5.5 – Suno推出的 AI 音樂生成模型

Suno v5.5是什麼 Suno V5.5 是Suno推出的 AI 音樂生成模型,標誌着從”生成即完成”向”精細化製作”的重大轉型。模型新增 Voices 聲音定製、Custom Models 自定...

Sand.ai – AI視頻生成平台,一鍵直出完整視頻

Sand.ai是什麼 Sand.ai(北京三呆科技)是AI視頻生成平台。平台專注自迴歸世界模型技術路線,現已開源150億參數音視頻模型daVinci-MagiHuman、分佈式訓練組件...
1 ... 3 4 5 6 7 ... 118