AI工具 | 第 5 頁 | 最好用的AI工具

新商湯輸入法AudioClaw – 商湯科技推出的 AI 語音輸入工具

商湯輸入法AudioClaw是什麼商湯輸入法AudioClaw是商湯科技基於日日新多模態大模型推出的智能語音輸入工具。工具集語音轉文字、智能潤色、即時翻譯、口語淨化...

AI工具

1周前

MOCR是什麼 MOCR（Multimodal OCR）是華中科技大學與小紅書hi lab聯合推出的多模態文檔解析模型，僅3B參數在文檔解析和圖形重建上實現突破性表現。模型打破傳...

AI工具

1周前

Voxtral TTS是什麼 Voxtral TTS 是 Mistral AI開源的文本轉語音模型，基於 40 億參數架構，支持 9 種語言。模型具備 90 毫秒超低延遲和 6 倍實時生成速度，僅...

AI工具

1周前

Gemini 3.1 Flash Live是什麼 Gemini 3.1 Flash Live是Google最新推出的高質量實時語音模型，專爲自然流暢的對話交互設計。模型在語調理解、推理能力和響應速...

AI工具

1周前

Suno v5.5是什麼 Suno V5.5 是Suno推出的 AI 音樂生成模型，標誌着從”生成即完成”向”精細化製作”的重大轉型。模型新增 Voices 聲音定製、Custom Models 自定...

AI工具

1周前

Sand.ai是什麼 Sand.ai（北京三呆科技）是AI視頻生成平台。平台專注自迴歸世界模型技術路線，現已開源150億參數音視頻模型daVinci-MagiHuman、分佈式訓練組件...

AI工具

1周前

SClaw 是什麼 SClaw 是超算互聯網推出的科研專屬 AI Agent（智能體），是基於 OpenClaw 打造、深度集成於 SCNet 客戶端。產品支持「對話即指令」的自然交互，...

AI工具

1周前

LongCat-Next是什麼 LongCat-Next是美團LongCat推出的多模態模型，核心創新是LoZA稀疏注意力機制。模型通過智能篩查模塊重要性，將50%低重要模塊替換爲流式稀...

AI工具

1周前

daVinci-MagiHuman是什麼 daVinci-MagiHuman 是上海創智學院 GAIR 實驗室與 Sand.ai 聯合開源的音視頻聯合生成基座模型。模型採用 150 億參數的單流 Transfor...

AI工具

1周前

TurboQuant是什麼 TurboQuant 是 Google Research 推出的向量量化算法，可將大模型 KV Cache 從 32-bit 壓縮至 3-bit，實現內存降低 6 倍、推理速度提升 8 倍...

AI工具

1周前