AI工具
新Otty – Typora 團隊推出的原生 macOS 終端應用
Otty是什麼 Otty 是 Typora 團隊推出的原生 macOS 終端應用,專爲頻繁使用 AI Agent 的開發者設計。工具在傳統終端的基礎上,原生集成多 Agent 面板管理、會...
新MMSkills – 上海交大與小紅書聯合推出的多模態技能框架
MMSkills是什麼 MMSkills 是上海交通大學與小紅書聯合推出的面向通用視覺 Agent 的多模態技能框架,支持將可複用技能從純文本步驟擴展爲包含文本流程、運行時...
新Confucius4-TTS – 網易有道開源的多語言語音合成引擎
Confucius4-TTS是什麼 Confucius4-TTS 是網易有道開源的 1.3B 參數多語言語音合成引擎。模型只需 3 秒參考音頻可零樣本克隆音色,無需參考文本,支持中、英、...
新JoyAI-VL-Interaction – 京東開源的實時視頻視覺語言交互模型
JoyAI-VL-Interaction是什麼 JoyAI-VL-Interaction 是京東 Joy Future Academy 開源的實時視頻視覺語言交互模型,是全球首個全棧開源的 interaction 模型系統...
新Baichuan-M4 – 百川智能聯合清華推出的醫療增強模型
Baichuan-M4是什麼 Baichuan-M4是百川智能聯合清華大學推出的新一代醫療增強大模型,在 HealthBench 綜合、Hard、Professional 三個權威榜單同時位列世界第一...
新Claude Tag – Anthropic 推出的企業級 AI 協作工具
Claude Tag是什麼 Claude Tag 是 Anthropic 推出的企業級 AI 協作工具,定位爲 Claude Code 的進化版。工具內置 Agent 身份深度集成 Slack,團隊成員可在任意...
新4 個開源 PPT Skill 生成實測 – 從顏值到原生交付全對比
今天發點適合做 PPT 的東西。 做 PPT 這事,懂的都懂。 做得好不一定有獎勵,做得差一定要返工。最煩的是,很多 PPT 寫出大綱倒是不難,反而排版、填寫內容、...
新豆包音頻生成模型1.0 – 火山引擎推出的端到端音頻創作模型
豆包音頻生成模型1.0是什麼 豆包音頻生成模型1.0是火山引擎推出的端到端音頻創作模型,支持文本或音頻作爲參考輸入生成目標音頻。模型單條Prompt可編排多角色...
新Unlimited-OCR – 百度開源的端到端長文檔 OCR 模型
Unlimited-OCR是什麼 Unlimited-OCR 是百度推出的端到端長文檔 OCR 模型,通過 Reference Sliding Window Attention機制將解碼器 KV cache 從線性增長壓縮爲...
新豆包2.1 – 字節跳動推出的全新智能體模型系列
豆包2.1是什麼 Seed 2.1 是字節跳動 Seed 團隊推出的面向真實生產力場景的全新智能體模型系列,包含 Pro 與 Turbo 兩個版本。模型以解決日常生活、專業工作和...