Whisper Input – 開源AI語音輸入工具,支持多語言實時轉錄和翻譯
Whisper Input是什麼 Whisper Input 是開源的語音輸入工具,基於 Python 和 OpenAI 的 Whisper 模型開發。通過簡單的快捷鍵操作(如按下 Option 鍵開始錄音,...
MinMo – 阿里通義實驗室推出的多模態語音交互大模型
MinMo是什麼 MinMo是阿里巴巴通義實驗室FunAudioLLM團隊推出的多模態大模型,專注於實現無縫語音交互。MinMo擁有約80億參數,基於多階段訓練,在140萬小時多...
3MinTop – AI閱讀助手,將書籍內容精煉總結爲 3 分鐘精華摘要
3MinTop是什麼 3MinTop 是 AI 驅動的閱讀助手,能將書籍內容精煉總結爲 3 分鐘的精華摘要,幫助用戶快速掌握書籍核心要點,降低閱讀門檻,培養閱讀習慣。用戶...
ArtCrafter – 清華聯合鵬城實驗室和聯想共同推出的文本到圖像風格遷移框架
ArtCrafter是什麼 ArtCrafter是清華大學、鵬城實驗室和聯想研究院共同推出的文本到圖像風格遷移框架,基於擴散模型,解決傳統方法在風格表達、內容一致性和輸...
AutoDroid-V2 – 清華推出的移動端GUI自動化腳本代理
AutoDroid-V2是什麼 AutoDroid-V2是清華大學人工智能產業研究院推出的基於小型語言模型(SLM)的移動端GUI自動化腳本代理,能基於代碼生成技術提升設備上的GU...
TradingAgents – 加利福尼亞聯合麻省理工推出的多智能體LLM金融交易框架
TradingAgents是什麼 TradingAgents是加利福尼亞大學洛杉磯分校和麻省理工學院推出的多代理LLM金融交易框架,能模擬現實世界的交易公司環境。TradingAgents整...
AI Mirror – AI圖像編輯和視頻創作應用,提供多種濾鏡和視頻風格轉換
AI Mirror是什麼 AI Mirror是AI照片編輯和視頻創作應用,提供AI濾鏡、視頻風格轉換及獨特的AI擁抱視頻技術。用戶能瞬間將照片轉換成動漫、漫畫、遊戲角色和素...
Lingolette – AI語言學習平台,實時口語互動和提高書面表達能力
Lingolette是什麼 Lingolette是基於AI技術的語言學習平台,幫助用戶實時對話提高外語的口語和書面表達能力。Lingolette提供個性化學習體驗,適應用戶的節奏和...
Slides Orator – AI PPT解說定製平台 ,AI虛擬形象實時解說幻燈片內容
Slides Orator是什麼 Slides Orator是創新的AI平台,基於創建虛擬形象實時展示幻燈片進行解說。工具基於技術生成語音旁白,讓演示內容動態地與觀衆互動,增強...
什麼是人工智能對齊(AI Alignment) – AI百科知識
人工智能對齊(AI Alignment)是指確保人工智能系統的行爲與人類的意圖和價值觀保持一致的領域。核心目標可以概括爲四個關鍵原則:魯棒性(Robustness)、可...