AI工具
Hyper-SD – 字節跳動推出的高效的圖像合成框架
Hyper-SD是什麼 Hyper-SD是由字節跳動的研究人員推出的一個高效的圖像合成框架,旨在解決現有擴散模型在多步推理過程中計算成本高昂的問題。Hyper-SD通過軌跡...
Phi-3 – 微軟最新推出的新一代小模型系列
Phi-3是什麼 Phi-3是微軟研究院推出的新一代系列先進的小語言模型,包括phi-3-mini、phi-3-small和phi-3-medium三個不同規模的版本。這些模型在保持較小的參...
商量擬人大模型 – 商湯推出的AI角色對話大模型
商量擬人大模型是什麼 2該大模型具備角色定製、知識庫構建、長對話記憶、多人羣聊和角色親密度設置等功能,能夠精準記憶對話歷史,識別人物關係,推動劇情發...
Llama 3 – Meta開源推出的新一代大語言模型
Llama 3是什麼 Llama 3是Meta公司最新開源推出的新一代大型語言模型(LLM),包含8B和70B兩種參數規模的模型,標誌着開源人工智能領域的又一重大進步。作爲Ll...
Phi-3 – 微軟最新推出的新一代小模型系列
Phi-3是什麼 Phi-3是微軟研究院推出的新一代系列先進的小語言模型,包括phi-3-mini、phi-3-small和phi-3-medium三個不同規模的版本。這些模型在保持較小的參...
FunClip – 阿里達摩院開源的AI自動視頻剪輯工具
FunClip是什麼 FunClip是阿里達摩院推出的一款完全開源、本地部署的自動化視頻剪輯工具,通過調用阿里巴巴通義實驗室的FunASR Paraformer系列模型實現視頻的...
Llama 3 – Meta開源推出的新一代大語言模型
Llama 3是什麼 Llama 3是Meta公司最新開源推出的新一代大型語言模型(LLM),包含8B和70B兩種參數規模的模型,標誌着開源人工智能領域的又一重大進步。作爲Ll...
VASA-1 – 微軟推出的靜態照片對口型視頻生成框架
VASA-1是什麼 VASA-1是由微軟亞洲研究院提出的一個將靜態照片轉換爲對口型動態視頻的生成框架,能夠根據單張靜態人臉照片和一段語音音頻,實時生成逼真的3D說...
Parler-TTS – Hugging Face開源的文本轉語音模型
Parler-TTS是什麼 Parler-TTS是由Hugging Face推出的一款開源的文本到語音(TTS)模型,能夠通過輸入提示描述模仿特定說話者的風格(性別、音調、說話風格等...
Parler-TTS – Hugging Face開源的文本轉語音模型
Parler-TTS是什麼 Parler-TTS是由Hugging Face推出的一款開源的文本到語音(TTS)模型,能夠通過輸入提示描述模仿特定說話者的風格(性別、音調、說話風格等...