Audiobox是Meta於2023年11月30日推出的免費開源的AI語音和聲音生成模型,12月11日上線在線網頁版本,用戶可免費體驗該模型的能力。Audiobox是Meta繼Voicebox後推出的最新一代的音頻生成模型,可以結合使用語音輸入和自然語言文本提示來生成語音和音效,從而可以輕鬆地爲各種用例創建逼真的自定義音頻。
Audiobox的主要功能
- 克隆用戶聲音:錄製聲音按照用戶的聲音風格或以任意音頻樣本的風格生成語音
- 文本描述生成人聲:使用文本描述聲音風格的特徵以及聲學環境生成人聲
- 更改聲音風格:可結合聲音和文本描述更改現有的聲音風格
- 本文描述生成音效:根據輸入的聲音特徵文本描述生成聲音效果
- 噪音消除:提供Magic Eraser功能消除錄音中的瞬態噪聲
- 聲音填充:根據文本描述用新的聲音替換音頻中的一部分
- 音頻故事製作器:結合以上功能,利用Audiobox Maker製作原創有趣的音頻故事
數據統計
相關導航
暫無評論...