TurboEdit – Adobe推出的AI即時圖像編輯模型

AI工具2年前 (2024)發佈新公告 AI管理員

36 0 0

TurboEdit是什麼

TurboEdit是Adobe Research 推出的AI即時圖像編輯模型。通過編碼器迭代反演和基於文本的精細控制，能夠在幾步內實現對圖像的精確編輯。利用詳細的文本提示，通過修改提示中的單一屬性，實現圖像中相應屬性的精確改變，同時保持其他特徵不變。TurboEdit 的優勢在於快速、高效，且在文本引導的圖像編輯方面表現出色，只需8次功能評估即可完成圖像反演，每次編輯僅需4次功能評估，大大提升了圖像編輯的速度和質量。

TurboEdit的主要功能

基於文本的圖像編輯：用戶可以通過修改詳細的文本提示來引導圖像編輯，實現對圖像特定屬性的精確修改。
快速迭代反演：利用編碼器迭代反演技術，TurboEdit 能夠快速從噪聲中重建輸入圖像，爲後續編輯打下基礎。
分離式圖像編輯：通過調整文本提示，TurboEdit 能夠在圖像中實現單一屬性的更改，而不影響其他部分。
實時編輯能力：TurboEdit 能夠在毫秒級時間內完成圖像的反演和編輯，提供了實時的圖像編輯體驗。

TurboEdit的技術原理

迭代反演技術：使用一個基於編碼器的迭代網絡來預測噪聲，重建輸入圖像。網絡接受輸入圖像和前一步重建的圖像作爲條件，逐步校正重建過程。
條件擴散模型：在幾步式擴散模型的上下文中，TurboEdit 用條件擴散來生成圖像。要求模型在生成過程中考慮文本提示，確保生成的圖像與文本描述相匹配。
文本提示的詳細控制：通過自動生成或用戶指定的詳細文本提示，TurboEdit 能實現對圖像中特定屬性的精確操作。文本提示的詳細程度有助於分離編輯，確保只有指定的屬性被改變。
噪聲圖的凍結與修改：在編輯過程中，通過凍結噪聲圖並修改文本提示中的特定屬性，TurboEdit 能生成與原始圖像相似但具有單一屬性變化的新圖像。
編輯強度的控制：通過調整文本嵌入的線性插值，TurboEdit 支持用戶控制編輯的強度，實現從微妙到顯著的編輯效果。
基於指令的編輯：利用大型語言模型（LLM），TurboEdit 能根據用戶的指令性文本提示自動轉換描述性源提示，生成目標提示，並輸入到擴散模型中，實現基於指令的圖像編輯。
局部掩碼編輯：TurboEdit 支持用戶上傳二進制掩碼來指定編輯區域，編輯效果僅限於特定區域，提高編輯的精確度。
高效的計算性能：TurboEdit 優化了計算過程，圖像反演和編輯過程非常快速，每次編輯只需要極少的計算資源，實現實時編輯。