LATTE3D – 英偉達推出的快速生成3D對象的文本模型

AI工具2年前 (2024)更新 AI管理員

9 0 0

什麼是LATTE3D

LATTE3D是英偉達的多倫多人工智慧實驗室研究團隊推出的一個模型，可根據文本描述快速生成高品質的3D內容（僅需400毫秒）。該技術的核心在於運用了名為「攤銷優化（amortized）」的方法，在眾多文本描述上同時優化一個共享的文本條件模型，以提高模型對新描述的泛化能力，進而減少生成每個3D對象所需的時間。

LATTE3D的官網入口

官方項目主頁：https://research.nvidia.com/labs/toronto-ai/LATTE3D/
研究論文：https://drive.google.com/file/d/1HZ7EY1jFguiwxxetgQkpljrj0cxbhZXZ/view

LATTE3D的主要功能

文本轉3D合成：這項技術能夠根據文本描述生成對應的三維模型。用戶只需輸入文本提示，如“一隻戴着禮帽的阿米巴絨絨玩偶螃蟹”，便能夠生成具有特定特徵和風格的3D對象。
快速生成：LATTE3D能夠在約400毫秒內完成3D對象的生成，使其能夠即時地回應用戶的輸入，為用戶提供即時的視覺反饋。
高質量渲染：LATTE3D結合了神經場和紋理表面生成技術，能夠產生具有高細節水平的紋理網格，呈現出引人入勝的3D渲染效果。
3D風格化：LATTE3D還可作爲3D風格化工具，允許用戶在現有的3D資產上應用新的風格或主題，從而創造出多樣化的視覺呈現。