
Meta推出了Meta 3D Gen(3DGen),這是用于文本到3D資產(chǎn)生成的一種先進快速管道。3DGen可在不到一分鐘的時間內(nèi)支持具有高即時保真度和高質(zhì)量3D形狀和紋理的3D資產(chǎn)創(chuàng)建。
文本到3D是指從文本生成3D內(nèi)容,如角色、道具和場景的問題描述。創(chuàng)作3D內(nèi)容是設計中最耗時和最具挑戰(zhàn)性的方面之一,涉及開發(fā)游戲、增強現(xiàn)實和虛擬現(xiàn)實應用,以及電影中的特效等行業(yè)。通過可兼任為3D藝術(shù)家的3DGen,Meta可以實現(xiàn)以新體驗為中心創(chuàng)建個性化的、用戶生成的3D內(nèi)容。
3DGen還可以支持許多其他的應用,例如用戶生成視頻中的虛擬產(chǎn)品植入。人工智能驅(qū)動的3D生成也是如此,這對于在虛擬世界中構(gòu)建無限大的虛擬世界非常重要。3DGen具有其他形式的媒體生成所沒有的獨特和困難的挑戰(zhàn):圖片和視頻。制作3D內(nèi)容在藝術(shù)質(zhì)量和速度方面具有嚴格的標準:三維網(wǎng)格的生成、結(jié)構(gòu)和拓撲質(zhì)量、UV貼圖的結(jié)構(gòu)和紋理清晰度和分辨率。

3DGen支持基于物理的渲染(PBR),這是在實際應用中重照明3D資產(chǎn)所必需的。此外,3DGen 還支持使用用戶提供的額外文本輸入對先前生成的(或創(chuàng)作者創(chuàng)建的)3D形狀進行生成性重新紋理化。
3DGen集成了Meta分別為文本到3D和文本到紋理生成開發(fā)的關(guān)鍵技術(shù)組件Meta 3D AssetGen(這是文本到3D生成的一項重大進步,它可以生成具有紋理和材質(zhì)控制的高質(zhì)量網(wǎng)格;與在3D對象外觀中烘焙陰影的工作相比,AssetGen輸出基于物理的PBR材質(zhì),支持逼真的重照明。)和Meta 3D TextureGen(文本到圖像模型的可用性和適應性為許多相關(guān)領(lǐng)域開啟了一個新時代,其中之一就是3D對象紋理生成。盡管紋理生成方法通過使用文本到圖像網(wǎng)絡取得了令人印象深刻的結(jié)果,但對于將紋理生成推進到實際應用至關(guān)重要的全局一致性、質(zhì)量和速度的組合仍然難以實現(xiàn)。),通過整合,3DGen可同時以三種方式表示3D對象:在視圖空間、體積空間和UV(或紋理)空間中。
相對于單階段模型,這兩種技術(shù)的集成實現(xiàn)了68%的成功率。Meta將3DGen與眾多行業(yè)基線進行了比較,并表明3DGen在復雜文本提示的保真度和視覺質(zhì)量方面優(yōu)于AssetGen和TextureGen,同時速度明顯更快。








