BAG 技術(shù):港中文聯(lián)合騰訊打造的 3D 可穿戴資產(chǎn)生成新標(biāo)桿
在數(shù)字化和虛擬化的浪潮中,3D 技術(shù)正在成為各個行業(yè)的重要工具。無論是游戲開發(fā)、虛擬現(xiàn)實(VR)和增強(qiáng)現(xiàn)實(AR),還是時尚設(shè)計和電商領(lǐng)域,3D 資產(chǎn)的生成和應(yīng)用都變得越來越重要。然而,傳統(tǒng) 3D 資產(chǎn)的生成過程復(fù)雜且耗時,難以滿足快速迭代和個性化需求。
為了應(yīng)對這一挑戰(zhàn),香港中文大學(xué)和騰訊聯(lián)合推出了 BAG(Body-Aligned 3D Wearable Asset Generation)技術(shù)。BAG 是一種創(chuàng)新的 3D 可穿戴資產(chǎn)生成技術(shù),通過結(jié)合多視圖圖像擴(kuò)散模型和控制網(wǎng)絡(luò)(ControlNet),能夠自動生成與人體完美適配的 3D 服裝和配飾。本文將深入探討 BAG 的技術(shù)原理、功能特點(diǎn)以及其在多個領(lǐng)域的應(yīng)用場景。

BAG 技術(shù):重新定義 3D 可穿戴資產(chǎn)生成
什么是 BAG 技術(shù)?
BAG 技術(shù)的核心在于結(jié)合多視圖圖像擴(kuò)散模型和控制網(wǎng)絡(luò)(ControlNet),利用人體的形狀和姿態(tài)信息,生成高質(zhì)量的 3D 可穿戴資產(chǎn)。其主要目標(biāo)是解決傳統(tǒng) 3D 資產(chǎn)生成過程中耗時長、適配性差的問題,為用戶提供高效、個性化的解決方案。
通過 BAG 技術(shù),用戶可以快速生成與人體模型完美適配的 3D 服裝和配飾,適用于虛擬試衣、游戲開發(fā)、VR/AR 應(yīng)用以及時尚設(shè)計等多個領(lǐng)域。BAG 的技術(shù)優(yōu)勢在于其高效的生成速度和自然的適配效果,能夠顯著提升用戶體驗。
BAG 技術(shù)的核心功能
-
多視圖圖像生成 BAG 通過多視圖圖像擴(kuò)散模型,基于人體的形狀和姿態(tài)信息,生成與人體對齊的多視圖圖像。這一過程確保了生成的圖像能夠準(zhǔn)確反映人體的三維結(jié)構(gòu)。
-
3D 資產(chǎn)生成 生成的多視圖圖像被輸入到 3D 擴(kuò)散模型中,生成高質(zhì)量的 3D 可穿戴資產(chǎn)。通過多視圖輪廓監(jiān)督恢復(fù)相似變換(Sim3),確保生成的 3D 資產(chǎn)與人體模型在空間上對齊。
-
物理模擬與優(yōu)化 為了確保生成的 3D 資產(chǎn)能自然貼合人體,BAG 采用了物理模擬技術(shù),解決資產(chǎn)與身體之間的穿透問題。通過代理網(wǎng)格保留資產(chǎn)的基本幾何形狀,作為布料模擬的代表,最終實現(xiàn)無穿透的對齊。
-
多樣化與個性化 BAG 支持從單個資產(chǎn)到多個組件組合的生成,滿足不同場景下的多樣化需求。用戶可以根據(jù)具體需求生成不同款式和風(fēng)格的服裝和配飾。
-
高效適配 BAG 能夠快速生成與不同人體模型適配的資產(chǎn),適用于虛擬服裝試穿、游戲開發(fā)、VR 和 AR 等領(lǐng)域。
BAG 技術(shù)的技術(shù)原理
BAG 技術(shù)的實現(xiàn)依賴于以下幾個關(guān)鍵模塊:
1. 視圖圖像擴(kuò)散模型
BAG 首先構(gòu)建了一個從單圖像到一致多視圖圖像的擴(kuò)散模型。該模型在大規(guī)模的 Objaverse 數(shù)據(jù)集上進(jìn)行訓(xùn)練,以實現(xiàn)多樣性和泛化能力。通過控制網(wǎng)絡(luò)(ControlNet),模型能夠生成與人體對齊的多視圖圖像。控制信號利用目標(biāo)人體的多視圖 2D 投影,其中像素值表示規(guī)范化空間中人體表面的 XYZ 坐標(biāo)。
2. 3D 形狀生成
生成的多視圖圖像被輸入到本地 3D 擴(kuò)散模型中,生成資產(chǎn)的 3D 形狀。通過多視圖輪廓監(jiān)督恢復(fù)相似變換(Sim3),確保生成的 3D 資產(chǎn)與人體模型在空間上對齊。
3. 物理模擬與優(yōu)化
為了確保生成的 3D 資產(chǎn)能夠自然貼合人體,BAG 采用了物理模擬技術(shù)。通過代理網(wǎng)格保留資產(chǎn)的基本幾何形狀,作為布料模擬的代表,最終實現(xiàn)無穿透的對齊。
BAG 技術(shù)的應(yīng)用場景
BAG 技術(shù)的推出為多個領(lǐng)域帶來了革命性的變化。以下是 BAG 技術(shù)的主要應(yīng)用場景:
1. 虛擬服裝試穿
BAG 技術(shù)能夠根據(jù)用戶的身體模型快速生成適配的 3D 服裝和配飾。用戶可以在虛擬環(huán)境中實時試穿不同款式和風(fēng)格的服裝,提升購物體驗,減少因尺寸不合適導(dǎo)致的退貨率。這對于電商行業(yè)來說是一個巨大的優(yōu)勢。
2. 游戲開發(fā)
在游戲開發(fā)中,BAG 技術(shù)可以為游戲角色生成多樣化的服裝和配飾,支持個性化定制,豐富玩家的角色體驗。通過 BAG,游戲開發(fā)者可以快速生成高質(zhì)量的 3D 資產(chǎn),縮短開發(fā)周期。
3. 虛擬現(xiàn)實(VR)和增強(qiáng)現(xiàn)實(AR)
BAG 生成的 3D 資產(chǎn)可以無縫集成到 VR 和 AR 應(yīng)用中,為用戶提供沉浸式的服裝試穿和設(shè)計體驗。在虛擬展廳中,用戶可以試穿不同風(fēng)格的服裝,實現(xiàn)虛擬與現(xiàn)實的無縫結(jié)合。
4. 時尚設(shè)計
設(shè)計師可以利用 BAG 技術(shù)快速生成和迭代 3D 服裝模型,加速設(shè)計流程。通過在虛擬環(huán)境中預(yù)覽設(shè)計效果,設(shè)計師可以降低設(shè)計成本,提高工作效率。
BAG 項目地址
-
項目官網(wǎng):https://bag-3d.github.io/
-
arXiv 技術(shù)論文:https://arxiv.org/pdf/2501.16177
結(jié)語
BAG 技術(shù)的推出標(biāo)志著 3D 可穿戴資產(chǎn)生成領(lǐng)域的一次重大突破。通過結(jié)合多視圖圖像擴(kuò)散模型和控制網(wǎng)絡(luò)(ControlNet),BAG 不僅提升了生成效率,還實現(xiàn)了高質(zhì)量的 3D 資產(chǎn)生成。無論是虛擬試衣、游戲開發(fā),還是 VR/AR 應(yīng)用和時尚設(shè)計,BAG 技術(shù)都展現(xiàn)出了巨大的潛力。
隨著技術(shù)的不斷進(jìn)步,BAG 技術(shù)有望在更多領(lǐng)域得到應(yīng)用,為用戶提供更加智能化、個性化的服務(wù)。如果你對 3D 資產(chǎn)生成技術(shù)感興趣,不妨訪問 BAG 的項目官網(wǎng),了解更多詳細(xì)信息。