在混合現(xiàn)實(shí)(MR)技術(shù)領(lǐng)域,設(shè)備對(duì)物理環(huán)境的感知與建模能力是決定用戶體驗(yàn)的關(guān)鍵因素之一。Lasertag開發(fā)團(tuán)隊(duì)在Meta Quest 3和Quest 3S設(shè)備上實(shí)現(xiàn)了一項(xiàng)重大技術(shù)創(chuàng)新—— 連續(xù)場(chǎng)景網(wǎng)格化。這一技術(shù)革新徹底省去了傳統(tǒng)的房間設(shè)置流程,有效規(guī)避了由此衍生的一系列問題,為用戶帶來更加流暢、便捷的混合現(xiàn)實(shí)體驗(yàn)。?
Quest 3和Quest 3S配備的先進(jìn)傳感器,能夠?qū)Ψ块g進(jìn)行掃描,進(jìn)而生成3D場(chǎng)景網(wǎng)格。這一3D場(chǎng)景網(wǎng)格為混合現(xiàn)實(shí)應(yīng)用提供了基礎(chǔ)支撐,使得虛擬對(duì)象能夠與物理幾何體進(jìn)行自然交互,甚至允許用戶對(duì)環(huán)境進(jìn)行重新設(shè)計(jì)。然而,Meta當(dāng)前采用的場(chǎng)景網(wǎng)格系統(tǒng)存在兩大顯著弊端。?
首要問題在于,用戶必須先進(jìn)行環(huán)境掃描。掃描所需時(shí)間因房屋大小和形狀而異,短則約20秒,長(zhǎng)則需花費(fèi)數(shù)分鐘。在此過程中,用戶不僅需要保持靜止查看,有時(shí)甚至要在房間內(nèi)來回走動(dòng),這種繁瑣的操作流程極大地降低了用戶使用混合現(xiàn)實(shí)應(yīng)用的便捷性,遠(yuǎn)不及直接打開應(yīng)用程序那般簡(jiǎn)單直接。?
另一個(gè)不容忽視的問題是,場(chǎng)景網(wǎng)格掃描所生成的結(jié)果僅僅反映了掃描那一刻的環(huán)境狀態(tài)。一旦完成掃描后,房間內(nèi)的家具發(fā)生移動(dòng),或者有物品被添加、移除,這些變化都無法自動(dòng)同步到混合現(xiàn)實(shí)場(chǎng)景中,除非用戶手動(dòng)進(jìn)行掃描更新。舉例來說,如果在掃描時(shí)有其他人與你一同處于房間內(nèi),他們的身形會(huì)被固定在場(chǎng)景網(wǎng)格之中,后續(xù)即便此人離開,混合現(xiàn)實(shí)場(chǎng)景中仍會(huì)保留其虛擬身形。?
值得一提的是,Quest 3和Quest 3S還為應(yīng)用程序提供了另一種獲取物理環(huán)境3D結(jié)構(gòu)信息的途徑——深度 API。深度API通過比較頭顯前置兩個(gè)追蹤攝像頭的視差,生成實(shí)時(shí)的第一人稱深度幀。該技術(shù)的有效工作距離最遠(yuǎn)可達(dá)5米,在混合現(xiàn)實(shí)應(yīng)用中,常被用于實(shí)現(xiàn)動(dòng)態(tài)遮擋效果,通過深度幀數(shù)據(jù),應(yīng)用程序能夠精準(zhǔn)判斷虛擬對(duì)象是否會(huì)被物理幾何體遮擋。?
Julian Triveri 開發(fā)的同地多人混合現(xiàn)實(shí)Quest 3游戲「Lasertag」便是深度API應(yīng)用的典型案例。在這款游戲中,深度API不僅用于實(shí)現(xiàn)動(dòng)態(tài)遮擋,其公開版本還借助該技術(shù)判斷每一幀中激光是與真實(shí)幾何體發(fā)生碰撞,還是擊中對(duì)手。Triveri之所以沒有采用Meta的場(chǎng)景網(wǎng)格,是因?yàn)樗M苊庠黾佑螒蛟O(shè)置過程中的繁瑣步驟,同時(shí)突破網(wǎng)格內(nèi)容固定的限制。?
而「Lasertag」的測(cè)試版更是展現(xiàn)出了強(qiáng)大的技術(shù)潛力。在Beta版本中,Triveri利用深度幀數(shù)據(jù),在GPU上逐步構(gòu)建出能夠代表物理環(huán)境的3D體積紋理。這一技術(shù)實(shí)現(xiàn)了即使無需任何初始設(shè)置,游戲也能模擬激光與未在當(dāng)前視野內(nèi),但此前已掃描過的真實(shí)世界幾何體的碰撞效果。在內(nèi)部版本中,Triveri還借助Unity開源的移動(dòng)立方體算法,將3D體積紋理轉(zhuǎn)換為網(wǎng)格。?
在早期的開發(fā)過程中,Triveri甚至嘗試過聯(lián)網(wǎng)高度圖技術(shù)。在相關(guān)測(cè)試中,同一游戲會(huì)話中的每個(gè)頭顯都會(huì)將自身基于深度幀連續(xù)構(gòu)建的高度圖共享給其他頭顯,如此一來,每個(gè)頭顯都能獲取所有掃描結(jié)果的匯總信息。不過,目前該功能尚未開放,且依賴于Triveri暫不打算推廣的舊有底層技術(shù),但這無疑是一次極具價(jià)值的探索,為未來多人混合現(xiàn)實(shí)系統(tǒng)的發(fā)展提供了新思路。?
那么,為何Meta沒有選擇連續(xù)網(wǎng)格化技術(shù),而是繼續(xù)沿用現(xiàn)有的房間掃描系統(tǒng)呢?在Apple Vision Pro和PICO 4 Ultra等設(shè)備上,場(chǎng)景網(wǎng)格已實(shí)現(xiàn)了持續(xù)自動(dòng)掃描與更新,無需用戶進(jìn)行特定的房間設(shè)置。這得益于它們配備的硬件級(jí)深度傳感器,能夠高效獲取深度信息。反觀 Quest 3和Quest 3S,其深度信息的獲取依賴于計(jì)算成本較高的計(jì)算機(jī)視覺算法(Quest 3還借助了投射紅外圖案技術(shù))。使用深度API會(huì)大量消耗CPU、GPU資源,同時(shí)顯著縮短電池續(xù)航時(shí)間,這也是許多Quest混合現(xiàn)實(shí)應(yīng)用至今未能實(shí)現(xiàn)動(dòng)態(tài)遮擋功能的重要原因。而利用深度幀構(gòu)建網(wǎng)格,所需的計(jì)算資源和能耗更是成倍增加。?
從本質(zhì)上講,「Lasertag」通過犧牲一定的性能和電池續(xù)航能力,換來了無需設(shè)置即可持續(xù)感知場(chǎng)景的優(yōu)勢(shì),這也正是Quest 3和3S官方場(chǎng)景網(wǎng)格系統(tǒng)未采用該技術(shù)的核心原因。今年1月,Meta曾表示計(jì)劃讓場(chǎng)景網(wǎng)格實(shí)現(xiàn)自動(dòng)更新以反映環(huán)境變化,但從其表述來看,仍需進(jìn)行初始設(shè)置作為基礎(chǔ)。?
目前,「Lasertag」在Meta Horizon平臺(tái)上對(duì)Quest頭顯用戶免費(fèi)開放。正式商店版本使用實(shí)時(shí)深度幀處理激光碰撞,而預(yù)發(fā)布測(cè)試版則如前文所述,能夠隨著時(shí)間推移構(gòu)建3D體積,為用戶帶來更為豐富和真實(shí)的混合現(xiàn)實(shí)游戲體驗(yàn)。