美國(guó)紐約康奈爾大學(xué)研究人員開(kāi)發(fā)了一種類似聲納技術(shù)的原型,可以取代攝像頭來(lái)追蹤眼球運(yùn)動(dòng)。該原型基于微型揚(yáng)聲器,可發(fā)出頻率高于18 kHz的聲音,這超出了大多數(shù)人的聽(tīng)力范圍。
聲音反射用戶臉部、并由頭顯兩側(cè)的四個(gè)麥克風(fēng)接收,研究人員使用一種稱為GazeTrak的算法來(lái)解讀聲波,以確定頭顯用戶注視方向。
研究團(tuán)隊(duì)表示,聲納技術(shù)具有以下幾大優(yōu)點(diǎn):與基于攝像頭的系統(tǒng)相比,可以降低功耗,并且由于攝像頭不會(huì)持續(xù)記錄,具備更好的隱私性,且還能降低VR頭顯的制造成本和重量。
在對(duì)20名參與者測(cè)試時(shí),基于聲納技術(shù)的眼動(dòng)追蹤顯示準(zhǔn)確度高達(dá)3.6度,盡管不如當(dāng)前的高端設(shè)備(例如Apple Vision Pro)準(zhǔn)確,不過(guò),研究人員認(rèn)為這種性能對(duì)于大多數(shù)虛擬現(xiàn)實(shí)應(yīng)用來(lái)說(shuō)應(yīng)該足夠。
然而,該系統(tǒng)有一個(gè)主要缺點(diǎn):由于每個(gè)人的眼球形狀不同,GazeTrak使用的AI模型必須針對(duì)每個(gè)用戶單獨(dú)進(jìn)行訓(xùn)練。為了將眼球追蹤聲納商業(yè)化,必須收集足夠的數(shù)據(jù)來(lái)創(chuàng)建通用模型。
眼動(dòng)追蹤是虛擬現(xiàn)實(shí)的一項(xiàng)關(guān)鍵技術(shù),支持用戶通過(guò)查看特定點(diǎn)來(lái)導(dǎo)航菜單或與虛擬環(huán)境中的其他化身進(jìn)行眼神交流,Vision Pro便能基于精確的眼動(dòng)追蹤以改善用戶體驗(yàn)。
眼動(dòng)追蹤還支持呈現(xiàn)正在查看的區(qū)域詳細(xì)表示和外圍不太詳細(xì)的表示(注視點(diǎn)渲染)來(lái)實(shí)現(xiàn)用戶焦點(diǎn)的渲染。該技術(shù)還支持創(chuàng)新的控制方法,例如 VR游戲「Before Your Eyes」,玩家只需用眼睛即可操控。
雖然眼動(dòng)追蹤具備以上優(yōu)勢(shì),但是市場(chǎng)領(lǐng)導(dǎo)者M(jìn)eta仍決定不在Meta Quest3上應(yīng)用該技術(shù),理由是制造成本、重量和所需的計(jì)算力。到目前為止,Meta僅在Quest Pro中采用了眼動(dòng)追蹤。
而Meta首席技術(shù)官博斯沃思相信,眼動(dòng)追蹤終有一天會(huì)成為標(biāo)準(zhǔn):“作為與雙手結(jié)合的2D導(dǎo)航UI范式,我們確實(shí)對(duì)眼動(dòng)追蹤技術(shù)進(jìn)行了很長(zhǎng)時(shí)間的測(cè)試,這是制造成本、重量和所需計(jì)算力之間的權(quán)衡,我們專注于能夠在更高效的架構(gòu)中以高精度提供這項(xiàng)功能,這樣就可以將眼動(dòng)追蹤應(yīng)用于每一臺(tái)頭顯?!?/p>