華為:虛擬現(xiàn)實(shí)的繁榮可能會(huì)導(dǎo)致互聯(lián)網(wǎng)帶寬阻塞

?? 由 文心大模型 生成的文章摘要

作者Bo Begole是華為技術(shù)媒體實(shí)驗(yàn)室的副總裁和全球負(fù)責(zé)人。

上個(gè)月,我提到響應(yīng)式媒介的時(shí)代即將到來(lái),它是一種可以根據(jù)消費(fèi)者的注意力、約定與情境不同而靈活改變內(nèi)容的媒介渠道。使其成為現(xiàn)實(shí)的一些技術(shù)基礎(chǔ)即將出現(xiàn)和普及(如虛擬現(xiàn)實(shí)眼鏡、情緒感知算法和多攝像系統(tǒng)),但美中不足的是:響應(yīng)式媒介所需的帶寬太多,互聯(lián)網(wǎng)帶寬數(shù)據(jù)出口可能會(huì)因此奔潰。

我的說(shuō)法頗具戲劇性,允許我稍作解釋。虛擬現(xiàn)實(shí)的目標(biāo)就是針對(duì)人所有的感官來(lái)生成數(shù)字體驗(yàn),再現(xiàn)眼睛所能見(jiàn)到的每一個(gè)光子、耳朵所能聽(tīng)到的每一個(gè)小震動(dòng),最后到觸覺(jué)、嗅覺(jué)和溫度所能感知的每個(gè)細(xì)節(jié)。實(shí)現(xiàn)這個(gè)目標(biāo)不是件容易的事,因?yàn)槿祟惖拇竽X的感知系統(tǒng)每秒可以處理近相當(dāng)于5.2千兆大小數(shù)據(jù)量的聲音和光線——200倍于美國(guó)聯(lián)邦通信委員會(huì)預(yù)測(cè)的未來(lái)寬帶網(wǎng)絡(luò)速度要求(25M)。再讓我解釋一下5.2千兆這個(gè)龐大數(shù)字的來(lái)由(如果你相信我所說(shuō)的,可以跳過(guò)這部分內(nèi)容)。

眼球的中央凹可以檢測(cè)0.3角分度大小的細(xì)粒,即是在中央凹視場(chǎng)范圍內(nèi),可以識(shí)別約200個(gè)細(xì)粒。轉(zhuǎn)換成屏幕像素大約為200像素。保持頭部不動(dòng),瞬息間(少于100毫秒)眼睛至少可在水平面上轉(zhuǎn)動(dòng)150°,在垂直面上轉(zhuǎn)動(dòng)120°。也就是30000水平像素乘以24000垂直像素,意味人眼一次獲取的畫(huà)面信息需要全方位覆蓋7.2億像素。最后加上頭部和身體360°水平轉(zhuǎn)動(dòng)和180°垂直轉(zhuǎn)動(dòng),將超過(guò)25億(千兆)像素。

這只是就靜態(tài)圖像而言,但世界并非是靜止不動(dòng)的。視頻是由多張靜態(tài)圖像在瞬間內(nèi)的連續(xù)顯示組成的,電視/電影往往是每秒30張圖片。每秒30幀的速度對(duì)中速電影/電視節(jié)目而言綽綽有余,但人類的眼睛無(wú)法像相機(jī)那樣捕捉事物。事實(shí)上,眼睛不斷接受光刺激,人類的眼睛能夠捕捉更快速的動(dòng)作。據(jù)計(jì)算,人眼球的捕捉速度高達(dá)每秒150幀。對(duì)于體育運(yùn)動(dòng)、游戲、科幻和其他高速沉浸式體驗(yàn),達(dá)到60甚至是120幀每秒的視頻是預(yù)防“動(dòng)態(tài)模糊”和定向混亂的必需條件。

用最保守的估計(jì),除卻頭部和身體轉(zhuǎn)動(dòng),兩只眼睛可以接受7.2億像素,60幀每秒,每個(gè)像素36位色彩,一共就是3.1萬(wàn)億位!如果按當(dāng)今的壓縮標(biāo)準(zhǔn)可減小300倍,即使未來(lái)可以達(dá)到600倍(未來(lái)視頻壓縮標(biāo)準(zhǔn)),意味著我們?nèi)孕枰棵?.2千兆的網(wǎng)絡(luò)吞吐量,甚至更多。

5.2千兆只是理論上限。相機(jī)和顯示屏尚未達(dá)到30K分辨率。我們期望8K分辨率相機(jī)能在今年問(wèn)世。

在上個(gè)月我提到過(guò)幾個(gè)360°全景攝像系統(tǒng),至少包含16臺(tái)超外放置相機(jī)。4K分辨率、30幀每秒、24位每像素和使用300:1的壓縮比率,這些裝置每秒能生成300兆比特圖像。這些要求至少是制作高質(zhì)量4K電影體驗(yàn)的10倍。