上周,以“融合品質(zhì)多元”為主題的2016上海網(wǎng)絡(luò)視聽季暨第八屆中國網(wǎng)絡(luò)視聽產(chǎn)業(yè)論壇在上海世貿(mào)商城展覽中心舉行,本次活動(dòng)包含10個(gè)網(wǎng)絡(luò)視聽行業(yè)細(xì)分垂直領(lǐng)域的特色沙龍,而我正好參加了與VR相關(guān)的VR內(nèi)容沙龍。值得注意的是,本次沙龍是由微鯨VR協(xié)辦的,而微鯨VR技術(shù)副總裁仝曉亮也在現(xiàn)場呈現(xiàn)了精彩的主題演講。仝曉亮的演講主題是“直播技術(shù)助力VR視頻產(chǎn)業(yè)化之路”,今天我就和大家分享一下這場充滿干貨的主題演講的內(nèi)容,為達(dá)到最好的閱讀效果,我略微進(jìn)行了整理。
對于直播來說,核心的改變在于技術(shù),沒有技術(shù)就沒有直播。
當(dāng)提到VR帶給用戶的感受時(shí),我們用到最多的詞匯可能就是“臨場感”或者“沉浸感”,VR能夠把用戶帶到現(xiàn)場。我們認(rèn)為,在現(xiàn)場是一個(gè)起點(diǎn),如果你做不到在現(xiàn)場,你就不能說自己是合格的VR內(nèi)容。對于微鯨VR來說,我們要做到不光在現(xiàn)場,而且要超越現(xiàn)場。
我們看一下視頻產(chǎn)業(yè)傳遞的媒介,影視內(nèi)容從早期的膠片、磁帶到VCD、DVD再到現(xiàn)在,物理承載的方式一直在不斷演變。我們現(xiàn)在更多的是數(shù)字化視聽,它的承載更多依靠我們網(wǎng)絡(luò)的帶寬條件,我們可以看到信息傳遞的媒介也是和帶寬承載能力有一個(gè)內(nèi)在的關(guān)聯(lián)。從早期2G時(shí)代,大家只能發(fā)短信傳遞文字信息;到3G時(shí)代大家看圖片,分享語音;到了視頻應(yīng)用,視頻交流,我們依賴于4G通信網(wǎng)絡(luò)以及20兆以上比較普及的家庭帶寬。我們也看到,現(xiàn)在直播平臺(tái)非常火,這樣一個(gè)現(xiàn)狀也會(huì)進(jìn)一步催生我們對于帶寬的要求。反過來說,傳輸帶寬不斷提升對于我們所能夠承載媒介體量都會(huì)有一個(gè)促進(jìn)作用,這兩者并不是一個(gè)因果關(guān)系,但他們實(shí)際上有一個(gè)深刻的互相內(nèi)在關(guān)聯(lián)。

提到直播,我們認(rèn)為它會(huì)是VR視頻內(nèi)容比較早的走出商業(yè)化步驟的起點(diǎn)。目前VR視頻內(nèi)容的商業(yè)化模式有可能有哪些?我在這里說一些我的看法,但并不一定是說有非常好、非常成熟的商業(yè)實(shí)踐,至少我們看到了一些苗頭。一種是院線的票房和線下付費(fèi)體驗(yàn),做得比較好VR影視內(nèi)容本身可以收費(fèi);第二種是企業(yè)的宣傳片,這是To B的業(yè)務(wù),付費(fèi)方是企業(yè),它的觀眾可能就是企業(yè)的員工以及企業(yè)的客戶;第三種是景區(qū)的導(dǎo)覽,這種付費(fèi)方可能是政府,它的目標(biāo)對象應(yīng)該是游客或者潛在游客;對于婚禮、發(fā)布會(huì)也是To B的模式,實(shí)現(xiàn)商業(yè)化。還有廣告,目前VR廣告本身都是比較精彩的VR內(nèi)容,這是它跟傳統(tǒng)廣告不同的一點(diǎn);另外一種是在VR內(nèi)容里面貼廣告。接下來還有秀場,我們已經(jīng)看到有秀場平臺(tái)在做VR的演進(jìn),這應(yīng)該是最接近讓用戶付費(fèi)的方式。接下來是體育和音樂兩大領(lǐng)域,這兩大領(lǐng)域里面,目前用戶在傳統(tǒng)直播領(lǐng)域開始形成比較好的付費(fèi)習(xí)慣,我們可以做在線音樂會(huì)付費(fèi)門票,比如50塊或者30塊一張,你通過網(wǎng)絡(luò)觀看這種已經(jīng)比較流行了,這也是我們認(rèn)為直播能邁出商業(yè)化的前提。
我們認(rèn)為,直播的技術(shù)對于VR視頻體驗(yàn)帶來的是強(qiáng)化的作用,具體來說主要有以下幾點(diǎn)。
第一點(diǎn),體育類的比較強(qiáng)調(diào)競技性或者競賽的內(nèi)容,是有時(shí)效性的。我們以前在學(xué)校的時(shí)候,看NBA的比賽,通常都是上課的時(shí)間,如果周末,你可以全程觀看,你的感受與下課之后再下載比賽的錄像再看,你的感受其實(shí)不一樣,因?yàn)槟阋呀?jīng)知道結(jié)果甚至已經(jīng)知道過程了,這個(gè)樂趣就少掉很多,這是直播本身特有的屬性,不僅限于VR。
第二點(diǎn),我們對VR周邊環(huán)境還會(huì)很好奇,如果我們對于這個(gè)過程和結(jié)果保持好奇心的話,會(huì)把更多注意力放在內(nèi)容本身。這樣有助于提升用戶的體驗(yàn),直播技術(shù)會(huì)使得我們場內(nèi)和場外的互動(dòng)成為可能。對于直播來說,這種可能性是存在的,而且我們已經(jīng)看到了這樣的嘗試,比如演唱會(huì)現(xiàn)場大屏幕和場外做直聯(lián),相當(dāng)于做一場直播,把現(xiàn)場變成一個(gè)大的秀場,場外觀眾通過網(wǎng)絡(luò)觀看可以獻(xiàn)花、送禮物有其他的互動(dòng)方式,這些結(jié)果會(huì)呈現(xiàn)在大屏幕上,可以實(shí)現(xiàn)場內(nèi)場外互動(dòng),以及包括明星與非現(xiàn)場粉絲之間產(chǎn)生互動(dòng)。
最后,通過直播的技術(shù),可以使虛擬的世界帶來比較現(xiàn)實(shí)的社交空間。舉個(gè)例子,我們接下來要做籃球賽的直播,雖然我和我的好友不能到現(xiàn)場看籃球比賽,但是我們可以待在各自家里,戴上VR頭盔看這樣一場直播,我們在同一個(gè)時(shí)間點(diǎn)在這個(gè)過程中間可以通過語音交互,不光可以看球還可以一起評論。如果我是一個(gè)行家,我可以通過這種方式形成一個(gè)我自己的私人演播室,我可以邀請周圍好友聽我給他們講球,這就是現(xiàn)實(shí)場景在虛擬世界的延伸。這樣的場景只有在直播技術(shù)下才可以實(shí)現(xiàn)。
直播的技術(shù)究竟是如何做到呢?我簡單說一下我們目前所采用直播系統(tǒng)的架構(gòu)。
VR視頻直播包含視頻的采集和音頻這兩塊,對于視頻來說采集到的視頻需要全景的拼接,再按照一定規(guī)則做投影,最后和傳統(tǒng)的直播就比較接近,做一些播控。對于音頻采集處理要特殊一點(diǎn),全景音頻處理非常困難,到目前為止還沒有特別成熟的解決方案,只能看到一些有深厚積累的公司在做嘗試,在直播場景下面也很難支撐到實(shí)施性的要求。在這一點(diǎn)上,后面我們還會(huì)繼續(xù)去做一些深入的探索。全景化之后我們會(huì)做音視頻加嵌編碼推流CDN分發(fā)和用戶觀看,這是我們采用的技術(shù)架構(gòu)。是不是所有團(tuán)隊(duì)都這樣做?不一定,未來我們是不是還會(huì)這樣做?也不一定。
未來VR直播技術(shù)會(huì)有哪些發(fā)展方向呢?說一下我個(gè)人的看法。
第一個(gè)方向,在我們剛才展示的架構(gòu)下面,以傳統(tǒng)直播技術(shù)體系做參照,以傳統(tǒng)直播體驗(yàn)做標(biāo)桿,從VR功能和性能的可靠性不斷逼近傳統(tǒng)的可靠性。以體育直播為例,因?yàn)檫@是一個(gè)傳統(tǒng)直播技術(shù)最高的品類,在直播過程當(dāng)中,我們其實(shí)通過傳統(tǒng)直播技術(shù)比在現(xiàn)場可能看得更好,你不一定感受到現(xiàn)場的氛圍,但你一定能看得更清楚,因?yàn)槟銜?huì)有慢動(dòng)作,會(huì)有及時(shí)的回放,休息期間還可以看到剛剛過去的賽事集錦,所有技術(shù)支撐來提升用戶的體驗(yàn)。類似這些東西,我們認(rèn)為對用戶體驗(yàn)有價(jià)值的東西,在VR直播技術(shù)當(dāng)中,我們都會(huì)考慮要把它實(shí)現(xiàn)。在VR直播技術(shù)當(dāng)中給用戶的體驗(yàn)是不是會(huì)有不同?只有試過才知道。
第二個(gè)方向,相對于現(xiàn)有傳統(tǒng)直播設(shè)備、技術(shù)、工作流程,我們有一套完整的、全新的基于IP、集合傳統(tǒng)直播功能的一站式軟硬件的解決方案,我們在現(xiàn)場有非常強(qiáng)大的工作站,它可以通過軟件技術(shù)實(shí)現(xiàn)原有直播當(dāng)中的所有設(shè)備的功能。基于IP前提為什么要加在這里呢?基于我們對超高分辨率技術(shù)采集的需求,這樣的需求對傳統(tǒng)直播也是一個(gè)瓶頸,傳統(tǒng)直播是非常成熟的解決方案,但是對于4K直播、對于4K體育直播,國內(nèi)還沒有成熟的解決方案。基于IP的話,這是一個(gè)方向,對于傳統(tǒng)直播來說也是一個(gè)方向。
第三種可能性,我認(rèn)為是完全面向未來基于云服務(wù)的自助式解決方案。我們在現(xiàn)場可能僅僅要做的事情就是信號(hào)的采集,采集完我們保持直接聯(lián)網(wǎng)的狀態(tài),隨時(shí)隨地把自己采集到的視頻流傳送到云端,后面所有一切工作由云端完成,這樣大大簡化現(xiàn)場的系統(tǒng)和部署,這樣有更好的靈活性。這是我認(rèn)為未來直播技術(shù)發(fā)展的方向。
我們現(xiàn)在不管是VR影視也好,還是VR直播也好,提升用戶體驗(yàn)還受到一些限制。
我把第一位排給了機(jī)位的稀缺度,俗話說“一白遮百丑”,如果你的機(jī)位距離主體足夠近,可能后面所有問題都是可忽略的,這是我的第一個(gè)觀點(diǎn)。后面的清晰度、流暢度這些是老生常談,所有的VR用戶抱怨都集中在這一塊。另外還有很深刻的影響就是交互的便利性,我在VR播放界面里面如何做操作,我想很多用戶都有這方面的難題。
下面一行其實(shí)是用戶端的瓶頸,我們現(xiàn)在大多數(shù)用戶還是通過手機(jī)來觀看,手機(jī)的解碼能力、功耗、頭動(dòng)時(shí)延,這些都會(huì)影響到用戶會(huì)不會(huì)暈眩,包括屏幕顯示效果,我們在實(shí)驗(yàn)的過程當(dāng)中都看到不同的差異,不同終端的表現(xiàn)不一樣。這些并不是直播技術(shù)本身的瓶頸,但是它也限制了直播技術(shù)給用戶帶來體驗(yàn)的提升。
如果我們單獨(dú)看VR直播技術(shù),它有下面一些瓶頸。
第一點(diǎn),我們現(xiàn)在傳統(tǒng)直播的設(shè)備、技術(shù)以及信號(hào)制作方法,對于VR模式是不友好的。
舉個(gè)例子來說,這是我們“昆侖決”直播信號(hào)里面的一張截圖,大家看一下底部加載logo的位置,誰能第一眼看到里面有昆侖決三個(gè)字呢?三種主色調(diào),藍(lán)色、黃色、紅色,紅色加著銀灰色就是昆侖決三個(gè)字,如果我在里面加載字幕,不能直接放在上面,要做處理,這樣觀眾看上去才是對的。還有一個(gè)問題,對于這種展開模式來說,在畫面不同的高度,它的畸變效果不一樣,如果在屏幕的正中間你可能不用做任何畸變,如果在頂部或者底部,你就要做到連他媽都不認(rèn)識(shí)的狀態(tài)。如果現(xiàn)在有一個(gè)特效從天上掉下來,它每移動(dòng)一幀像素就要做一次畸變的校正,這樣的工作怎么完成呢?
VR由于其視頻的獨(dú)特性,因?yàn)槭腔谇蛎?,我們現(xiàn)有的工具都是基于平面,其實(shí)在球面是不能支撐到的。我給大家展示的還是目前相對好的狀態(tài),至少我們可以有一種方式,有一種方法,先把這種預(yù)畸變做好,直播的時(shí)候再加載進(jìn)去。但這種方式是最通用的方式,對帶寬需求最高,如果我們用算法把帶寬降下來又是什么情況呢?
這是我們采用八面體的方式得到的畫面,誰能告訴我加字幕應(yīng)該怎么加?所以可以看到,整個(gè)產(chǎn)業(yè)鏈對VR內(nèi)容的模式來說是非常不友好的。
我們再看另外一個(gè)話題,就是帶寬。這塊大家討論都很多,有說30、50倍,其實(shí)我們不用說得那么夸張,至少5倍到10倍更高的帶寬需求是毫無疑問的。
剛才也提到客戶端的硬件性能,我們要更高的畫質(zhì),就要更高的分辨率,包括采用更有效的編碼手段。我們把制作精美并且高效壓縮的信號(hào)給到用戶之后,他打開只有黑屏,那就沒有任何意義。
另外,我們現(xiàn)有編碼優(yōu)化的經(jīng)驗(yàn),在VR觀看模式下是水土不服的。這里面要稍微解釋一下,投影和編碼其實(shí)是兩個(gè)不同的階段。這里的編碼優(yōu)化在長期以來是一直都存在的,對于傳統(tǒng)視頻在網(wǎng)絡(luò)上的傳播也是需要做編碼優(yōu)化的。我們試過有很多很好的編碼器,他們對于傳統(tǒng)的視頻做一個(gè)編碼壓縮之后,相同碼率下帶來30%左右的畫質(zhì)提升。同樣條件下在VR里面是怎樣呢?我們也做了一個(gè)對照測試,結(jié)果很超出我的預(yù)期。在基于電視或者是PC手機(jī)觀看模式下面,更優(yōu)的編碼優(yōu)化方式,在VR觀看模式下面效果最差。現(xiàn)在對于VR模式下的編碼優(yōu)化,沒有任何人有經(jīng)驗(yàn),之前所有的經(jīng)驗(yàn)都是基于PC、電視,這些經(jīng)驗(yàn)到了今天全部歸零。
我們?nèi)绾蝸泶蚱破款i最終實(shí)現(xiàn)對現(xiàn)場的超越呢?這也是微鯨VR對于自己的規(guī)劃。
首先,我們可以做6K和8K的原始數(shù)據(jù)采集,這是清晰度的技術(shù),至少在原端要保證超高清。
其次,我們會(huì)優(yōu)化投影和編碼兩個(gè)算法,目的就是要提升畫質(zhì),大幅度降低我們對帶寬的需求。投影這塊我們已經(jīng)有了很多研發(fā)投入,也有專利的布局,這塊工作已經(jīng)做得很到位了,但是編碼的優(yōu)化剛才也提到,我們剛剛發(fā)現(xiàn)比較震驚的結(jié)果,所有編碼優(yōu)化的成果到了VR面前都?xì)w零,后面在這塊我們也會(huì)加大投入。
最后,我們要對直播的技術(shù)做產(chǎn)品化,產(chǎn)品化最終影響是用戶最直觀的體驗(yàn),我們在直播的過程當(dāng)中,對內(nèi)容的延展,對實(shí)時(shí)數(shù)據(jù)做一些補(bǔ)充,對于增加互動(dòng)以及社交等等,讓用戶在觀看直播的時(shí)候,能夠更自在,能夠看到比現(xiàn)場更多。
比如我在觀看球賽的時(shí)候,如果在現(xiàn)場大屏幕上只能看到實(shí)時(shí)的比分和比較簡要的數(shù)據(jù)統(tǒng)計(jì),以及時(shí)間進(jìn)度等等很簡要的信息,在VR直播里面由于我們有360度空間,我們有足夠的空間來展示更多內(nèi)容,我們可以延展展示比如每個(gè)球員個(gè)人的信息,球隊(duì)過去的戰(zhàn)績等等,這些東西我們都可以放在背后,大多數(shù)時(shí)候你都可以關(guān)注比賽,但是你想知道這些信息的時(shí)候,轉(zhuǎn)身之后有一個(gè)瀏覽器在后面可以幫助你查詢所有數(shù)據(jù),這是內(nèi)容的延展。
另外我們可以承載更多實(shí)時(shí)數(shù)據(jù),在現(xiàn)場大屏幕都看不到的實(shí)時(shí)數(shù)據(jù)。此外就是互動(dòng),跟現(xiàn)場的互動(dòng),包括我前面舉的例子,在虛擬場景下面可以跟好友一起看球的社交體驗(yàn)。
我們認(rèn)為這些內(nèi)容做起來,作為一個(gè)獨(dú)立的產(chǎn)品本身,它能夠給用戶帶來一個(gè)非常好的體驗(yàn)。再加上我們的直播技術(shù),如果我們解決了清晰度的問題,解決了帶寬問題,我們能夠很清晰、很流暢觀看到現(xiàn)場,我們覺得就沒有必要再去現(xiàn)場。當(dāng)然對于不同人來說,還有不同的價(jià)值判斷,但對于大部分人來說多了一種選擇。所以如果我們做到這一點(diǎn),我期待下一次論壇大家都不用親自到這里來了,謝謝大家!
【913VR原創(chuàng)內(nèi)容,轉(zhuǎn)載請注明及回鏈】
]]>