三問Rokid

?? 由 文心大模型 生成的文章摘要

4月20日,Rokid舉辦了Rokid Open Day 2024活動,同時發(fā)布了一款空間計算新產(chǎn)品——Rokid AR Lite空間計算套裝。平心而論,這款產(chǎn)品給我們的第一印象還是很不錯的,時尚的外觀,金屬磨砂的質(zhì)感,的確很具備吸引力。

然而在深入的了解了Rokid AR Lite的功能后,卻讓我們對這款所謂的「空間計算套裝」產(chǎn)生了三個疑問,希望能夠得到Rokid官方的解答。

01 你的空間是什么空間,你的計算又在計算什么?

去年6月,蘋果在WWDC上發(fā)布了Vision Pro。根據(jù)蘋果官方的說法,Vision Pro是一臺空間計算機(Spatial Computer),瞬間帶火了空間計算這一概念。

盡管蘋果官方并沒有給空間計算下一個直接的定義,但還是在官方的新聞中,還是給Vision Pro的能力做了一個詳細的表述,這里我們直接放原文吧:

“Apple Vision Pro打造無邊際畫布,讓app突破傳統(tǒng)顯示屏的限制,為用戶帶來全新的3D 交互體驗,以最自然、最直觀的輸入方式來控制——眼睛、雙手與語音。Apple Vision Pro 搭載全球首創(chuàng)的空間操作系統(tǒng) visionOS,通過用戶與數(shù)字內(nèi)容互動的模式,讓數(shù)字內(nèi)容如同存在于真實世界?!?/strong>

不難看出其中的幾個關(guān)鍵詞:無邊際畫布,突破傳統(tǒng)顯示屏的限制,3D交互體驗,讓數(shù)字內(nèi)容如同存在于真實世界。這幾個詞也很好的描述了空間計算應(yīng)該是什么模樣。

實際上,如果用心揣摩這段話的意思,大家應(yīng)當(dāng)能夠理解到,空間計算消除了傳統(tǒng)屏幕的框架,以現(xiàn)實世界為畫布,數(shù)字內(nèi)容可以存在于現(xiàn)實世界的任何角落,并與周圍環(huán)境很好的融合在了一起,同時因為傳統(tǒng)的屏幕概念消失,交互方式也應(yīng)當(dāng)出現(xiàn)變革,由平面2D交互向空間交互轉(zhuǎn)變。更簡潔一點的表述可以概括為:空間計算,是用計算的方式讓數(shù)字內(nèi)容和現(xiàn)實世界相融。

張藝謀的電影《英雄》中,曾經(jīng)描述了劍術(shù)的三層境界:

第一層:手中有劍,心中有劍;

第二層:手中無劍,心中有劍;

第三層:手中無劍,心中也無劍;

這種劃分用到空間計算上來,也恰如其分。

第一層,畫面有屏,設(shè)備有屏;意思是不僅在硬件上依靠顯示屏,在人眼中的畫面依然要受到一塊虛擬屏幕的束縛,這種恐怕不能稱之為空間計算,稱為HMD或者HUD更合適;

第二層,畫面無屏,設(shè)備有屏;意思是盡管硬件上需要顯示屏充當(dāng)顯示模塊的一部分,但人眼中的畫面不會再受到虛擬屏幕的束縛,眼光所及皆是畫布,都能呈現(xiàn)出數(shù)字內(nèi)容,并且與真實世界相融合。這是空間計算的入門標準,是現(xiàn)階段技術(shù)體系下對空間計算的實踐,Vision Pro就處于這樣一個層次,HoloLens 1/2、Magic Leap 1/2、Quest Pro以及Quest 3等等具備MR能力的設(shè)備也都基本可以納入這一層次;

第三層,畫面無屏,設(shè)備也無屏;意思是硬件上不再需要傳統(tǒng)的顯示屏充當(dāng)現(xiàn)實模塊,人眼中的畫面也不受到虛擬屏幕邊界的束縛。這是空間計算的終極形態(tài),或許需要腦機接口真正實現(xiàn)后才能達成。

然而處處標榜自己為空間計算OST路線代表、時時刻刻不忘記對標Vision Pro的Rokid,在Rokid AR Lite的宣傳上卻玩了一手“偷天換日”的把戲,給大家灌輸空間計算就是“空間大屏”、“空間多屏”的概念,與空間計算真正的理念,恐怕不說是背道而馳吧,那也是南轅北轍了。

因為歸根到底,Rokid AR Lite空間計算套裝所謂的“空間大屏”、“空間多屏”和現(xiàn)實空間并沒有任何的關(guān)系。

仔細查看Rokid AR Lite空間計算套裝的規(guī)格參數(shù),只在Rokid Max 2眼鏡和Station 2的機身里各搭載了一個IMU單元,還有一個距離傳感器要于檢測用戶是否佩戴眼鏡,并沒有其他任何能用于感知外部環(huán)境的傳感器。

因此,Rokid AR Lite的畫面,錨定的并不是現(xiàn)實空間中某個位置的映射,而是一個和周圍空間沒有任何映射關(guān)系、由IMU數(shù)據(jù)得出的初始姿勢。

換而言之,由于Rokid AR Lite并沒有SLAM(同步定位和建圖)的能力,它既無法確定自己在現(xiàn)實空間中的位置,也無法感知空間的環(huán)境是一個什么模樣,自然也談不上數(shù)字內(nèi)容和真實世界的融合,又怎么能夠稱得上是一臺空間計算設(shè)備呢?

實際上,更早發(fā)布的Rokid Air這款產(chǎn)品中,Rokid官方已經(jīng)給這種畫面有屏,設(shè)備有屏的顯示方式給出了很清晰的定義:虛擬屏幕。難道在Rokid的理解中,有虛擬屏幕就是空間計算嗎?

那么在這里我們想問Rokid提出第一個問題:關(guān)于Rokid AR Lite空間計算套裝,你說的空間是什么空間,你說的計算又在計算什么?

02 無SLAM,不空間計算

《從星際之旅到空間計算:我們發(fā)現(xiàn)計算機正通過SLAM重構(gòu)世界》一文中,我們就曾經(jīng)詳細介紹過,基于攝像頭的SLAM技術(shù)給予了計算機對世界的感知能力,是走向空間計算時代必不可少的技術(shù)底座。

盡管在接受媒體采訪時,Rokid創(chuàng)始人祝明銘解釋過為什么Rokid AR Lite不搭載「單目攝像頭+手勢交互」方案,表示攝像頭在日常使用對于其他人的打擾,而不管是觸摸還是空間射線模式,都是更「靜默」的交互方式,因此Rokid AR Lite摒棄了攝像頭交互模式。

但這個回答其實只解答了問題的一半。

▲Rokid AR Studio
▲Rokid AR Studio

去年發(fā)布的Rokid AR Studio采用了「單目攝像頭+3D手勢交互」的方案,Rokid聲稱,Rokid Max Pro僅在雙目中間多了一個攝像頭,機身重量僅增加1g,卻具備了“以手勢交互為核心的空間計算能力”,可實現(xiàn)SLAM、微手勢交互、第一視角分享、視覺定位VPS能力。帶領(lǐng)AR行業(yè)進入軟件和生態(tài)建設(shè)的第二階段。

在去年舉辦的2023 Rokid Jungle活動上,我們曾經(jīng)體驗過Rokid AR Studio套裝,在試用手勢交互時,總是會感受到一絲絲的違和——虛擬渲染的手部模型與實際手部的位置總是存在著一定的誤差。

當(dāng)然,這可能是單目攝像頭方案的固有缺點——尺度信息的不足很容易造成對深度估計的錯誤,從而影響到手部定位的精確性。因此,如果從技術(shù)成熟度來考慮并刪掉了手勢交互,尚且算是一個合理的原因。

但是,連帶著在Rokid AR Lite上直接砍掉了單目攝像頭,卻還要繼續(xù)標榜自己是一款空間計算設(shè)備,就是我們難以理解的舉動了。單目攝像頭并不僅僅用于交互,還承擔(dān)了SLAM、視覺定位的功能。

祝明銘沒有解答的那一半問題,是Rokid AR Lite為什么去掉了SLAM功能,而這恰恰就是空間計算的核心。

本來單目方案的Rokid AR Studio就只能和空間計算扯上一半關(guān)系——如果你翻閱過Rokid AR Studio的開發(fā)文檔,就會發(fā)現(xiàn)它只向開發(fā)者開放了6DoF追蹤的能力。

對比下Quest 3的開發(fā)者文檔,里面有相當(dāng)重要的一部分是關(guān)于Scene Model,也就是Quest 3會如何感知周圍環(huán)境并提供哪些數(shù)據(jù)給開發(fā)者。

現(xiàn)在Rokid AR Lite空間計算套裝連這一半關(guān)系都丟掉,僅剩下個3DoF能力。

就像是你想買輛野馬,結(jié)果買到了一匹野馬。盡管老婆餅里可以沒有老婆,消費者可能還是希望空間計算套裝里,真的有空間計算吧?

再換一個角度來說,即使Rokid真的擔(dān)心攝像頭對他人的打擾,實現(xiàn)SLAM的傳感器可不止視覺一種方案, 像ToF深度傳感器這樣的非可見光方案依然是一個可選項。

這里我們想向Rokid提出第二個問題,空間計算設(shè)備不做SLAM,到底是成本問題、技術(shù)問題、還是態(tài)度問題?

03 Fake It Till You Make It,要搞噱頭,更要重視產(chǎn)品力

「Fake it till you make it」是硅谷秘而不宣的創(chuàng)業(yè)潛規(guī)則,指先吹噓你的想法,再通過吸引資本和人才的方式努力地在現(xiàn)實中追趕你的目標,直到你實現(xiàn)了它。

對于創(chuàng)業(yè)公司來說,這么做并無可厚非,關(guān)鍵還是在于要讓人們相信,你在努力的「make it」。

如果說Rokid AR Studio還能展現(xiàn)出Rokid對于空間計算「make it」的意志,那么Rokid AR Lite空間計算套裝,則是宣發(fā)攻勢掩蓋下的躺平和擺爛。

不知什么時候開始,長定語修飾下的首創(chuàng)/第一/最大/最多等等詞匯開始被濫用,先不提這么說違不違反廣告法,只要定語夠長,一頭豬也能被定義個第一出來,畢竟定語的解釋權(quán)在說出這句話的人手里。

例如出現(xiàn)在本次Rokid Open Day海報中的「消費級AR分體式設(shè)備首創(chuàng)的多指多手勢觸控」,去掉任何一個定語還成立嗎?這種交互方式真的很新穎嗎?任何一臺筆記本連上支持的投屏眼鏡能不能實現(xiàn)接近的效果?通過2D的觸摸板和3D的內(nèi)容去交互,和在手機上直接玩3D游戲的邏輯有質(zhì)的飛躍嗎?這和空間計算需要的空間交互有一丁點的關(guān)聯(lián)嗎?

研發(fā)了一種操作映射首創(chuàng)一種交互方式,學(xué)到了!容我再多句嘴,Rokid AR Lite的多點觸控和Mac上的Multi-Touch手勢這么像,拿到專利授權(quán)了嗎?

在文字上?;屖荝okid的老慣例了。

再比如去年3月份,Rokid CEO祝明銘在朋友圈表示6W臺Rokid Air已經(jīng)全部售出,稱把“AR行業(yè)帶入消費者時代”,但實際上根據(jù)我們從一些第三方渠道了解到的信息,這6W臺Rokid Air中的大部分(或超過5W臺)并非流入消費者手中,而是流向了B端,主要是博物館在使用。而且Rokid存在一種銷售模式,即先將Rokid Air銷售給入股企業(yè),然后由入股企業(yè)以租賃的方式進入博物館中,運營收益進行分成,和真正的消費市場關(guān)聯(lián)可能并不大。

有興趣的讀者可以去搜索一下22年7月份界面新聞關(guān)于海外做空機構(gòu)灰熊對蔚來和武漢蔚能的調(diào)查,但我們要事先聲明我們的觀點:兩件事情毫無關(guān)聯(lián),僅作為一個有意思的拓展閱讀。

去年7月底,祝明銘同樣在朋友圈發(fā)布了一條信息,稱谷歌攜手Rokid,打造全球首款A(yù)R版Andorid TV設(shè)備。也許是我們的閱讀能力還不夠吧,總是會把祝明銘在朋友圈發(fā)的話曲解成谷歌和Rokid一起研發(fā)了AR版Andorid TV——Rokid Station(全球版),谷歌還會幫助Rokid做全球的發(fā)布和銷售。

但是實際上事情要更簡單一些,Rokid和海美迪合作開發(fā)了Rokid Station(全球版),然后拿去申請谷歌的Android TV認證,并且通過了。

中間為什么多出了海美迪?因為海美迪是電視機頂盒出海的老牌企業(yè),對Android TV認證十分熟悉。

如果你去搜索外網(wǎng)的新聞,你會發(fā)現(xiàn)在外網(wǎng)的新聞報道中,并沒有出現(xiàn)“谷歌攜手Rokid”這種描述,大家通常的表述是Google-Certified(谷歌認證),甚至是在Rokid自己發(fā)布的英文通稿中,我們也未找到任何Rokid Google Partnership這樣的字眼,所謂的“谷歌攜手Rokid”,完全是一條國內(nèi)的“專供新聞”。這種不一致的表述,是覺得媒體老師們接觸不到外網(wǎng)的新聞,還是對巨頭的法務(wù)部有所畏懼呢?

▲圖源:https://rokid.ai/worlds-1st-google-certified-android-tv-box-for-ar/
▲圖源:https://rokid.ai/worlds-1st-google-certified-android-tv-box-for-ar/

當(dāng)然了,創(chuàng)業(yè)公司搞搞噱頭吸引一下媒體的注意力,增加一些曝光,也不是什么大不了的事情嘛,有曝光才能有資本關(guān)注,有資本的支持創(chuàng)業(yè)公司才能發(fā)展壯大。

但是既然Rokid目前已經(jīng)是國內(nèi)融資最多的AR創(chuàng)企了,短短一兩年的時間里融資融了十幾億,是不是應(yīng)該在搞噱頭之外,為消費者呈上更好的空間計算硬件呢?

如果說Rokid Station使用電視機頂盒級別的低端芯片是因為Rokid Station的本質(zhì)就是個便攜機頂盒,那么都開始強調(diào)空間計算了,都要從2D向3D升維了,為什么還要在Station 2上使用高通驍龍6 Gen 1這款千元機才會用的低端芯片?是因為這款芯片的3D渲染能力出眾嗎?

不妨再多問一句,2022年4月,曾經(jīng)有媒體報道過Rokid與安謀科技聯(lián)合研發(fā)Rokid AR芯片。2年時間過去了,這款芯片的研發(fā)進度如何?什么時候能正式面世?

▲圖源:量子位
▲圖源:量子位

當(dāng)Vision Pro在用M2+R1這種強力的芯片組合,努力的向消費者們呈現(xiàn)空間計算的潛力,號召開發(fā)者們開發(fā)原生的vision OS應(yīng)用,而不是簡單的將iPad/iPhone應(yīng)用移植時;處處對標蘋果的Rokid,卻在Rokid AR Lite空間計算套裝上使用千元機級別的芯片,將觸屏操作當(dāng)做創(chuàng)新,指著對周圍現(xiàn)實世界一無所知的傳統(tǒng)2D/3D應(yīng)用,告訴消費者和開發(fā)者,這就是空間計算,不會覺得有些諷刺嗎?

祝明銘曾說過,「未來的 3 到 5 年,Rokid 將會有一個使命,就是把大家的眼鏡換成智能眼鏡,所有的眼鏡默認就是智能的,就像現(xiàn)在所有的手機默認是智能的一樣?!?/strong>

但是這一目標,在我們看來并不能依靠低價策略和對核心體驗的刪減來實現(xiàn)。

IDC數(shù)據(jù)顯示,2023年全球AR眼鏡銷量51萬臺,以平價的觀影類AR眼鏡和信息提示類AR眼鏡為主。2024年1月29日Vision Pro開啟預(yù)售后,短短一個月的時間內(nèi)售出就超過20萬臺。

這證明了一點,消費者是有意愿為優(yōu)秀的體驗買單甚至是付出高昂溢價的,高端市場大有可為。

而VR行業(yè)暴風(fēng)魔鏡與VR紙盒眼鏡的黯淡離場,也早已身體力行的告訴我們,如果設(shè)備體驗達不到一個底線,再便宜也不會有人愿意買單,還讓人們將VR和低劣的體驗掛上了等號,對整個行業(yè)造成了巨大的傷害。低端產(chǎn)品搶占消費市場的邏輯,在XR行業(yè)真的走得通嗎?

這里,我們想向Rokid拋出最后一個問題:在Rokid眼中,空間計算設(shè)備的底線在哪里,才不會透支消費者對空間計算的好奇心?

「93913原創(chuàng)內(nèi)容,轉(zhuǎn)載請注明出處」