技術(shù)跨界:當(dāng)AI遇見VR/AR,會(huì)發(fā)生什么?

?? 由 文心大模型 生成的文章摘要
AI與VR/AR,皆為當(dāng)前高新技術(shù)的大熱點(diǎn)。據(jù)全球最大的IT研究與咨詢公司Gartner在2020年發(fā)布的未來五到十年內(nèi)將帶來重大機(jī)遇的十大技術(shù)趨勢(shì),前兩大趨勢(shì)分別與AI與VR有關(guān)。其中的趨勢(shì)1:超自動(dòng)化(Hyper automation),其目標(biāo)是綜合利用人工智能(AI)和機(jī)器學(xué)習(xí)(ML)等手段,實(shí)現(xiàn)流程自動(dòng)化和增強(qiáng)人類的工作能力;趨勢(shì)2:多元體驗(yàn)(Multi-experience),目標(biāo)是通過AR,VR,MR等技術(shù)帶來身臨其境的體驗(yàn),將目前的單點(diǎn)交互演變?yōu)橐钥纱┐髟O(shè)備和傳感器等為基礎(chǔ)的多點(diǎn)交互。那么,如果將AI與VR/AR結(jié)合呢,會(huì)發(fā)生什么?
AI(人工智能)
我們先來梳理一下人工智能(AI),以及相關(guān)的機(jī)器學(xué)習(xí)(ML)和深度學(xué)習(xí)(DL)等熱點(diǎn)概念。大家所談?wù)摰娜斯ぶ悄芸梢苑譃閮蓚€(gè)層面:“強(qiáng)人工智能”和“ 弱人工智能”。其中:
弱人工智能
希望借鑒人類的智能行為,研制出更好的工具以減輕人類智力勞動(dòng),類似于“高級(jí)仿生學(xué)”。
強(qiáng)人工智能
希望研制出達(dá)到甚至超越人類智慧水平的人造物,具有心智和意識(shí)、能根據(jù)自己的意圖開展行動(dòng),可謂“人造智能”。
AI技術(shù)現(xiàn)在所取得的進(jìn)展和成功,是緣于“弱人工智能”而不是“強(qiáng)人工智能”的研究。要想讓AI借鑒人類的智能行為,關(guān)鍵的一個(gè)環(huán)節(jié)是讓AI模擬人類的學(xué)習(xí)行為。
所以,這里面有個(gè)非常關(guān)鍵的技術(shù),叫做機(jī)器學(xué)習(xí)。
機(jī)器學(xué)習(xí)是專門研究計(jì)算機(jī)怎樣模擬或?qū)崿F(xiàn)人類的學(xué)習(xí)行為,以獲取新的知識(shí)或技能,重新組織已有的知識(shí)結(jié)構(gòu)使之不斷改善自身的性能。機(jī)器學(xué)習(xí)是人工智能的核心,是使計(jì)算機(jī)具有智能的根本途徑,其應(yīng)用遍及人工智能的各個(gè)領(lǐng)域,它主要使用歸納、綜合而不是演繹。
目前的機(jī)器學(xué)習(xí)可以分為三大類:
(1)有監(jiān)督的學(xué)習(xí)
數(shù)據(jù)具備特征(features)和預(yù)測目標(biāo)(labels),又分為:
二元分類
多元分類
回歸分析
(2)無監(jiān)督的學(xué)習(xí)
從現(xiàn)有數(shù)據(jù)并不知道預(yù)測的答案,無預(yù)測目標(biāo)(labels)
(3)強(qiáng)化學(xué)習(xí)
通過定義的動(dòng)作、狀態(tài)和獎(jiǎng)勵(lì)不斷訓(xùn)練,使其學(xué)會(huì)某種能力。
機(jī)器學(xué)習(xí)有一個(gè)很有意思的技術(shù),叫做人工神經(jīng)網(wǎng)絡(luò)。
人工神經(jīng)網(wǎng)絡(luò)(ANN:Artificial Neural Network)是一種模擬人腦神經(jīng)網(wǎng)絡(luò)以期能夠?qū)崿F(xiàn)類人工智能的機(jī)器學(xué)習(xí)技術(shù)。它可實(shí)現(xiàn)函數(shù)逼近、數(shù)據(jù)聚類、模式分類、優(yōu)化計(jì)算等功能。 因此,神經(jīng)網(wǎng)絡(luò)廣泛應(yīng)用于人工智能、自動(dòng)控制、機(jī)器人、統(tǒng)計(jì)學(xué)等領(lǐng)域的信息處理中。
通過這兩張圖的對(duì)比,我們可以看到,機(jī)器學(xué)習(xí)中的人工神經(jīng)網(wǎng)絡(luò)很好地借鑒了人類神經(jīng)網(wǎng)絡(luò)的特點(diǎn),是一種非常有意思的仿真。
而深度學(xué)習(xí)是一種特殊的機(jī)器學(xué)習(xí),是機(jī)器學(xué)習(xí)研究中的一個(gè)新領(lǐng)域,其動(dòng)機(jī)在于建立、模擬人腦進(jìn)行分析學(xué)習(xí)的神經(jīng)網(wǎng)絡(luò),它模仿人腦的機(jī)制來解釋數(shù)據(jù),例如圖像,聲音和文本。
深度學(xué)習(xí)能直接對(duì)大量數(shù)據(jù)進(jìn)行表征學(xué)習(xí),來替代手工獲取特征。深度學(xué)習(xí)與傳統(tǒng)機(jī)器學(xué)習(xí)最主要的區(qū)別在于:隨著數(shù)據(jù)規(guī)模的增加其性能也不斷增長。引發(fā)深度學(xué)習(xí)熱潮的一個(gè)標(biāo)志性事件是:2016年3月,AlphaGo(谷歌旗下DeepMind研發(fā))擊敗了李世石九段。
相應(yīng)的,深度學(xué)習(xí)有一個(gè)非常重要的技術(shù),叫做卷積神經(jīng)網(wǎng)絡(luò)。卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network, CNN)是一種典型的深度神經(jīng)網(wǎng)絡(luò),它避免了對(duì)圖像的復(fù)雜前期預(yù)處理,可以直接輸入原始圖像,因而得到了更為廣泛的應(yīng)用。
我們用一張圖來梳理一下人工智能、機(jī)器學(xué)習(xí)、深度學(xué)習(xí)的關(guān)系:
VR/AR與AI的跨界關(guān)聯(lián)
1. VR對(duì)AI的需求
(1)制約VR/AR發(fā)展的一個(gè)很重要因素,是3D內(nèi)容的產(chǎn)能
3D內(nèi)容(包括3D模型、3D動(dòng)畫,和3D交互等)是VR/AR核心之一。然而,目前各個(gè)領(lǐng)域的3D內(nèi)容尚需要大量人工進(jìn)行制作,而且對(duì)制作人員的門檻要求相對(duì)較高,因而產(chǎn)能非常低,這是制約相關(guān)行業(yè)發(fā)展的一大瓶頸。而AI則有望一定程度上實(shí)現(xiàn)3D內(nèi)容制作的自動(dòng)化,替代部分重復(fù)勞動(dòng),并提升制作效率。
(2)VR/AR需要更加自然的交互
VR和AR的目標(biāo)都包含了更加自然的交互,這正是AI要解決的目標(biāo)之一。
(3)VR/AR需要更強(qiáng)的智能
AlphaGo和AlphaZero證明了AI在一定領(lǐng)域內(nèi)的智能,而這些領(lǐng)域與VR和AR存在重合,有望彌補(bǔ)VR和AR的智能性。
2. AI對(duì)VR的需求
(1)AI需要可視化的賦能效應(yīng)呈現(xiàn)
AI的賦能效應(yīng),對(duì)于普通人而言是很難直觀理解的,在諸如教育等很多場景中,人們都需要可視化的手段來呈現(xiàn)和輔助理解AI運(yùn)用之后的效果。
(2)AI需要落地的應(yīng)用場景
AI經(jīng)歷了自2016年以來的大熱,到今天,不管是投資人,還是普通百姓,并沒有完全看到AI在所有應(yīng)用場景都能落地,于是,AI泡沫論喧囂而上。而VR與AR能在很大程度上拉近AI與行業(yè)實(shí)際用戶的距離,助力AI的落地。
3.與VR密切相關(guān)的人工智能
圖像識(shí)別-分類
圖像識(shí)別-檢測
圖像語義分割/實(shí)例分割
圖像/圖形檢索
圖像/圖形生成
強(qiáng)化學(xué)習(xí)、模仿學(xué)習(xí)