
在1956年的達(dá)特茅斯會議上,日后被稱為“AI之父”的約翰·麥卡錫首先提出了“AI(Artificial Intelligence)”也就是AI這一概念。該會議確定了AI的目標(biāo)是“實現(xiàn)能夠像人類一樣利用知識去解決問題”。
時至今日,AI涉及的領(lǐng)域眾多,從語音合成到智能管家,而目前最為火熱也最為“出圈”的則是以AIGC為代表的生成式AI應(yīng)用,也就是由AI生成內(nèi)容。本文選取了目前AIGC領(lǐng)域中兩種最為主流的應(yīng)用進行簡述,并試圖探討AIGC與XR、元宇宙相互結(jié)合的可能性,希望能夠拋磚引玉,激發(fā)更多有識之士對于AI、XR等領(lǐng)域的興趣并促進相關(guān)領(lǐng)域的交流探討。
ChatGPT
如今提到AI,有一個名字無疑會首先涌入人們的腦海,這就是ChatGPT——自2022年11月30日發(fā)布以來就因為其流暢的“對話能力”而火遍全網(wǎng)。

ChatGPT是一種基于AI技術(shù)的自然語言處理模型,可應(yīng)用于多種場景,例如智能客服、聊天機器人、文章生成等等。就像我們熟知的Siri、小愛同學(xué),ChatGPT可以流暢的與我們對話并回答我們的問題,而其真正強大之處則在于,它會聯(lián)系對話的上下文,選擇符合當(dāng)前語境的內(nèi)容作答。
當(dāng)然,除了與用戶對話,ChatGPT可做之事數(shù)不勝數(shù),這里我想舉一個B站熱門視頻的例子來進一步說明這點。

視頻的內(nèi)容是關(guān)于一款名為「RedEye」的游戲的demo測試,這款游戲需要玩家點擊畫面中浮動的文字方塊,展開該物品的詳情,再將關(guān)聯(lián)的方塊結(jié)合到一起進而推進劇情。
根據(jù)該視頻的UP主也就是游戲制作者“人傻頭禿”的描述,這款游戲的靈感來自于日本開發(fā)者的游戲「Nodes」?!窷odes」是由一名叫做巖崎的制作人使用Unity獨立開發(fā)制作的,游戲短小卻很獨特,曾在Youtube上被眾多知名游戲主播進行直播游玩。雖然「RedEye」的靈感和玩法都借鑒自「Nodes」,但其大致劇情及部分文本則是由ChatGPT生成的。
這款游戲不需要精美的立繪,只需在直白的文字配上恰到好處的音效,再配合一些編程和耐心便可制作出來。由此可見,有了AI的幫助,就算是對美術(shù)或者編劇一竅不通的人,也可以做出令人耳目一新的游戲。而對于不會編程的人來說,ChatGPT依然是最佳選擇,因為他們甚至可以直接提出要求,讓ChatGPT幫忙進行代碼的編寫。

目前ChatGPT已經(jīng)更新到4.0版本,每一代更新都會讓其語言庫和數(shù)據(jù)庫更為豐富和強大,其能夠理解的詞匯也就越多。盡管目前ChatGPT由于政策法規(guī)等原因未能在國內(nèi)大規(guī)模普及,但其實已經(jīng)在世界范圍內(nèi)被越來越多的人接受并應(yīng)用在多個領(lǐng)域。
以我熟悉的游戲領(lǐng)域為例,我們已經(jīng)能夠看到將ChatGPT運用到游戲制作流程中的案例,比如更快更低成本的世界觀設(shè)定、角色設(shè)計(文字部分)、劇情腳本生成等等。未來我們在游戲中的角色或許可以真的生活在一座“人工城市”中,每個人都有自己的作息和愛好,人們會在不同的時間對不同的事情做出不同的反應(yīng),所有玩家都將獲得不同的游戲體驗。
這樣一個立體鮮活的虛擬世界隨著AI的不斷發(fā)展似乎就在前方不遠(yuǎn)的地方了。
Midjourney
說完了能夠自動生成文字的AI,接下來自然要說說能自動生成圖片的AI了。
Midjourney于2022年3月面世,創(chuàng)始人是David Holz。盡管它并不是第一個圖片生成AI,但憑借其龐大的數(shù)據(jù)庫,Midjourney很快就在眾多AI工具中站穩(wěn)腳步。
和其他AI工具不同的是,Midjourney的主站建立在Discord的聊天服務(wù)器之上,這也是為了避免被爬蟲和鏡像分流。因此用戶想要使用Midjourney,就需要一個Discord賬號才行。用戶在擁有賬號之后進入Midjourney服務(wù)器,在命令符后輸入想要的描述文字(prompt),之后Bot(機器人)將會根據(jù)描述文字生成4張圖片,而用戶也可以選擇最符合要求的那張繼續(xù)進行修繕。

總的來說,Midjourney在圖像生成方面具有很強的實用性和價值,可以廣泛應(yīng)用于計算機視覺、虛擬現(xiàn)實、游戲開發(fā)、電影制作等領(lǐng)域。而且由于美國版權(quán)局聲明了Midjourney生成出來的圖片不受版權(quán)保護,這也使得一些原先對AI十分抵制的創(chuàng)作者或?qū)⒃敢馐褂肕idjourney進行創(chuàng)作。
前一陣子就有國內(nèi)作者利用Midjourney創(chuàng)作了一部漫畫,并在視頻網(wǎng)站上發(fā)布了以它的序章為內(nèi)容的視頻。雖然這部名為「五行歸靈」的漫畫實際上只是插圖的堆砌,沒有分鏡可言,但已經(jīng)讓人們看到了AI繪圖的可能性——不需要經(jīng)年累月的練習(xí),誰都可以進行藝術(shù)創(chuàng)作。
于我而言,幾天的嘗試讓我覺得Midjourney對于我這種對繪畫略知一二的人來說十分適用。因為我可以預(yù)先畫好需要的草稿供AI參考,在AI生成圖片之后也有能力根據(jù)自己的需要略加修改。而如果是毫無繪畫基礎(chǔ)的人想要流暢使用Midjourney,可能還需要一些額外的努力。
可以預(yù)見的是,未來Midjourney的應(yīng)用前景將會更加廣闊:人們能夠更加輕松的將腦海中的圖像表現(xiàn)出來,將其做成精美的畫集或藝術(shù)品。
當(dāng)ChatGPT遇見Midjourney
通過以上介紹,我們簡單了解了目前AIGC的發(fā)展程度。現(xiàn)在我們可以用AI來生成文章,還可以用AI來生成圖片,那么如果我們先用ChatGPT撰寫文章,再用Midjourney生成對應(yīng)的圖片,我們會得到怎樣的作品呢?
首先我決定讓ChatGPT幫我寫一個故事。童話故事是一個很好的題材,畢竟它適合所有人閱讀。然而我又不希望ChatGPT從現(xiàn)有的童話故事中挑選一個給我,于是我增加了一點額外的要求——講一個黑童話。下面就是它所創(chuàng)作出來的故事內(nèi)容:

我本來以為會得到一個“黑暗白雪公主”或者“黑暗灰姑娘”的故事,沒想到ChatGPT確實給我講述了一個像是兒童睡前故事般的傳統(tǒng)的嚇唬人的童話。
接著,我再將故事中出現(xiàn)的女孩信息進行提取和總結(jié),梳理出如下描述:“穿著病號服的小女孩抱著玩具熊,玩具熊很詭異,小女孩頭發(fā)凌亂,表情瘋狂,周圍昏暗、不詳,背景是精神病院的病房。”
將其轉(zhuǎn)化為英文描述后,Midjoruney據(jù)此生成了這樣的結(jié)果:

可以看出Midjourney成功提取了大部分信息,生成出來的圖片十分真實,破敗的精神病院中女孩抱著泰迪熊,或憂郁或面無表情的看著鏡頭。無論是人物的頭發(fā)還是衣物表現(xiàn)都十分完美,女孩與背景的反差也令人心生憐憫。盡管每張畫面上多多少少還是會有一些瑕疵,但如果對外行人聲稱這是一張“攝影作品”也足以蒙混過關(guān)。
而在使用了Midjourney另一種十分成熟的風(fēng)格——“Niji version 5”模型之后,我得到了如下的圖片:

可以看出這次的結(jié)果更加唯美和可愛?!皀iji”即“二次元”,這個模型參考了許多日本畫師的作品,使得生成出來的結(jié)果更偏向動漫。
前者十分適合作為電影海報或者插圖,后者則適用于各種輕小說、游戲、動漫作品。不過無論是哪種,效果都已經(jīng)十分成熟且令人滿意。
目前已經(jīng)有人使用AI來生成劇本并配以畫面,AI創(chuàng)作的游戲和漫畫也開始層出不窮?;蛟S在未來,AI真的可以替代人類進行創(chuàng)作,不過我還是相信,至少在創(chuàng)作層面,AI還無法完全替代人類優(yōu)秀的想象力。
AIGC和XR
盡管AI從概念到應(yīng)用已有幾十余年時間,但像ChatGPT這種突破性應(yīng)用的出現(xiàn)其實才有幾個月。誰也不知道在將來的什么時候,AI就會迎來它的下一次突破,而接下來就是與XR發(fā)生交集的時候,因為這兩項科技本身就存在千絲萬縷的聯(lián)系。

拿ChatGPT來說,它可以用于創(chuàng)建用戶在虛擬世界里的智能助手,智能助手可以通過自然語言與用戶進行交流,并提供幫助和指導(dǎo);也可以用于虛擬環(huán)境下的自然語言生成,例如生成虛擬角色的對話內(nèi)容或虛擬環(huán)境的文字描述等等。
而Midjourney作為一種圖像生成AI應(yīng)用,可以生成高質(zhì)量、多樣化的圖像。這些圖像可以構(gòu)建虛擬世界的場景甚至是紋理貼圖,從而讓用戶獲得更加真實、細(xì)膩的虛擬環(huán)境并更好的沉浸其中。
盡管現(xiàn)在的Midjourney僅能通過輸入文字和關(guān)鍵詞的形式生成圖片,但在未來與XR的結(jié)合下,用戶或許可以使用語音與AI對話,通過語音轉(zhuǎn)換等功能,用戶只需動動嘴便可以生成需要的圖片,甚至是360°的全景圖或者3D模型。
眾所周知,XR最重要的特點就是沉浸感,而單一重復(fù)的素材將有可能造成沉浸感的削弱,而AI所帶來的可能性和不確定性將會讓XR沉浸體驗更上一層樓。畢竟誰不想有一個擁有獨特外貌且不只是說一些套話的虛擬伙伴陪在身邊呢?
寫在最后:AI的罪與罰
最后我想簡單探討一下AI的負(fù)面影響。有趣的是,目前AI大部分的負(fù)面影響都是基于人們過去和現(xiàn)在的想象,而不是現(xiàn)實。生活中許多人對于AI抱有消極態(tài)度,而在科幻電影中,AI的暴走與革命更是一個經(jīng)久不衰的主題。
畢竟,現(xiàn)階段人們或多或少對AI存在擔(dān)心和抵觸。無論是技術(shù)人員對于職位被替代的恐懼,還是藝術(shù)家對于版權(quán)的擔(dān)憂,又甚至是擔(dān)心出現(xiàn)影視作品中所描繪的大規(guī)?!皺C器覺醒”,這些都是正常且可以理解的。再加上社會中的確存在一些激進分子,他們不顧一切的反對那些排斥AI的人,而這又使得現(xiàn)在使用AI的用戶在人們眼中的形象進一步下降。

然而從目前來看,AI已經(jīng)成為一種不可避免的趨勢。它的快速、它的便捷、它的種種,已經(jīng)決定了在可以預(yù)見的非常多的場景之中,人類將離不開AI的輔助。
AI的本質(zhì)是工具,這就好像刀槍棍棒,發(fā)明的初衷并不是為了傷害他人,只有在不同的人手中才會體現(xiàn)其不同的價值。因此,比起AI是否應(yīng)該存在,如何將AI為我所用、將其用在正確的方向上,才是接下來我們應(yīng)該認(rèn)真思考的問題。








