Stable Diffusion 嵌入現(xiàn)實(shí)世界,能在墻上直接長出小貓咪,手機(jī)可玩

?? 由 文心大模型 生成的文章摘要

注意看,你面前是一堵平平無奇的墻。

現(xiàn)在,你可以按照自己的意愿,讓它直接憑空長出點(diǎn)東西來。

比如…… 一只小貓咪?

沒錯(cuò),Stable Diffusion 又可以搞新花活了!

這一次的重點(diǎn)在于,Stable Diffusion 的觸手?jǐn)U展到現(xiàn)實(shí)世界 —— 和 WebAR 相結(jié)合。

作者是個(gè)軟件工程師小哥 Stijn Spanhove,經(jīng)常在推特主頁發(fā)些關(guān)于 WebAR 或 XR 的視頻。

目前,這條憑空長貓的視頻熱度還挺不錯(cuò)。

新世界的大門打開,有網(wǎng)友對(duì) AR+SD 的興趣更濃了:

還有人說:

這簡直就是《反恐精英》一個(gè)酷斃了的新版本??!

一起來看看這個(gè)有點(diǎn)酷的新東西吧~

SD 與 AR 一起玩

首先,拿起手機(jī),然后隨意選擇一堵墻,透過屏幕界面鎖定它:

選定一塊心儀區(qū)域,把它圈起來,全部涂黑。

輸入提示詞:

一只可可愛愛的小貓咪,涂鴉風(fēng)格,數(shù)字藝術(shù)

接著點(diǎn)擊輸入框下方的 Diffusion 按鈕,直接快進(jìn)到見證奇跡的時(shí)刻。

此時(shí),無論從哪個(gè)角度看,墻上都有一幅《喵娜麗莎》在微笑地看著你了。

這個(gè)視頻,是小哥利用火到?jīng)]邊、門檻又低的 Stable Diffusion,結(jié)合 WebAR,搞出的第一個(gè)實(shí)驗(yàn)產(chǎn)品。

他在評(píng)論區(qū)和圍觀網(wǎng)友討論了具體的工作流程。

第一步,凍結(jié)幀,把它作為生成圖像的表面紋理,并讓它擁有世界定位和設(shè)備跟蹤相機(jī)。

第二步,向服務(wù)器發(fā)送 API 請(qǐng)求,并附上凍結(jié)幀(圖像)和文本提示(Stable Diffusion)。

整個(gè)工作中,將 Stable Diffusion 嵌入現(xiàn)實(shí)世界是利用 AR 完成的。

關(guān)于繪制紋理,小哥則使用了 Raycast(一款完全可擴(kuò)展的快捷啟動(dòng)器)。

整個(gè)過程簡單利落,引發(fā)了網(wǎng)友新的思考。

目前有很多有趣的 NPU(嵌入式神經(jīng)網(wǎng)絡(luò)處理器)硬件,手機(jī)的共享內(nèi)存也超過 12GB。

在這個(gè)前提下,如果 Stable Diffusion 和 AR 一起玩這個(gè)工作能在本地運(yùn)行,并且能夠快到在類似的請(qǐng)求時(shí)間內(nèi),完成整個(gè) 512×512 圖像生成,并在更快的 AI 上運(yùn)行升級(jí),一定非常有趣。

小哥自己也說,這個(gè)工作只是初嘗試,一切只是 Stable Diffusion 和 AR 結(jié)合的開始。

但大多數(shù)網(wǎng)友覺得這已經(jīng)是個(gè)很有趣的工作了,甚至想在上面“亂涂亂畫”好幾個(gè)小時(shí)。

AIGC 打破次元壁

Stable Diffusion 的風(fēng)吹進(jìn)現(xiàn)實(shí)世界,絕不是小哥一個(gè)人的想法。

具體的操作流程,基本都是在原基礎(chǔ)上用 AR 加持。

就在這幾天,另一位小哥用 Stable Diffusion,搞了個(gè)視頻透視式光學(xué)透視式眼鏡。

(擱這兒疊 buff 呢?)

具體來說,就是小哥用 Stable Diffusion 做了個(gè)虛擬的 AR 眼鏡,然后在手機(jī)屏幕上透過眼鏡鏡片,實(shí)現(xiàn) AR 效果。

生成的虛擬 AR 眼睛不僅有電量提示,透過它看現(xiàn)實(shí),能呈現(xiàn)西部世界、叢林、異形等多種畫面風(fēng)格。

此外,還有人結(jié)合 Meta 旗下的 AR 創(chuàng)作工具 Spark AR,利用 Stable Diffusion,假裝自己手握了一個(gè)方塊小卡片。

就是上面還能播放動(dòng)畫的那種。

為了達(dá)到逼真效果,作者還在卡片表面疊了一個(gè)反光圖層,讓卡片呈現(xiàn)的光澤“像玻璃杯一樣”。

不過,這次的 Stable Diffusion 產(chǎn)出的圖像不是實(shí)時(shí)生成,而是事先錄制的,因?yàn)楫?dāng)下的 Spark AR 版本還不支持 AI 和 ML。

“Very Nice,通過 Stable Diffusion,AI 和 AR 再一次緊密相連了?!?/p>

不管怎么說,Stable Diffusion 這么火,不僅靠的是跑出來的驚人結(jié)果,觸及文本生成圖像以外的領(lǐng)域時(shí),實(shí)力也很強(qiáng)勁呀~