自12月初以來,人們一直在探索OpenAI推出的對話AI ChatGPT神經(jīng)網(wǎng)絡(luò)的深度。近日,一位開發(fā)者讓這款對話AI吐出了有效的AR代碼。
OpenAI的ChatGPT對話AI針對生成文本和回答問題進行了優(yōu)化。但12月初的初步測試很快表明,該系統(tǒng)不僅可以回答一些措辭簡潔的句子,還可以回答編程代碼。
由ChatGPT生成的AR應用程序ChatARKit
開發(fā)者Bart Trzynadlowski想知道他是否能用ChatGPT開發(fā)一款AR應用程序,只用語音命令就可以在環(huán)境中自動放置數(shù)字3D物體。他還使用OpenAI的人工智能模型Whipser來識別語音命令,然后將它們作為人工智能提示帶入ChatARKit應用的JavaScript環(huán)境。

因此,ChatGPT能從Sketchfab中選擇與語音命令匹配的3D物體,并根據(jù)提示將它們放在桌面或地板上。如果接收到提示,ChatGPT甚至可以縮放和旋轉(zhuǎn)3D模型。人工智能系統(tǒng)會自行生成這方面的代碼。
據(jù)Trzynadlowski表示,這些是一些有效的提示樣本:
“在最近的平面上放置一個立方體。”
“將一個旋轉(zhuǎn)的立方體放在地板上?!?/p>
“把一輛跑車放在桌子上并旋轉(zhuǎn)90度?!?/p>
“把一輛校車放在最近的平面上,讓它沿著平面來回行駛?!?/p>
根據(jù)Trzynadlowski的說法,ChatGPT的工作并不可靠。對于相同的命令,人工智能模型會產(chǎn)生截然不同的輸出,并在應用程序中放置不正確的JavaScript代碼行。有時,ChatGPT會將對象描述轉(zhuǎn)化為代碼標識符,這意味著無法再從Sketchfab檢索到3D模型。
Trzynadlowski在Github上將他的ChatGPT AR應用作為開放源代碼免費提供。
用自然語言在VR中生成3D物體
對于VR,開發(fā)者Jasmine Roberts最近展示了OpenAI新的3D人工智能Point-E,像圖像人工智能DALL-E 2一樣,它可以僅基于文本輸入生成內(nèi)容。然而,Point-E生成的不是圖像,而是代表3D模型的3D點云。每次生成,Point-E在單個Nvidia V100 GPU上只需要大約一到兩分鐘。值得一提的是,Roberts的演示是實時運行的。
Point-E是OpenAI在文本轉(zhuǎn)3D合成方面進一步工作的起點。谷歌與Dreamfusion,以及Nvidia與Magic3D最近也推出了文本轉(zhuǎn)3D系統(tǒng),這可能在未來3D內(nèi)容的進一步傳播中發(fā)揮重要作用,而這也是元宇宙理論的一個基本假設(shè)。
來源:mixed-news








