
在人工智能領(lǐng)域持續(xù)掀起創(chuàng)新浪潮的Meta,于近日重磅推出最新人工智能模型V-JEPA 2。Meta官方宣稱,該模型“在物理世界中實(shí)現(xiàn)了最先進(jìn)的視覺理解和預(yù)測(cè),從而極大提高了AI智能體的物理推理能力”。與此同時(shí),Meta還發(fā)布了三個(gè)全新的基準(zhǔn),旨在為評(píng)估現(xiàn)有模型從視頻推斷物理世界的能力,提供更為精準(zhǔn)、科學(xué)的標(biāo)準(zhǔn)。
作為去年V-JEPA模型的擴(kuò)展版本,V-JEPA 2的誕生標(biāo)志著人工智能在理解現(xiàn)實(shí)世界方面邁出了關(guān)鍵一步。該模型能夠讓人工智能深度理解3D環(huán)境,精準(zhǔn)推理物理世界的運(yùn)作規(guī)律。對(duì)于機(jī)器人和其他人工智能主體而言,V-JEPA 2就像是賦予了它們“智慧之眼”與“思考之腦”,使其不僅能夠理解物理世界的現(xiàn)狀,還能憑借強(qiáng)大的算法和訓(xùn)練數(shù)據(jù),預(yù)測(cè)物理世界將如何對(duì)自身行動(dòng)做出反應(yīng)。
Meta透露,V-JEPA 2是一個(gè)擁有12億參數(shù)的龐大模型,其經(jīng)過了超過100萬小時(shí)視頻素材的高強(qiáng)度訓(xùn)練。如此海量的數(shù)據(jù)輸入,使得V-JEPA 2在物理世界中實(shí)現(xiàn)了領(lǐng)先的視覺理解和預(yù)測(cè)性能。舉例來說,當(dāng)一個(gè)球從桌子上滾落時(shí),V-JEPA 2能夠迅速識(shí)別出球會(huì)因重力作用而掉落;即便物體暫時(shí)隱藏在視野之外,該模型也不會(huì)認(rèn)為物體就此消失,而是基于物理規(guī)律持續(xù)追蹤其存在狀態(tài)。這種對(duì)物理現(xiàn)象的準(zhǔn)確認(rèn)知和預(yù)測(cè)能力,遠(yuǎn)超以往同類模型。
在實(shí)際應(yīng)用層面,V-JEPA 2展現(xiàn)出了巨大的潛力。Meta認(rèn)為,在自動(dòng)駕駛汽車、送貨機(jī)器人等領(lǐng)域,V-JEPA 2具備顯著優(yōu)勢(shì)。這些應(yīng)用場(chǎng)景往往環(huán)境復(fù)雜多變,充滿了不確定性和突發(fā)狀況,而V-JEPA 2能夠幫助設(shè)備在這樣的環(huán)境中安全、高效地運(yùn)行。與其他依賴大量標(biāo)記數(shù)據(jù)或視頻片段來學(xué)習(xí)的模型不同,V-JEPA 2另辟蹊徑,通過簡(jiǎn)化后的“潛在空間”進(jìn)行推理。它能快速分析物體的移動(dòng)軌跡、相互作用方式以及對(duì)不同刺激的響應(yīng)模式,從而為智能體的決策提供有力支持。
值得一提的是,與同樣致力于發(fā)展物理世界相關(guān)人工智能的英偉達(dá)Cosmos模型相比,Meta聲稱V-JEPA 2在運(yùn)行速度上實(shí)現(xiàn)了巨大突破,比Cosmos模型快30倍。這一優(yōu)勢(shì)意味著V-JEPA 2在處理海量數(shù)據(jù)和復(fù)雜任務(wù)時(shí),能夠更加迅速地給出結(jié)果,極大提升了AI智能體的響應(yīng)效率和工作效能。
Meta首席人工智能科學(xué)家Yann LeCun對(duì)V-JEPA 2及其代表的“世界模型”充滿信心。他表示:“世界模型提供了一個(gè)虛擬的、簡(jiǎn)化版的現(xiàn)實(shí)世界,人工智能可以參考它來理解世界,預(yù)測(cè)其行為的后果,因此它將能夠計(jì)劃一個(gè)行動(dòng)方案來完成給定的任務(wù)?!痹赮annLeCun看來,世界模型將為機(jī)器人技術(shù)開啟一個(gè)全新的時(shí)代。未來,現(xiàn)實(shí)世界中的人工智能助手,借助V-JEPA 2這樣的先進(jìn)模型,無需依賴海量訓(xùn)練數(shù)據(jù),就能幫助人們輕松完成日常家務(wù)和各類體力勞動(dòng)。想象一下,家中的智能機(jī)器人能夠自主判斷如何打掃房間、整理物品;在工業(yè)場(chǎng)景中,機(jī)器人可以高效地完成搬運(yùn)、裝配等工作,這一切都將因?yàn)閂-JEPA 2的出現(xiàn)而逐漸成為現(xiàn)實(shí)。








