Meta CTO:AI與元宇宙構(gòu)筑未來(lái)生活

?? 由 文心大模型 生成的文章摘要

作者:Andrew Bosworth,Meta CTO兼Reality Labs負(fù)責(zé)人

主要觀點(diǎn):

●Meta在未來(lái)技術(shù)上的兩大長(zhǎng)期投資——人工智能(AI)和元宇宙——在2023年都取得了重大進(jìn)展。更重要的是,這兩者開(kāi)始交匯。

●Meta在2023年取得的進(jìn)展意味著生成型AI正在成為世界上最受歡迎應(yīng)用的核心;混合現(xiàn)實(shí)現(xiàn)已成為大眾市場(chǎng)頭顯的核心;Ray-Ban Meta智能眼鏡將首次讓AI從我們的視角看世界。

●我們相信,尖端AI最強(qiáng)大的表現(xiàn)之一將是像Meta AI這樣能理解你周圍的世界、并在你的一天中幫助你、最終無(wú)需提示即可操作的助手。

比爾·蓋茨曾說(shuō)過(guò),人們會(huì)“高估接下來(lái)一年內(nèi)發(fā)生的變化,低估接下來(lái)十年內(nèi)發(fā)生的變化”。技術(shù)的單點(diǎn)突破往往以非線性方式積累,直到未來(lái)突然近在眼前。正如老話所說(shuō),技術(shù)變革發(fā)生的方式有兩種:Gradually,then Suddenly(微小的變化日積月累,突然間改變世界)。在我們結(jié)束這激動(dòng)人心的12個(gè)月的技術(shù)進(jìn)步之際,我認(rèn)為可以公平地說(shuō),2023年是一個(gè)“突然”的一年。

上個(gè)月,我們慶祝了我們FAIR實(shí)驗(yàn)室(Fundamental AI Research Lab)成立10周年。當(dāng)我們?cè)?013年成立這一實(shí)驗(yàn)室時(shí),整個(gè)行業(yè)對(duì)AI未來(lái)將扮演的角色感到非常興奮,早期的機(jī)器學(xué)習(xí)應(yīng)用已經(jīng)在Facebook各個(gè)方面發(fā)揮著核心作用。當(dāng)時(shí)很少有人能想象到如今AI的進(jìn)展會(huì)如此令人印象深刻。事實(shí)上,就在兩年前,許多人可能還對(duì)AI的前景抱有疑慮。

展望2024年,另一個(gè)重大里程碑即將到來(lái):自Meta開(kāi)始在Reality Labs研究未來(lái)計(jì)算平臺(tái)以來(lái)將滿10年。這兩種新興技術(shù)——AI和元宇宙——代表了Meta對(duì)未來(lái)的長(zhǎng)期押注。而在2023年,我們開(kāi)始看到這兩條技術(shù)路徑以大眾產(chǎn)品的形式交匯。

AI

在AI領(lǐng)域,今年的一個(gè)亮點(diǎn)是看到開(kāi)發(fā)者社區(qū)如何接受Llama和Llama 2,它們的下載量超過(guò)了1億次,并且來(lái)自全球各地的組織在不斷改進(jìn)和迭代。在印度,Jio迅速對(duì)其進(jìn)行微調(diào),為其五億多客戶建立了一個(gè)新工具。HuggingFace的Open LLM排行榜上有非常多基于Llama 2構(gòu)建的令人印象深刻的項(xiàng)目,引領(lǐng)市場(chǎng)潮流。前面提到的這些,僅僅是托管的13000多個(gè)Llama變體中的一小部分。

像任何新技術(shù)一樣,當(dāng)AI對(duì)每個(gè)人都可用時(shí)將產(chǎn)生最大的影響。不久前,大多數(shù)人無(wú)法接觸到使用文本提示生成美麗圖像的工具。但今天,我們正在向全球數(shù)十億人使用的產(chǎn)品中添加如協(xié)作生成圖像、會(huì)話助手、寫作助手和智能圖像編輯器等等多樣化的AI功能。

平臺(tái)在轉(zhuǎn)變

我們?cè)谶^(guò)去一年中看到的轉(zhuǎn)變表明,AI有一條通向成為主流人機(jī)交互方式的路徑。這一舞臺(tái)已經(jīng)為可以以前所未有的方式感知、理解和與我們周圍的世界互動(dòng)的新型設(shè)備做好了準(zhǔn)備。

Meta的AI驅(qū)動(dòng)Ray-Ban Meta眼鏡展示了其中一條路徑。我們的新Meta AI助手結(jié)合視覺(jué)和語(yǔ)言理解,從你的視角看世界,并與你一起理解它。我們正在眼鏡上測(cè)試新的多模態(tài)AI能力。啟用此功能后,它們可以翻譯您嘗試閱讀的外語(yǔ),或?yàn)槟臄z的照片編寫有趣的標(biāo)題。而且它們可以全部免提完成,無(wú)需您拿出手機(jī)或操作應(yīng)用程序。

我們相信,尖端AI最強(qiáng)大的表現(xiàn)形式之一,是成為可以理解你周圍的世界,并在你的一天中提供幫助的助手,最終這一助手將無(wú)需任何提示詞即可交互。眼鏡是這種表現(xiàn)形式的理想選擇——它們可以從你的視角看到和聽(tīng)到世界,它們已經(jīng)在社交上可接受,它們可以全天佩戴,它們讓你完全活在當(dāng)下。

在Reality Labs,我們投入了多年時(shí)間,研究達(dá)成這一目標(biāo)所需的技術(shù)——諸如超低功耗、始終開(kāi)啟的傳感器,和能夠理解你情境的機(jī)器感知系統(tǒng)。我們?cè)谶@里不僅是在開(kāi)創(chuàng)一種新型設(shè)備,還將在未來(lái)數(shù)年里推動(dòng)它的發(fā)展。

混合現(xiàn)實(shí)和空間計(jì)算代表了另一條前進(jìn)的道路。它們不僅僅是對(duì)過(guò)去50年占據(jù)主導(dǎo)地位的個(gè)人計(jì)算范式的漸進(jìn)式改進(jìn),還代表著一種剛剛開(kāi)始顯現(xiàn)的根本性轉(zhuǎn)變。

讓盡可能多的人使用這些新技術(shù)一直是Reality Labs多年來(lái)的首要任務(wù),因此在2023年9月,Meta發(fā)布的首款消費(fèi)級(jí)MR頭顯Meta Quest 3對(duì)我們來(lái)說(shuō)是另一個(gè)亮點(diǎn)。

在Meta Quest 3發(fā)布后的幾個(gè)月里,Quest Store前20名應(yīng)用中有七個(gè)是混合現(xiàn)實(shí)應(yīng)用。我們看到了強(qiáng)烈的信號(hào),表明人們確實(shí)重視這些體驗(yàn)。我們的商店中已經(jīng)有數(shù)百個(gè)混合現(xiàn)實(shí)應(yīng)用,大多數(shù)用戶都嘗試過(guò)混合現(xiàn)實(shí)功能。看到許多人使用這種新技術(shù)的情況令人愉快:

我們將在2024年看到這一進(jìn)展加速,因?yàn)楦嗟娜藭?huì)接觸混合現(xiàn)實(shí),開(kāi)發(fā)者將學(xué)會(huì)利用其力量。無(wú)論是在Xtadium上沉浸式觀看NBA,還是在Pianovision上體驗(yàn)全新的音樂(lè)學(xué)習(xí)方法,我們已經(jīng)看到MR提供了其他任何類型的設(shè)備都無(wú)法實(shí)現(xiàn)的體驗(yàn)。

長(zhǎng)遠(yuǎn)眼光

對(duì)新興技術(shù)進(jìn)行長(zhǎng)期投資并不容易。它不一定能奏效,當(dāng)然也投入巨大。但這是技術(shù)公司可以做的最有價(jià)值的事情之一,也是長(zhǎng)期保持影響力的唯一方式。Meta投入最大的兩項(xiàng)長(zhǎng)線技術(shù)今年都走向成熟并開(kāi)始交匯,也再次提醒了我們維持健康的對(duì)未來(lái)技術(shù)的投資有多么重要。它還讓我們對(duì)未來(lái)十年需要交付的創(chuàng)新有了更清晰的視野。

在AI方面,這代表著我們要全力以赴迎接接下來(lái)的事情:在這一代LLMs和生成型AI之后會(huì)出現(xiàn)什么?大多數(shù)研究人員都認(rèn)為,利用我們今天擁有的技術(shù),構(gòu)建更大、更好的語(yǔ)言、圖像和視頻模型仍有巨大的機(jī)會(huì)。同時(shí),還有許多基礎(chǔ)性突破和全新架構(gòu)等待被探索,我們Meta的AI研究團(tuán)隊(duì)正走在發(fā)現(xiàn)它們的道路上。

這也意味著對(duì)諸如具身智能(Embodied AI)的領(lǐng)域進(jìn)行持續(xù)研究,旨在構(gòu)建像人類一樣體驗(yàn)世界的模型。我們的研究人員認(rèn)為,走向人類級(jí)別AI的道路將需要對(duì)世界運(yùn)作方式有更深入理解的系統(tǒng),而我們的團(tuán)隊(duì)已經(jīng)在這方面取得進(jìn)展,未來(lái)還要繼續(xù)進(jìn)行多年的工作。

在Reality Labs方面,我們的研究人員正在推進(jìn)一些最有前途的技術(shù),這些技術(shù)將使下一個(gè)計(jì)算平臺(tái)成為可能。多年來(lái),這項(xiàng)研究已經(jīng)帶來(lái)了一些突破,例如Quest Pro和Quest 3上的Pancake鏡頭,以及Mark Zuckerberg和Lex Fridman今年試用的令人驚嘆的Codec Avatars原型。這只是冰山一角,Reality Labs的研究突破將使我們能夠在未來(lái)幾年發(fā)布一系列行業(yè)首創(chuàng)產(chǎn)品。

但在我提到的所有事情中,最有價(jià)值的技術(shù)是今天人們手中的技術(shù)。2023年取得的進(jìn)展意味著生成型AI正在成為世界上最受歡迎應(yīng)用的核心,混合現(xiàn)實(shí)現(xiàn)已成為消費(fèi)級(jí)頭顯的核心,智能眼鏡將首次讓AI從我們的視角看世界。這是一個(gè)極為激動(dòng)人心的時(shí)刻,讓我們得以構(gòu)建未來(lái)。更重要的是,這是一個(gè)在未來(lái)世界生活的絕佳時(shí)機(jī)。

「93913原創(chuàng)內(nèi)容,轉(zhuǎn)載請(qǐng)注明出處」