什么是人工智能(AI)?

?? 由 文心大模型 生成的文章摘要

AI是指任何展現(xiàn)人類智能某些方面的技術(shù),幾十年來(lái)它一直是計(jì)算機(jī)科學(xué)中一個(gè)突出領(lǐng)域。AI要完成的任務(wù)范圍廣泛,從識(shí)別視覺(jué)場(chǎng)景中的對(duì)象到構(gòu)建句子的技巧,甚至還包括預(yù)測(cè)股票價(jià)格的變動(dòng)。

自計(jì)算機(jī)時(shí)代之初,科學(xué)家們就一直在嘗試構(gòu)建AI。在上世紀(jì)大部分時(shí)間里,學(xué)界主流的方法是創(chuàng)建龐大的事實(shí)和規(guī)則數(shù)據(jù)庫(kù),然后利用基于邏輯的計(jì)算機(jī)程序來(lái)做出決策。但本世紀(jì)以來(lái)出現(xiàn)了新的研究方法,那就是通過(guò)分析數(shù)據(jù)讓計(jì)算機(jī)自學(xué)事實(shí)和規(guī)則,這導(dǎo)致該領(lǐng)域取得了重大進(jìn)展。

在過(guò)去十年中,AI在諸如從醫(yī)學(xué)影像中發(fā)現(xiàn)乳腺癌、玩轉(zhuǎn)極其復(fù)雜的棋類游戲(比如國(guó)際象棋和圍棋)甚至預(yù)測(cè)蛋白質(zhì)結(jié)構(gòu)等方面展現(xiàn)出了看似“超人”的能力。

而自大型語(yǔ)言模型(LLM)聊天機(jī)器人ChatGPT在2022年底問(wèn)世以來(lái),人們?cè)絹?lái)越普遍認(rèn)為我們可能正處于復(fù)制類似人類的更加通用的智能——即通用人工智能(AGI)的邊緣。Cohere For AI非盈利研究實(shí)驗(yàn)室的負(fù)責(zé)人Sara Hooker表示:“這一轉(zhuǎn)變對(duì)于該領(lǐng)域的重要性怎么說(shuō)都不為過(guò)?!?/p>

AI是如何工作的?

盡管科學(xué)家們可以采取多種方法來(lái)構(gòu)建AI系統(tǒng),但機(jī)器學(xué)習(xí)是當(dāng)今最廣泛使用的技術(shù)。它涉及讓計(jì)算機(jī)分析數(shù)據(jù)以識(shí)別模式,然后用這些模式來(lái)做出預(yù)測(cè)。

學(xué)習(xí)過(guò)程由算法控制——由人類編寫(xiě)一系列指令來(lái)告訴計(jì)算機(jī)如何分析數(shù)據(jù)——這個(gè)過(guò)程的輸出結(jié)果是一個(gè)編碼了所有發(fā)現(xiàn)模式的統(tǒng)計(jì)模型。然后,這個(gè)模型可以被輸入新數(shù)據(jù),以生成預(yù)測(cè)結(jié)果。

機(jī)器學(xué)習(xí)算法有很多種,但神經(jīng)網(wǎng)絡(luò)是當(dāng)今最廣泛使用的算法之一。這些算法是一系列松散模擬人腦的機(jī)器學(xué)習(xí)算法的集合,它們通過(guò)調(diào)整“人工神經(jīng)元”網(wǎng)絡(luò)之間的連接強(qiáng)度來(lái)進(jìn)行學(xué)習(xí),同時(shí)在訓(xùn)練數(shù)據(jù)中進(jìn)行搜索。這種架構(gòu)被目前許多流行的AI服務(wù)(比如文本和圖像生成)所采用。

當(dāng)前大多數(shù)前沿研究都涉及深度學(xué)習(xí),它是指使用具有多層人工神經(jīng)元的龐大神經(jīng)網(wǎng)絡(luò)。這一概念自20世紀(jì)80年代就已存在,但由于對(duì)數(shù)據(jù)和計(jì)算能力的極高要求,其應(yīng)用受到了限制。然后在2012年,研究人員發(fā)現(xiàn),被稱為圖形處理單元(GPU)的專用計(jì)算機(jī)芯片能夠加速深度學(xué)習(xí)的過(guò)程。從那時(shí)起,深度學(xué)習(xí)便成為了相關(guān)研究領(lǐng)域的黃金標(biāo)準(zhǔn)。

“深度神經(jīng)網(wǎng)絡(luò)可以被看作是機(jī)器學(xué)習(xí)的強(qiáng)化版,”Hooker說(shuō),“它們不僅在計(jì)算成本上最為昂貴,而且通常規(guī)模龐大、功能強(qiáng)大且表達(dá)能力很強(qiáng)?!?/p>

然而,并非所有的神經(jīng)網(wǎng)絡(luò)都是一樣的。不同的配置或者說(shuō)“架構(gòu)”適用于不同的任務(wù)。卷積神經(jīng)網(wǎng)絡(luò)的連接模式受到動(dòng)物視覺(jué)皮層的啟發(fā),在視覺(jué)任務(wù)上表現(xiàn)出色。而具有內(nèi)部記憶功能的循環(huán)神經(jīng)網(wǎng)絡(luò),則專門(mén)處理序列數(shù)據(jù)。

AI算法還可以根據(jù)不同的應(yīng)用進(jìn)行不同的訓(xùn)練。最常見(jiàn)的方法是“監(jiān)督學(xué)習(xí)”,它涉及人類為每個(gè)數(shù)據(jù)分配標(biāo)簽以指導(dǎo)AI的模式學(xué)習(xí)過(guò)程,例如你會(huì)給貓的圖片加上“貓”的標(biāo)簽。

在“無(wú)監(jiān)督學(xué)習(xí)”中,訓(xùn)練數(shù)據(jù)是未標(biāo)記的,機(jī)器必須自行解決問(wèn)題。這就需要更多的數(shù)據(jù),并且可能難以實(shí)現(xiàn)——但因?yàn)閷W(xué)習(xí)過(guò)程不受人類偏見(jiàn)的限制,它可以導(dǎo)致更豐富和更強(qiáng)大的模型。最近LLM的突破性發(fā)展大多使用了這種方法。

最后一種主要的訓(xùn)練方法是“強(qiáng)化學(xué)習(xí)”,它讓AI通過(guò)試錯(cuò)來(lái)學(xué)習(xí)。這最常用于訓(xùn)練游戲AI系統(tǒng)或機(jī)器人——包括類人機(jī)器人,如Figure 01,或那些踢足球的微型機(jī)器人——它涉及反復(fù)嘗試任務(wù),并根據(jù)正面或負(fù)面反饋更新一套內(nèi)部規(guī)則。這種方法推動(dòng)了Google Deepmind的開(kāi)創(chuàng)性AlphaGo模型。

什么是生成式AI?

盡管深度學(xué)習(xí)在過(guò)去十年中取得了一系列重大成功,但很少有像ChatGPT這樣引起公眾想象的——其逼真的人類對(duì)話能力。這是幾個(gè)生成式AI系統(tǒng)之一,它們使用深度學(xué)習(xí)和神經(jīng)網(wǎng)絡(luò)根據(jù)用戶的輸入內(nèi)容生成輸出內(nèi)容——包括文本、圖像、音頻甚至視頻。

像ChatGPT這樣的文本生成器使用AI的一個(gè)子集進(jìn)行操作,這個(gè)子集被稱為“自然語(yǔ)言處理”(NLP)。這一突破性的起源可以追溯到2017年谷歌科學(xué)家引入的一種新穎的深度學(xué)習(xí)架構(gòu)——“變換器”(Transformer)。

變換器算法專門(mén)用于對(duì)大量序列數(shù)據(jù)(尤其是大塊書(shū)面文本)進(jìn)行無(wú)監(jiān)督學(xué)習(xí)。它們擅長(zhǎng)于此,因?yàn)樗鼈兛梢员纫酝魏畏椒ǜ米粉欉h(yuǎn)距離數(shù)據(jù)點(diǎn)之間的關(guān)系,這使它們能夠更好理解它們正在查看的內(nèi)容的上下文。

“我接下來(lái)要說(shuō)的話取決于我之前說(shuō)過(guò)的話——我們的語(yǔ)言是隨著時(shí)間聯(lián)系在一起的,”Hooker說(shuō),“這種真正將單詞視為整體的能力是AI關(guān)鍵性的突破之一。”

LLM通過(guò)屏蔽句子中的下一個(gè)單詞,然后嘗試根據(jù)前面的內(nèi)容猜測(cè)它是什么來(lái)進(jìn)行學(xué)習(xí)。訓(xùn)練數(shù)據(jù)已經(jīng)包含了答案,所以這種方法不需要任何人類標(biāo)記,因此可以從互聯(lián)網(wǎng)上抓取大量數(shù)據(jù)并將其輸入算法。變換器還可以并行執(zhí)行多個(gè)這樣的訓(xùn)練游戲,這使它們能夠更快的處理數(shù)據(jù)。

通過(guò)在如此龐大的數(shù)據(jù)量上進(jìn)行訓(xùn)練,變換器可以產(chǎn)生極其復(fù)雜的人類語(yǔ)言模型——因此得名“大語(yǔ)言模型”。它們還可以分析和生成與人類生成的文本非常相似的復(fù)雜的長(zhǎng)篇文本。不僅僅是語(yǔ)言,變換器還徹底改變了其他領(lǐng)域。同樣的架構(gòu)也可以同時(shí)在文本和圖像數(shù)據(jù)上進(jìn)行訓(xùn)練,由此產(chǎn)生了諸如Stable Diffusion和DALL-E這樣的模型,它們可以從簡(jiǎn)單的文字描述中生成高清圖像。

變換器在Google Deepmind的AlphaFold 2模型中也發(fā)揮了核心作用,該模型可以從氨基酸序列生成蛋白質(zhì)結(jié)構(gòu)。這種產(chǎn)生原始數(shù)據(jù)的能力,而不僅僅是分析現(xiàn)有數(shù)據(jù),是這些模型被稱為“生成式AI”的原因。

狹義AI與通用人工智能(AGI):有什么區(qū)別?

由于大語(yǔ)言模型能夠執(zhí)行的任務(wù)范圍廣泛,人們對(duì)它們感到興奮。大多數(shù)機(jī)器學(xué)習(xí)系統(tǒng)被訓(xùn)練來(lái)解決特定問(wèn)題——例如在視頻流中檢測(cè)人臉或?qū)⒁环N語(yǔ)言翻譯成另一種語(yǔ)言。這些模型被稱為“狹義AI”,因?yàn)樗鼈冎荒芴幚硭鼈儽挥?xùn)練的特定任務(wù)。

大多數(shù)機(jī)器學(xué)習(xí)系統(tǒng)被訓(xùn)練來(lái)解決特定問(wèn)題——例如在視頻流中檢測(cè)人臉或?qū)⒁环N語(yǔ)言翻譯成另一種語(yǔ)言——并且達(dá)到了超人的水平,因?yàn)樗鼈儽热祟惛臁⒈憩F(xiàn)得更好。但是像ChatGPT這樣的大語(yǔ)言模型代表了AI能力的一次重大變革,因?yàn)閱我荒P涂梢詧?zhí)行廣泛的任務(wù)。它們可以回答關(guān)于多樣化主題的問(wèn)題、總結(jié)文件、進(jìn)行語(yǔ)言翻譯和編寫(xiě)代碼。

這種將所學(xué)知識(shí)泛化以解決許多不同問(wèn)題的能力,使得一些人推測(cè)大語(yǔ)言模型可能是通向AGI的一步,包括DeepMind科學(xué)家在去年發(fā)表的一篇論文中。AGI指的是一個(gè)假設(shè)的未來(lái)AI,能夠掌握任何人類可以的認(rèn)知任務(wù),抽象的推理問(wèn)題,并在沒(méi)有特定訓(xùn)練的情況下適應(yīng)新情況。

AI愛(ài)好者預(yù)測(cè)一旦實(shí)現(xiàn)了AGI,技術(shù)進(jìn)步將迅速加速——一個(gè)被稱為“奇點(diǎn)”的轉(zhuǎn)折點(diǎn),此后突破將以指數(shù)級(jí)實(shí)現(xiàn)。同時(shí),人們也感受到一些風(fēng)險(xiǎn)的存在,從大規(guī)模的經(jīng)濟(jì)及勞動(dòng)力市場(chǎng)破壞到AI可能發(fā)現(xiàn)新病原體或武器的潛力。

然而,關(guān)于大語(yǔ)言模型是否會(huì)成為AGI的前身,或者僅僅是AGI所需的更廣泛的網(wǎng)絡(luò)或AI架構(gòu)生態(tài)系統(tǒng)中的一種架構(gòu),學(xué)界仍然存在爭(zhēng)議。一些人表示,大語(yǔ)言模型距離復(fù)制人類的推理和認(rèn)知能力還有很長(zhǎng)的路要走。根據(jù)批評(píng)者的說(shuō)法,這些模型只是記憶了大量信息,并通過(guò)給人一種深層次理解的錯(cuò)誤印象的方式重新組合了它們;這意味著它們受到訓(xùn)練數(shù)據(jù)的限制,與其它狹義AI工具沒(méi)有根本性的不同。

盡管如此,Hooker表示,大語(yǔ)言模型無(wú)疑代表了科學(xué)家們?cè)贏I發(fā)展方法上的重大轉(zhuǎn)變?,F(xiàn)在,前沿研究不再針對(duì)特定任務(wù)訓(xùn)練模型,而是采用這些預(yù)先訓(xùn)練的、通常有能力的模型,并使其適應(yīng)特定的用例。這導(dǎo)致它們被稱為“基礎(chǔ)模型”。

“人們正在從只做一件事的非常專業(yè)的模型轉(zhuǎn)向做所有事情的基礎(chǔ)模型,”胡克補(bǔ)充道?!八鼈兪且磺薪⒌幕A(chǔ)?!?/p>

AI在現(xiàn)實(shí)世界中是如何使用的?

像機(jī)器學(xué)習(xí)這樣的技術(shù)無(wú)處不在。AI驅(qū)動(dòng)的推薦算法決定了你在Netflix或YouTube上觀看什么——而翻譯模型則使得將一個(gè)網(wǎng)頁(yè)從外語(yǔ)瞬間轉(zhuǎn)換為你自己的語(yǔ)言成為可能。你的銀行可能也使用AI模型來(lái)檢測(cè)你賬戶上的任何異常活動(dòng)——這可能代表了欺詐行為,監(jiān)控?cái)z像頭和自動(dòng)駕駛汽車(chē)使用計(jì)算機(jī)視覺(jué)模型從視頻流中識(shí)別人和物體。

而生成式AI工具和服務(wù)也開(kāi)始進(jìn)入現(xiàn)實(shí)世界,超越了像ChatGPT這樣的新奇聊天機(jī)器人。大多數(shù)主要的AI開(kāi)發(fā)者現(xiàn)在都有一個(gè)聊天機(jī)器人,可以回答用戶關(guān)于各種主題的問(wèn)題,分析和總結(jié)文件,并進(jìn)行語(yǔ)言翻譯。這些模型也正在被集成到搜索引擎中——例如Gemini集成到Google搜索之中——公司還在構(gòu)建AI驅(qū)動(dòng)的數(shù)字助手,幫助程序員編寫(xiě)代碼,如Github Copilot。它們甚至可以成為使用文字處理器或電子郵件客戶端的用戶提高生產(chǎn)力的工具。

聊天機(jī)器人風(fēng)格的AI工具是最常見(jiàn)的生成式AI服務(wù),盡管它們的表現(xiàn)令人印象深刻,但大語(yǔ)言模型仍然遠(yuǎn)非完美。它們對(duì)特定提示后應(yīng)該跟隨什么單詞進(jìn)行統(tǒng)計(jì)猜測(cè)。盡管它們經(jīng)常產(chǎn)生表明理解的結(jié)果,但它們也可以自信的生成看似合理但實(shí)際上是錯(cuò)誤的答案——這種現(xiàn)象被稱為“幻覺(jué)”。

雖然生成式AI越來(lái)越普遍,但這些工具將在何處或如何證明最有用還遠(yuǎn)不清楚。Hooker表示,鑒于這項(xiàng)技術(shù)還很新,有必要謹(jǐn)慎對(duì)待它的快速推廣速度。“某種東西既處于技術(shù)可能性的前沿,又被廣泛部署,這是非常不尋常的,”她補(bǔ)充,“這帶來(lái)了它自身的風(fēng)險(xiǎn)和挑戰(zhàn)?!?/p>

本文轉(zhuǎn)自外媒livescience

「93913原創(chuàng)內(nèi)容,轉(zhuǎn)載請(qǐng)注明出處」