德國(guó)研發(fā)“半人馬”AI模型 精準(zhǔn)預(yù)測(cè)人類行為

?? 由 文心大模型 生成的文章摘要

德國(guó)亥姆霍茲慕尼黑研究中心開發(fā)出一款名為“半人馬”(Centaur)的人工智能(AI)模型,能在幾乎所有心理學(xué)實(shí)驗(yàn)中準(zhǔn)確預(yù)測(cè)人類行為,甚至超越了科學(xué)家數(shù)十年來打造的傳統(tǒng)認(rèn)知模型,堪稱“數(shù)字讀心術(shù)”。這項(xiàng)研究發(fā)表在最新一期《自然》雜志上,被認(rèn)為是AI與心理學(xué)融合的重要突破。?

心理學(xué)家長(zhǎng)期以來渴望找到一種既能解釋人類思維方式,又能準(zhǔn)確預(yù)測(cè)人類行為的工具?,F(xiàn)有模型往往局限于其中之一,“半人馬”的出現(xiàn)改變了這一現(xiàn)狀。?

“半人馬”的核心是Psych-101,這是一個(gè)包含160項(xiàng)心理實(shí)驗(yàn)中6萬多人作出的超1000萬個(gè)決策的數(shù)據(jù)集。這些決策涵蓋從簡(jiǎn)單的記憶任務(wù)到復(fù)雜的道德困境。每個(gè)實(shí)驗(yàn)都經(jīng)過精心標(biāo)準(zhǔn)化,并用自然語言重寫,以便AI能夠理解并從中學(xué)習(xí)。?

在模型構(gòu)建上,團(tuán)隊(duì)選用了Meta最新的Llama3.1語言模型,并基于海量人類決策數(shù)據(jù)集進(jìn)行了微調(diào),使其能預(yù)測(cè)一系列典型的行為,而不僅僅是單一行為。團(tuán)隊(duì)用Psych-101數(shù)據(jù)集對(duì)模型進(jìn)行訓(xùn)練,整個(gè)過程在高端計(jì)算機(jī)處理器上僅耗時(shí)5天。?

訓(xùn)練完成后,團(tuán)隊(duì)將“半人馬”模型與十余種行為預(yù)測(cè)模型進(jìn)行了比較,測(cè)試對(duì)象是未參與最初訓(xùn)練集的全新受試者。在32項(xiàng)任務(wù)中,“半人馬”在31項(xiàng)中都是預(yù)測(cè)最有效的模型,唯一的例外是一個(gè)語法判斷任務(wù),即參與者需判斷句子的語法是否正確。?

“半人馬”與眾不同之處在于其“舉一反三”的泛化能力,也就是說,它在面對(duì)全新場(chǎng)景時(shí)仍能給出準(zhǔn)確預(yù)測(cè),無論是情境設(shè)定變化(如將“太空尋寶”改為“魔毯探險(xiǎn)”)、任務(wù)結(jié)構(gòu)調(diào)整(從雙選變?yōu)槿x),還是完全陌生的推理任務(wù),表現(xiàn)都很出色。?

團(tuán)隊(duì)還發(fā)現(xiàn),“半人馬”的內(nèi)部處理機(jī)制與人類大腦活動(dòng)驚人一致。盡管模型從未接觸過腦神經(jīng)數(shù)據(jù),但其內(nèi)部狀態(tài)與執(zhí)行同類任務(wù)時(shí)的人類腦電圖有高度相關(guān)性。這意味著在學(xué)習(xí)預(yù)測(cè)人類行為的過程中,AI演化出了類似人腦的信息處理方式。?

除了行為預(yù)測(cè),“半人馬”還能用于模擬人類決策過程,幫助發(fā)現(xiàn)新的心理學(xué)策略。在一項(xiàng)模擬實(shí)驗(yàn)中,它甚至提出了一種比現(xiàn)有理論更優(yōu)的探索策略,展現(xiàn)出輔助科學(xué)發(fā)現(xiàn)的潛力。

「93913原創(chuàng)內(nèi)容,轉(zhuǎn)載請(qǐng)注明出處」