
《洛杉磯時(shí)報(bào)》于11月1日?qǐng)?bào)道,稱蘋果研究團(tuán)隊(duì)對(duì)20個(gè)最為先進(jìn)的AI模型進(jìn)行了測(cè)試。測(cè)試結(jié)果表明,在存在干擾項(xiàng)的情況下,這些模型在處理簡(jiǎn)單算術(shù)問題時(shí)表現(xiàn)欠佳,甚至不如小學(xué)生。
蘋果以如下這道簡(jiǎn)單算術(shù)題對(duì)20多個(gè)最為先進(jìn)的AI模型進(jìn)行了測(cè)試,附題如下:
Oliver在星期五采摘44個(gè)獼猴桃。隨后,在星期六采摘了58個(gè)獼猴桃。星期日采摘的數(shù)量是星期五的兩倍,不過其中有5個(gè)獼猴桃的塊頭比平均值要小。請(qǐng)問Oliver這三天共采摘了多少個(gè)獼猴桃?
正確答案是190個(gè),計(jì)算公式為 44(星期五)+58(星期六)+88(44×2,星期日)。
然而,參與測(cè)試的20多個(gè)最為先進(jìn)的AI模型無法排除干擾項(xiàng),通常不能理解獼猴桃的大小與數(shù)量無關(guān),大部分得出的結(jié)果是185個(gè)。
蘋果團(tuán)隊(duì)發(fā)現(xiàn),當(dāng)問題中包含看似相關(guān)但實(shí)際上無關(guān)的信息時(shí),AI模型的表現(xiàn)會(huì)急劇下降。對(duì)此,該研究認(rèn)為,AI模型主要依賴于訓(xùn)練數(shù)據(jù)中的語言模式,而非真正理解數(shù)學(xué)概念。
蘋果研究表明,目前AI模型 “無法進(jìn)行真正的邏輯推理”。這一發(fā)現(xiàn)提醒我們,盡管AI在某些任務(wù)上表現(xiàn)出色,但其智能并不像表面看起來那樣可靠。
蘋果團(tuán)隊(duì)指出,單純擴(kuò)展數(shù)據(jù)或算力并不能從根本上解決這個(gè)問題。蘋果的論文并非旨在削弱人們對(duì)AI的熱情,而是提供一種理性的認(rèn)知。








