廉價(jià)、開(kāi)放的人工智能模型DeepSeek-R1讓開(kāi)發(fā)者興奮不已

?? 由 文心大模型 生成的文章摘要

大型語(yǔ)言模型DeepSeek-R1令廣大開(kāi)發(fā)者興奮不已,其被認(rèn)為是OpenAI o1等“推理”模型的經(jīng)濟(jì)實(shí)惠且開(kāi)放的競(jìng)爭(zhēng)對(duì)手。

該模型一步一步生成響應(yīng),其過(guò)程類似于人類的推理。這使得比早期的語(yǔ)言模型更善于解決科學(xué)問(wèn)題,并可能在研究中發(fā)揮作用。1月20 日發(fā)布的R1的初步測(cè)試表明,它在化學(xué)、數(shù)學(xué)和編碼的某些任務(wù)上的表現(xiàn)與o1相當(dāng)。

英國(guó)人工智能咨詢公司DAIR.AI 聯(lián)合創(chuàng)始人兼人工智能研究員Elvis Saravia表示:“這太出乎意料了。”

R1脫穎而出還有另一個(gè)原因。建立該模型的人工智能初創(chuàng)公司DeepSeek已將該模型作為“開(kāi)放權(quán)重”發(fā)布,這意味著研究人員可以研究和構(gòu)建該算法。該模型可以自由重復(fù)使用,但不被視為完全開(kāi)源,因?yàn)槠溆?xùn)練數(shù)據(jù)尚未公開(kāi)。

德國(guó)埃爾蘭根馬克斯普朗克光科學(xué)研究所人工智能科學(xué)家實(shí)驗(yàn)室負(fù)責(zé)人Mario Krenn表示:“DeepSeek的開(kāi)放性非常了不起。”

相比之下,OpenAI開(kāi)發(fā)的o1和其他模型,包括其最新成果o3,都“本質(zhì)上是黑匣子”。

雖然DeepSeek尚未公布R1的全部訓(xùn)練成本,但其向用戶收取的費(fèi)用約為o1運(yùn)行成本的三十分之一。該公司還創(chuàng)建了R1的迷你“精簡(jiǎn)”版本,以允許算力有限的研究人員使用該模型。

“使用o1進(jìn)行的實(shí)驗(yàn)成本超過(guò)300英鎊,而使用R1的成本不到10美元,”Krenn 說(shuō)?!斑@是一個(gè)巨大的差異,肯定會(huì)對(duì)其未來(lái)的采用產(chǎn)生影響?!?/p>

「93913原創(chuàng)內(nèi)容,轉(zhuǎn)載請(qǐng)注明出處」