廉價、開放的人工智能模型DeepSeek-R1讓開發(fā)者興奮不已

?? 由 文心大模型 生成的文章摘要

大型語言模型DeepSeek-R1令廣大開發(fā)者興奮不已,其被認為是OpenAI o1等“推理”模型的經濟實惠且開放的競爭對手。

該模型一步一步生成響應,其過程類似于人類的推理。這使得比早期的語言模型更善于解決科學問題,并可能在研究中發(fā)揮作用。1月20 日發(fā)布的R1的初步測試表明,它在化學、數(shù)學和編碼的某些任務上的表現(xiàn)與o1相當。

英國人工智能咨詢公司DAIR.AI 聯(lián)合創(chuàng)始人兼人工智能研究員Elvis Saravia表示:“這太出乎意料了?!?/p>

R1脫穎而出還有另一個原因。建立該模型的人工智能初創(chuàng)公司DeepSeek已將該模型作為“開放權重”發(fā)布,這意味著研究人員可以研究和構建該算法。該模型可以自由重復使用,但不被視為完全開源,因為其訓練數(shù)據尚未公開。

德國埃爾蘭根馬克斯普朗克光科學研究所人工智能科學家實驗室負責人Mario Krenn表示:“DeepSeek的開放性非常了不起?!?/p>

相比之下,OpenAI開發(fā)的o1和其他模型,包括其最新成果o3,都“本質上是黑匣子”。

雖然DeepSeek尚未公布R1的全部訓練成本,但其向用戶收取的費用約為o1運行成本的三十分之一。該公司還創(chuàng)建了R1的迷你“精簡”版本,以允許算力有限的研究人員使用該模型。

“使用o1進行的實驗成本超過300英鎊,而使用R1的成本不到10美元,”Krenn 說?!斑@是一個巨大的差異,肯定會對其未來的采用產生影響?!?/p>

「93913原創(chuàng)內容,轉載請注明出處」