阿里巴巴正式公布了一款開源人工智能(AI)推理模型QwQ-32B。據(jù)宣稱,該模型性能超越DeepSeek R1,充分彰顯了這家中國科技巨頭在多元模型及數(shù)據(jù)中心基礎(chǔ)設(shè)施方面強大的AI實力。
根據(jù)阿里Qwen系列AI模型開發(fā)團隊發(fā)布的博文,盡管阿里新模型僅擁有320億個參數(shù),然而在數(shù)學運算、編碼操作以及一般性問題解決等領(lǐng)域,其表現(xiàn)與具備6710億個參數(shù)的 DeepSeek R1相比,不僅毫不遜色,甚至更勝一籌。
該團隊指出,參數(shù)數(shù)量較少這一特性,使得模型運行時所需的計算資源大幅減少,進而更有利于其在更廣泛范圍內(nèi)得到應(yīng)用。
阿里新模型的這種精簡設(shè)計理念,與阿里董事長蔡崇信所表達的觀點高度契合。蔡崇信強調(diào),實際應(yīng)用才是實現(xiàn)人工智能模型開發(fā)智能最大化的核心要點。
阿里最新推理模型的發(fā)布,距離DeepSeek R1在今年1月震撼全球科技行業(yè)與股市還不到兩個月。這一推理模型是一種致力于通過思考、反思以及自我批評等方式來解決復(fù)雜問題的人工智能系統(tǒng)。
與此同時,國內(nèi)人工智能應(yīng)用呈現(xiàn)出迅猛增長的態(tài)勢。上個月,阿里宣布一項重大計劃,未來三年將向云計算和人工智能基礎(chǔ)設(shè)施投入520億美元。這是目前中國由單一私營企業(yè)出資的規(guī)模最大的計算項目。
阿里方面還透露,QwQ-32B的表現(xiàn)優(yōu)于擁有1000億個參數(shù)的OpenAI o1-mini。目前,QwQ-32B 已在全球最大的開源AI模型社區(qū)Hugging Face上線。
Qwen團隊認為,新推理模型性能得以提升,得益于強化學習技術(shù),這與DeepSeek在開發(fā)R1模型時采用的技術(shù)類似。
該團隊表示,這些進展“不僅展現(xiàn)了強化學習所蘊含的變革性潛力,同時也為朝著通用人工智能方向的進一步創(chuàng)新開辟了道路”。
阿里首席執(zhí)行官吳泳銘在近期的一次財報電話會議中明確表示,公司當前的首要任務(wù)是開發(fā)通用人工智能,他將通用人工智能定義為能夠?qū)崿F(xiàn)人類80%能力水平的人工智能。