
阿里巴巴正式公布了一款開源人工智能(AI)推理模型QwQ-32B。據(jù)宣稱,該模型性能超越DeepSeek R1,充分彰顯了這家中國科技巨頭在多元模型及數(shù)據(jù)中心基礎(chǔ)設(shè)施方面強(qiáng)大的AI實(shí)力。
根據(jù)阿里Qwen系列AI模型開發(fā)團(tuán)隊(duì)發(fā)布的博文,盡管阿里新模型僅擁有320億個(gè)參數(shù),然而在數(shù)學(xué)運(yùn)算、編碼操作以及一般性問題解決等領(lǐng)域,其表現(xiàn)與具備6710億個(gè)參數(shù)的 DeepSeek R1相比,不僅毫不遜色,甚至更勝一籌。
該團(tuán)隊(duì)指出,參數(shù)數(shù)量較少這一特性,使得模型運(yùn)行時(shí)所需的計(jì)算資源大幅減少,進(jìn)而更有利于其在更廣泛范圍內(nèi)得到應(yīng)用。
阿里新模型的這種精簡設(shè)計(jì)理念,與阿里董事長蔡崇信所表達(dá)的觀點(diǎn)高度契合。蔡崇信強(qiáng)調(diào),實(shí)際應(yīng)用才是實(shí)現(xiàn)人工智能模型開發(fā)智能最大化的核心要點(diǎn)。
阿里最新推理模型的發(fā)布,距離DeepSeek R1在今年1月震撼全球科技行業(yè)與股市還不到兩個(gè)月。這一推理模型是一種致力于通過思考、反思以及自我批評(píng)等方式來解決復(fù)雜問題的人工智能系統(tǒng)。
與此同時(shí),國內(nèi)人工智能應(yīng)用呈現(xiàn)出迅猛增長的態(tài)勢。上個(gè)月,阿里宣布一項(xiàng)重大計(jì)劃,未來三年將向云計(jì)算和人工智能基礎(chǔ)設(shè)施投入520億美元。這是目前中國由單一私營企業(yè)出資的規(guī)模最大的計(jì)算項(xiàng)目。
阿里方面還透露,QwQ-32B的表現(xiàn)優(yōu)于擁有1000億個(gè)參數(shù)的OpenAI o1-mini。目前,QwQ-32B 已在全球最大的開源AI模型社區(qū)Hugging Face上線。
Qwen團(tuán)隊(duì)認(rèn)為,新推理模型性能得以提升,得益于強(qiáng)化學(xué)習(xí)技術(shù),這與DeepSeek在開發(fā)R1模型時(shí)采用的技術(shù)類似。
該團(tuán)隊(duì)表示,這些進(jìn)展“不僅展現(xiàn)了強(qiáng)化學(xué)習(xí)所蘊(yùn)含的變革性潛力,同時(shí)也為朝著通用人工智能方向的進(jìn)一步創(chuàng)新開辟了道路”。
阿里首席執(zhí)行官吳泳銘在近期的一次財(cái)報(bào)電話會(huì)議中明確表示,公司當(dāng)前的首要任務(wù)是開發(fā)通用人工智能,他將通用人工智能定義為能夠?qū)崿F(xiàn)人類80%能力水平的人工智能。








