阿里宣稱開源AI模型性能超越DeepSeek R1

William — Thu, 06 Mar 2025 16:27:25 +0000

阿里巴巴正式公布了一款開源人工智能（AI）推理模型QwQ-32B。據(jù)宣稱，該模型性能超越DeepSeek R1，充分彰顯了這家中國科技巨頭在多元模型及數(shù)據(jù)中心基礎(chǔ)設(shè)施方面強大的AI實力。

根據(jù)阿里Qwen系列AI模型開發(fā)團隊發(fā)布的博文，盡管阿里新模型僅擁有320億個參數(shù)，然而在數(shù)學運算、編碼操作以及一般性問題解決等領(lǐng)域，其表現(xiàn)與具備6710億個參數(shù)的 DeepSeek R1相比，不僅毫不遜色，甚至更勝一籌。

該團隊指出，參數(shù)數(shù)量較少這一特性，使得模型運行時所需的計算資源大幅減少，進而更有利于其在更廣泛范圍內(nèi)得到應(yīng)用。

阿里新模型的這種精簡設(shè)計理念，與阿里董事長蔡崇信所表達的觀點高度契合。蔡崇信強調(diào)，實際應(yīng)用才是實現(xiàn)人工智能模型開發(fā)智能最大化的核心要點。

阿里最新推理模型的發(fā)布，距離DeepSeek R1在今年1月震撼全球科技行業(yè)與股市還不到兩個月。這一推理模型是一種致力于通過思考、反思以及自我批評等方式來解決復(fù)雜問題的人工智能系統(tǒng)。

與此同時，國內(nèi)人工智能應(yīng)用呈現(xiàn)出迅猛增長的態(tài)勢。上個月，阿里宣布一項重大計劃，未來三年將向云計算和人工智能基礎(chǔ)設(shè)施投入520億美元。這是目前中國由單一私營企業(yè)出資的規(guī)模最大的計算項目。

阿里方面還透露，QwQ-32B的表現(xiàn)優(yōu)于擁有1000億個參數(shù)的OpenAI o1-mini。目前，QwQ-32B 已在全球最大的開源AI模型社區(qū)Hugging Face上線。

Qwen團隊認為，新推理模型性能得以提升，得益于強化學習技術(shù)，這與DeepSeek在開發(fā)R1模型時采用的技術(shù)類似。

該團隊表示，這些進展“不僅展現(xiàn)了強化學習所蘊含的變革性潛力，同時也為朝著通用人工智能方向的進一步創(chuàng)新開辟了道路”。

阿里首席執(zhí)行官吳泳銘在近期的一次財報電話會議中明確表示，公司當前的首要任務(wù)是開發(fā)通用人工智能，他將通用人工智能定義為能夠?qū)崿F(xiàn)人類80%能力水平的人工智能。

「93913原創(chuàng)內(nèi)容，轉(zhuǎn)載請注明出處」

四虎成人精品在永久在线,伊人色综合一区二区三区,樱花草在线社区www日本视频

阿里宣稱開源AI模型性能超越DeepSeek R1