當(dāng)?shù)貢r(shí)間2月4日,全球知名AI模型評(píng)測(cè)平臺(tái)Chatbot Arena揭曉了最新一期榜單。其中,阿里通義千問(wèn)團(tuán)隊(duì)的全新大語(yǔ)言模型Qwen2.5-Ma成績(jī)斐然,在總體排名中躍居第7位,力壓DeepSeek V3、O1-Mini和Claude-3.5-Sonnet等一眾頂級(jí)專(zhuān)有大語(yǔ)言模型,成為AI領(lǐng)域的新焦點(diǎn)。
繼DeepSeek之后,Qwen2.5-Max的發(fā)布堪稱(chēng)中國(guó)AI陣營(yíng)在高性能、低成本技術(shù)路線(xiàn)上的又一重大突破。此前,市場(chǎng)分析人士指出,外界過(guò)度關(guān)注DeepSeek,卻在一定程度上忽視了以阿里通義為代表的中國(guó)AI的整體崛起。如今,若阿里Qwen-2.5-max的性能如預(yù)期般卓越,再加上其低成本優(yōu)勢(shì)和完備的云生態(tài),極有可能引發(fā)繼DeepSeek之后中國(guó)AI資產(chǎn)的新一輪價(jià)值重估。
1月29日凌晨,阿里通義千問(wèn)團(tuán)隊(duì)悄然上線(xiàn)Qwen2.5-Max。該模型一經(jīng)推出,便在MMLU-Pro、LiveCodeBench、LiveBench和Arena-Hard等主流基準(zhǔn)測(cè)試中拔得頭籌,展現(xiàn)出與全球頂尖模型相媲美的實(shí)力。
據(jù)悉,最新版Qwen2.5-Max采用了超大規(guī)模的專(zhuān)家混合(MoE)模型架構(gòu),預(yù)訓(xùn)練數(shù)據(jù)量超過(guò)20萬(wàn)億個(gè)token,并運(yùn)用監(jiān)督微調(diào)(SFT)和人類(lèi)反饋強(qiáng)化學(xué)習(xí)(RLHF)技術(shù)進(jìn)行深度優(yōu)化,在知識(shí)儲(chǔ)備、編程能力、通用技能和人類(lèi)對(duì)齊等方面均表現(xiàn)出色。
目前,全球開(kāi)發(fā)者和企業(yè)可通過(guò)阿里云的生成式AI開(kāi)發(fā)平臺(tái)Model Studio便捷訪(fǎng)問(wèn) Qwen2.5-Max。自發(fā)布以來(lái),Qwen2.5-Max迅速吸引了海內(nèi)外用戶(hù)和開(kāi)發(fā)者的廣泛關(guān)注。有網(wǎng)友形象評(píng)價(jià),Qwen2.5-Max堪稱(chēng)“中文版ChatGPT”,但在性能上卻更勝一籌。