Chatbot Arena最新榜單，Qwen2.5-Ma排名超越DeepSeek V3

William — Wed, 05 Feb 2025 16:39:20 +0000

當(dāng)?shù)貢r(shí)間2月4日，全球知名AI模型評(píng)測(cè)平臺(tái)Chatbot Arena揭曉了最新一期榜單。其中，阿里通義千問(wèn)團(tuán)隊(duì)的全新大語(yǔ)言模型Qwen2.5-Ma成績(jī)斐然，在總體排名中躍居第7位，力壓DeepSeek V3、O1-Mini和Claude-3.5-Sonnet等一眾頂級(jí)專(zhuān)有大語(yǔ)言模型，成為AI領(lǐng)域的新焦點(diǎn)。

繼DeepSeek之后，Qwen2.5-Max的發(fā)布堪稱(chēng)中國(guó)AI陣營(yíng)在高性能、低成本技術(shù)路線(xiàn)上的又一重大突破。此前，市場(chǎng)分析人士指出，外界過(guò)度關(guān)注DeepSeek，卻在一定程度上忽視了以阿里通義為代表的中國(guó)AI的整體崛起。如今，若阿里Qwen-2.5-max的性能如預(yù)期般卓越，再加上其低成本優(yōu)勢(shì)和完備的云生態(tài)，極有可能引發(fā)繼DeepSeek之后中國(guó)AI資產(chǎn)的新一輪價(jià)值重估。

1月29日凌晨，阿里通義千問(wèn)團(tuán)隊(duì)悄然上線(xiàn)Qwen2.5-Max。該模型一經(jīng)推出，便在MMLU-Pro、LiveCodeBench、LiveBench和Arena-Hard等主流基準(zhǔn)測(cè)試中拔得頭籌，展現(xiàn)出與全球頂尖模型相媲美的實(shí)力。

據(jù)悉，最新版Qwen2.5-Max采用了超大規(guī)模的專(zhuān)家混合（MoE）模型架構(gòu)，預(yù)訓(xùn)練數(shù)據(jù)量超過(guò)20萬(wàn)億個(gè)token，并運(yùn)用監(jiān)督微調(diào)（SFT）和人類(lèi)反饋強(qiáng)化學(xué)習(xí)（RLHF）技術(shù)進(jìn)行深度優(yōu)化，在知識(shí)儲(chǔ)備、編程能力、通用技能和人類(lèi)對(duì)齊等方面均表現(xiàn)出色。

目前，全球開(kāi)發(fā)者和企業(yè)可通過(guò)阿里云的生成式AI開(kāi)發(fā)平臺(tái)Model Studio便捷訪(fǎng)問(wèn) Qwen2.5-Max。自發(fā)布以來(lái)，Qwen2.5-Max迅速吸引了海內(nèi)外用戶(hù)和開(kāi)發(fā)者的廣泛關(guān)注。有網(wǎng)友形象評(píng)價(jià)，Qwen2.5-Max堪稱(chēng)“中文版ChatGPT”，但在性能上卻更勝一籌。

「93913原創(chuàng)內(nèi)容，轉(zhuǎn)載請(qǐng)注明出處」

最近中文字幕国语免费完整,杨思敏1一5集国语版在线播放

Chatbot Arena最新榜單，Qwen2.5-Ma排名超越DeepSeek V3