Chatbot Arena最新榜單,Qwen2.5-Ma排名超越DeepSeek V3

?? 由 文心大模型 生成的文章摘要

當?shù)貢r間2月4日,全球知名AI模型評測平臺Chatbot Arena揭曉了最新一期榜單。其中,阿里通義千問團隊的全新大語言模型Qwen2.5-Ma成績斐然,在總體排名中躍居第7位,力壓DeepSeek V3、O1-Mini和Claude-3.5-Sonnet等一眾頂級專有大語言模型,成為AI領域的新焦點。

繼DeepSeek之后,Qwen2.5-Max的發(fā)布堪稱中國AI陣營在高性能、低成本技術(shù)路線上的又一重大突破。此前,市場分析人士指出,外界過度關注DeepSeek,卻在一定程度上忽視了以阿里通義為代表的中國AI的整體崛起。如今,若阿里Qwen-2.5-max的性能如預期般卓越,再加上其低成本優(yōu)勢和完備的云生態(tài),極有可能引發(fā)繼DeepSeek之后中國AI資產(chǎn)的新一輪價值重估。

1月29日凌晨,阿里通義千問團隊悄然上線Qwen2.5-Max。該模型一經(jīng)推出,便在MMLU-Pro、LiveCodeBench、LiveBench和Arena-Hard等主流基準測試中拔得頭籌,展現(xiàn)出與全球頂尖模型相媲美的實力。

據(jù)悉,最新版Qwen2.5-Max采用了超大規(guī)模的專家混合(MoE)模型架構(gòu),預訓練數(shù)據(jù)量超過20萬億個token,并運用監(jiān)督微調(diào)(SFT)和人類反饋強化學習(RLHF)技術(shù)進行深度優(yōu)化,在知識儲備、編程能力、通用技能和人類對齊等方面均表現(xiàn)出色。

目前,全球開發(fā)者和企業(yè)可通過阿里云的生成式AI開發(fā)平臺Model Studio便捷訪問 Qwen2.5-Max。自發(fā)布以來,Qwen2.5-Max迅速吸引了海內(nèi)外用戶和開發(fā)者的廣泛關注。有網(wǎng)友形象評價,Qwen2.5-Max堪稱“中文版ChatGPT”,但在性能上卻更勝一籌。

「93913原創(chuàng)內(nèi)容,轉(zhuǎn)載請注明出處」