阿里即將發(fā)布新模型Qwen3,開(kāi)啟AI領(lǐng)域新篇章

?? 由 文心大模型 生成的文章摘要

阿里即將于2025年4月第二周正式發(fā)布新模型Qwen3。作為阿里在2025年上半年最為關(guān)鍵的模型產(chǎn)品,Qwen3的誕生備受矚目,其發(fā)布也預(yù)示著阿里在人工智能領(lǐng)域?qū)⑦~出重要一步。自2024年9月阿里在云棲大會(huì)上推出Qwen2.5后,短短七個(gè)月的時(shí)間,阿里云內(nèi)部的基礎(chǔ)模型團(tuán)隊(duì)便馬不停蹄地推動(dòng)著Qwen3相關(guān)項(xiàng)目的進(jìn)展。?

然而,2025年初DeepSeek的異軍突起,在AI領(lǐng)域掀起了一陣波瀾,也在一定程度上改變了阿里云基礎(chǔ)模型團(tuán)隊(duì)的思路與工作重心。一位知情人士透露:“早在2024年四季度,業(yè)內(nèi)就已經(jīng)察覺(jué)到模型推理能力的重要性,只不過(guò)當(dāng)時(shí)還未將其視為最核心的發(fā)展方向。但隨著DeepSeek的火爆,推理能力已然成為模型發(fā)展過(guò)程中不可忽視的關(guān)鍵要素?!痹贒eepSeek-R1發(fā)布后,阿里云基礎(chǔ)模型團(tuán)隊(duì)迅速做出戰(zhàn)略調(diào)整,將更多資源與精力向提升模型推理能力方向傾斜。不僅如此,在模型競(jìng)品對(duì)標(biāo)方面,2024年下半年阿里云基礎(chǔ)模型團(tuán)隊(duì)主要對(duì)標(biāo)OpenAI的o1,而如今,DeepSeek-R1也已成為其重要的對(duì)標(biāo)模型之一。?

由于阿里推行模型開(kāi)源策略,基于Qwen開(kāi)源模型所衍生出的模型總量成為衡量模型影響力的關(guān)鍵指標(biāo)。截至目前,這一數(shù)據(jù)已突破10萬(wàn)大關(guān)。而在開(kāi)發(fā)者社區(qū)的受歡迎度方面,阿里綜合考量多個(gè)具體指標(biāo),其中開(kāi)源模型下載量便是重要參考之一。

2024年Qwen系列模型在開(kāi)發(fā)者社區(qū)的下載量累計(jì)超過(guò)2億次。有知情人士解釋道:“在開(kāi)發(fā)者社區(qū)中,一個(gè)模型的影響力主要體現(xiàn)在兩個(gè)方面,即下載量和衍生模型數(shù)。開(kāi)發(fā)者基于下載的開(kāi)源模型進(jìn)行微調(diào),生成新的衍生模型后,會(huì)重新上傳至開(kāi)發(fā)者社區(qū)。因此,這兩個(gè)維度能夠較為直觀地反映出一個(gè)開(kāi)源模型在開(kāi)發(fā)者群體中的人氣高低?!?/p>

「93913原創(chuàng)內(nèi)容,轉(zhuǎn)載請(qǐng)注明出處」