阿里巴巴開源最強(qiáng)編程模型Qwen3-Coder-480B-A35B-Instruct

?? 由 文心大模型 生成的文章摘要

7月23日,阿里巴巴Qwen團(tuán)隊(duì)有了大動作,開源了其最新一代旗艦編程模型Qwen3-Coder-480B-A35B-Instruct。Qwen團(tuán)隊(duì)表示,這是他們目前最強(qiáng)大的開源智能體編程模型。其擁有480B參數(shù),激活參數(shù)為35B,原生支持256K上下文,并且通過外推的方式,能夠?qū)⑸舷挛臄U(kuò)展至100萬(輸入),最大輸出可達(dá)6.5萬token。?

在基準(zhǔn)測試中,Qwen3-Coder在編程和智能體任務(wù)方面展現(xiàn)出了卓越的性能。在AgenticCoding(智能體編程)、AgenticBrowser-Use(智能體瀏覽器使用)和AgenticTool-Use(智能體工具調(diào)用)這三類任務(wù)中,Qwen3-Coder成績優(yōu)異,達(dá)到了開源模型中的最優(yōu)水平,超越了Kimi K2、DeepSeekV3等開源模型,甚至比GPT-4.1等閉源模型表現(xiàn)得還要出色,能與以編程能力聞名的ClaudeSonnet4模型一較高下。?

Qwen3-Coder將推出多種尺寸,此次開源的是其最強(qiáng)大的變體。它的參數(shù)量超過了阿里旗艦?zāi)P蚎wen3的235B(2350億),不過小于Kimi K2的1T(1萬億)。據(jù)阿里官方介紹,借助Qwen3-Coder,剛?cè)胄械某绦騿T一天就能完成資深程序員一周的工作,生成一個(gè)品牌官網(wǎng)最快只需5分鐘。?

除了模型本身,Qwen還開源了一個(gè)基于GeminiCode分叉而來的智能體編程命令行工具——QwenCode。這個(gè)工具進(jìn)行了定制提示和函數(shù)調(diào)用協(xié)議的適配,能讓Qwen3-Coder在智能體編程任務(wù)上的能力得到更充分的發(fā)揮。?

目前,這一模型已在阿里云旗下大模型服務(wù)平臺百煉上線,其API采用階梯計(jì)費(fèi)方式,根據(jù)輸入token量調(diào)整價(jià)格。在256K-1M這一檔,輸入價(jià)格為6美元/百萬token,輸出價(jià)格為60美元/百萬token。與之對比,ClaudeSonnet4的輸入輸出價(jià)格分別為3美元/百萬token、15美元/百萬token,與Qwen3-Coder128k-256k一檔的價(jià)格相同。?

「93913原創(chuàng)內(nèi)容,轉(zhuǎn)載請注明出處」