
6月27日,騰訊混元宣布開源首個(gè)混合推理MoE模型Hunyuan-A13B,總參數(shù)80B,激活參數(shù)僅13B。這一創(chuàng)新模型在性能表現(xiàn)上令人矚目,效果比肩同等架構(gòu)領(lǐng)先開源模型,同時(shí)推理速度更快,性價(jià)比更高,為開發(fā)者帶來了更具優(yōu)勢的選擇,顯著降低了獲取優(yōu)質(zhì)模型能力的門檻。?
即日起,開發(fā)者便可在Github和Huggingface等開源社區(qū)便捷地獲取該模型。與此同時(shí),模型API也在騰訊云官網(wǎng)正式上線,全面支持快速接入部署,極大地便利了開發(fā)者將其應(yīng)用于各類項(xiàng)目中。?
值得一提的是,Hunyuan-A13B是業(yè)界首個(gè)13B級別的MoE開源混合推理模型?;谙冗M(jìn)的模型架構(gòu),它展現(xiàn)出了極為強(qiáng)大的通用能力,在多個(gè)業(yè)內(nèi)權(quán)威數(shù)據(jù)測試集上成績斐然,尤其在Agent工具調(diào)用和長文處理能力方面表現(xiàn)突出。在實(shí)際應(yīng)用場景中,該模型為用戶提供了靈活的思考模式選擇。快思考模式能夠提供簡潔、高效的輸出,適用于那些追求速度和最小計(jì)算開銷的簡單任務(wù);而慢思考模式則涉及更深層次、更全面的推理步驟,比如反思和回溯等過程,對于復(fù)雜任務(wù)的處理更為擅長。這種獨(dú)特的融合推理模式對計(jì)算資源分配進(jìn)行了優(yōu)化,用戶能夠通過“think/no_think”輕松切換思考模式,從而在效率和特定任務(wù)準(zhǔn)確性之間找到最佳平衡。?
對于當(dāng)下熱門的大模型Agent能力,騰訊混元構(gòu)建了一套多Agent數(shù)據(jù)合成框架。該框架接入了MCP、沙箱、大語言模型模擬等多樣的環(huán)境,并借助強(qiáng)化學(xué)習(xí),讓Agent在多種環(huán)境中進(jìn)行自主探索與學(xué)習(xí),進(jìn)一步增強(qiáng)了Hunyuan-A13B的性能表現(xiàn)。在長文處理方面,Hunyuan-A13B支持256K原生上下文窗口,在多個(gè)長文數(shù)據(jù)集中脫穎而出,取得了優(yōu)異的成績。?
Hunyuan-A13B模型對個(gè)人開發(fā)者十分友好,在較為嚴(yán)格的條件下,僅需1張中低端GPU卡即可完成部署。目前,它已成功融入開源主流推理框架生態(tài),能夠無損支持多種量化格式。在相同輸入輸出規(guī)模的情況下,整體吞吐能力是前沿開源模型的2倍以上。?
Hunyuan-A13B集成了騰訊混元在模型預(yù)訓(xùn)練、后訓(xùn)練等多個(gè)環(huán)節(jié)的創(chuàng)新技術(shù),這些技術(shù)協(xié)同作用,顯著增強(qiáng)了模型的推理性能、靈活性和推理效率。在預(yù)訓(xùn)練環(huán)節(jié),Hunyuan-A13B訓(xùn)練了20Ttokens的語料,涵蓋多個(gè)領(lǐng)域,高質(zhì)量的語料為提升模型通用能力奠定了堅(jiān)實(shí)基礎(chǔ)。此外,騰訊混元團(tuán)隊(duì)通過系統(tǒng)性分析、建模與驗(yàn)證,構(gòu)建了適用于MoE架構(gòu)的ScalingLaw聯(lián)合公式。這一成果不僅完善了MoE架構(gòu)的ScalingLaw理論體系,更為MoE架構(gòu)設(shè)計(jì)提供了可量化的工程化指導(dǎo),有力地提升了模型預(yù)訓(xùn)練的效果。在后訓(xùn)練環(huán)節(jié),Hunyuan-A13B采用多階段的訓(xùn)練方式,有效提升了模型的推理能力,同時(shí)兼顧了模型在創(chuàng)作、理解、Agent等方面的通用能力。?
不僅如此,騰訊混元還在此次開源中推出了兩個(gè)新數(shù)據(jù)集——ArtifactsBench和C3-Bench,旨在填補(bǔ)行業(yè)內(nèi)相關(guān)評估標(biāo)準(zhǔn)的空白。其中,ArtifactsBench用于彌合大語言模型代碼生成評估中的視覺與交互鴻溝,構(gòu)建了一個(gè)包含1825個(gè)任務(wù)的新基準(zhǔn),涵蓋從網(wǎng)頁開發(fā)、數(shù)據(jù)可視化到交互式游戲等九大領(lǐng)域,并按難度分級,能夠全面評估模型的能力;C3-Bench則針對Agent場景模型面臨的三個(gè)關(guān)鍵挑戰(zhàn),即規(guī)劃復(fù)雜的工具關(guān)系、處理關(guān)鍵的隱藏信息以及動態(tài)路徑?jīng)Q策,設(shè)計(jì)了1024條測試數(shù)據(jù),有助于精準(zhǔn)發(fā)現(xiàn)模型能力的不足之處。








